På scb.se använder vi kakor (cookies) för att webbplatsen ska fungera på ett bra sätt för dig. Genom att surfa vidare godkänner du att vi använder kakor. Vad är kakor?

Publicerad: 2012-05-24
Nr 2012:6

Författare

Martin Ribe

är metod­statistiker på SCB.

010-479 48 54

martin.ribe@scb.se

En liten saga …

… kan lysa upp vad vi talar om. Ett land någonstans har två lika stora städer, nämligen Nere­stad vid havet och Uppe­stad på en högplatå. I Nere­stad bor de allra flesta i hög­hus och färre i låg­hus. I Uppe­stad är det tvärs om, de allra flesta bor i låg­hus och bara få i hög­hus. Paradoxalt nog gör det här att man bor högre över havet i låg­hus än i hög­hus, genomsnittligt över båda städerna. För hög­husen finns mest i Nere­stad, nere vid havet.

Statistikskolan:

Villande jämförelser

I statistiken är det ofta intressant att jämföra medelvärden mellan olika grupper. Till exempel kan man vilja jämföra och se vilka grupper som ligger högre eller lägre i medelinkomst. Lite villande är att slutsatserna ibland blir olika med olika sätt att jämföra. Men allt går ändå ihop.

Globen med en röd stuga på utsidan

När man jämför två grupper, kan man tycka att statistiken borde ge ett entydigt besked om vilken grupp som har högst genom­snittlig inkomst. Men ibland kan man få resultat som verkar paradoxalt motstridiga.

Titta på följande lilla tabell. Den visar medel­värden av årlig förvärvs­in­komst för personer i åldern 20-64 år under år 2009. I tabellen görs uppdelningar mellan offentlig och privat sektor, och mellan kvinnor och män. (Källa: In­komst‑ och taxerings­statistiken.)

På första raden i tabellen ser man att medel­in­komsten ligger högre i privat än i offentlig sektor. Detta gäller när man betraktar kvinnor och män till­sammans.

Tabell över medelinkomst per sektor och kön

Annorlunda blir det om man istället betraktar kvinnor och män var för sig. För på de följande raderna i tabellen ser man att då blir det tvärtom. Då plötsligt hamnar offentlig sektor över privat sektor i medel­in­komst. Och det gäller både för kvinnor och för män, när könen tas vart för sig.

Det här kan verka väldigt motstridigt, att siffrorna verkar ge motsatta besked om vilken sektor som har högst in­komst­läge. Man kunde i förstone kanske undra om det inte måste vara något fel i siffrorna. Men siffrorna stämmer, och paradoxen har en fullt naturlig förklaring. Den är ett exempel på vad som ibland kallas ”Simpsons paradox”, eller ”Yule-Simpson-effekten”.

Tabellen nedan visar antalet ­personer i grupperna. Man ser här att den offentliga och den privata sektorn är mycket olika varandra, när det gäller proportionerna mellan antalet kvinnor och antalet män. I den offentliga sektorn är kvinnorna i stor majoritet gentemot männen, medan i den privata sektorn omvänt männen är i stor majoritet gentemot kvinnorna.

Tabell och stapeldiagram över antal personer per sektor och kön

Här får gåtan sitt svar. Männen har högre medel­in­komst än kvinnorna, som framgår av den första tabellen. Detta drar upp medel­in­komsten i privat sektor, som har stor andel män, i förhållande till offentlig sektor med mindre andel män. Genom att skillnaderna mellan männens och kvinnornas in­komster är så stora som de är, så slår den effekten igenom. Medel­in­komsten hamnar därför högre i privat än i offentlig sektor, trots att det är tvärtom för kvinnor och män var för sig.

På sätt och vis är det själva matematiken som spelar ett spratt. Det är inte så svårt att se att siffrorna på medel­in­komst stämmer matematiskt med varandra. In­komst­siffrorna på översta raden i första tabellen, för kvinnor och män till­sammans, kan man räkna ut som så kallade vägda medel­värden av siffrorna på raderna under, för kvinnor och män var för sig. Man ”väger” då in­komst­talen med antalet kvinnor och män.

Uträkningen ser ut så här:

Formel för uträkning av "vägda" inkomsttal

Här återser vi talen som står på översta raden i den första tabellen. Den här uträkningen ger samma resultat som om man räknar ut medel­in­komsten på vanligt sätt direkt från hela sektorerna, med både kvinnor och män till­sammans.

Sensmoralen är denna: När man jämför medel­värden mellan grupper så måste man tänka på vissa saker. Dit hör inte minst att jämförelsen kan påverkas av om grupperna är olika samman­satta.

Vilken slutsats är då den rätta, kan man fråga sig. Är det offentlig eller privat sektor som man rätteligen kan säga har det högre in­komst­läget?

Det beror lite på vad man är ute efter, vilken fråga man vill ha svar på genom siffrorna. Ser man saken från arbets­givarens sida eller från samhällsekonomin som helhet och talar om kostnaderna för arbetskraften, så kan totalbilden för kvinnor och män tillsammans vara relevant. Ser man det däremot från in­komst­tagarnas sida är det kanske snarare relevant med jämförelsen av kvinnor och män var för sig.

Den privata sektorn ligger alltså under den offentliga i in­komster för könen vart för sig. Det kanske kan förvåna lite om man tänker på löneläget i dessa sektorer. Men in­komster och löner är olika saker, och det nämnda förhållandet är knappast så konstigt. För många i den privata sektorn är egna företagare med ofta låga in­komster.

Medianen är ett mått som ofta är ett lämpligt alternativ till det vanliga medel­värdet. Medianen kan ibland vara mera rättvisande. Men medianen kan bete sig på samma paradoxalt ”luriga” sätt som vi just såg i fråga om medel­värdet.

Konsument­prisindex (KPI) är ett tydligt exempel där det gäller att jämföra på rätt sätt. Där ska man jämföra prisläget på konsument­produkter över tiden, månad för månad. För att få en renodlad bild av hur prisläget utvecklas följer man då en korg av valda produkter och mäter hur dess prisläge utvecklas.

Annars är det numera tekniskt möjligt att få uppgifter om genom­snittliga priser på produkter som säljs i butikerna. För till exempel soffor kunde man följa medelpriser på sålda soffor, i stället för pris­lappar på valda modeller av soffor som vi gör i KPI. Haken är att utvecklingen av medelpriset per såld soffa inte skulle spegla prisutvecklingen renodlat, genom att förändringar i mixen av olika slags soffor skulle störa för mycket.

Löne­utvecklingen i ett yrke är ett ytterligare exempel på hur jämförelser kan vara villande. Även om ingen i yrkes­gruppen får sänkt reallön, så kan det ändå vara möjligt att den genom­snittliga real­lönen i gruppen som helhet sjunker över tiden.

Så kan det bli genom att yngre oerfarna kommer in med relativt låga löner, och samtidigt äldre erfarna slutar med relativt höga löner. En sådan personal­om­sättning drar ned löneläget. Ned­dragningen motverkas av de lönelyft som individerna får efter hand under sin karriär i yrket. Nettot för gruppen som helhet kan bli antingen sänkning, höjning eller oförändrat läge.

Schematisk bild över ett höghus och ett låghus och texten "En liten saga ..."

... kan lysa upp vad vi talar om. Ett land någonstans har två lika stora städer, Nerestad vid havet och Uppestad på en högplatå. I Nerestad bor de flesta i höghus och färre i låghus. I Uppestad är det tvärs om, de allra flesta bor i låghus och bara få i höghus. Paradoxalt nog gör det att man bor högre över havet i låghus än i höghus, genomsnittligt över båda städerna. För höghusen finns mest i Nerestad, nere vid havet.

Etiketter