På scb.se använder vi kakor (cookies) för att webbplatsen ska fungera på ett bra sätt för dig. Genom att surfa vidare godkänner du att vi använder kakor. Vad är kakor?

Publicerad: 2013-03-06
Nr 2013:13

Författare

Tor Bengtsson

arbetar med register­baserad statistik på SCB.

010-479 65 19

tor.bengtsson@scb.se

Stefan Berg

arbetar som metod­statistiker på SCB.

010-479 61 64

stefan.berg@scb.se

Statistikskolan:

Så påverkas statistiken av övertäckning

Register innehåller ofta personer som egentligen inte borde vara med, vi kallar dem över­täck­ning. Över­täck­ningens effekt på statistiken blir helt olika när vi gör statistik direkt från registren och när vi använder register som grund för urval­sunder­sök­ningar där man går ut och frågar.

Foto ur fågelperspektiv över människor som flanerar på en gågata

För att göra en statistisk undersökning behövs ett register över dem som ska undersökas, till exempel företag eller individer. Denna förteckning brukar ofta kallas rampopulation eller urvalsram. Register används både som källa för statistiken och som urvalsram. Det är sällan rampopulationen helt överensstämmer med undersökningens ideala population, ofta kallad målpopulation, vilket ger oss ett täckningsfel. Man kan dela upp täckningsfelet i undertäckningsfel respektive övertäckningsfel.

Både över- och undertäckning försämrar kvaliteten i registren. Undertäckning innebär att det saknas objekt i registret, som borde finnas där. När det gäller statistik som baseras på folkbokföringsuppgifter handlar det om personer som borde vara folkbokförda men som av någon anledning inte är det. Omvänt avser övertäckning personer som förekommer i registren men inte borde göra det.

Övertäckning är troligen något vanligare än undertäckning, och kan exempelvis orsakas av personer som flyttar utomlands utan att anmäla det till folkbokföringen. Övertäckningen är normalt sett av liten betydelse när man redovisar statistiken för hela befolkningen, men kan få större konsekvenser för speciella redovisningsgrupper.

Den vanligaste orsaken till att en person tillhör övertäckningen är att personen lämnat landet. En indikation på att så har skett är när det helt saknas händelser i registren: personen saknar uppgifter om inkomst, har ingen sjukskrivning, gör inga flyttningar och så vidare.

Många register över personer i Sverige skapas genom att man utgår från den folkbokförda befolkningen i Registret över totalbefolkningen (RTB) och kompletterar med uppgifter från andra källor. Exempelvis hämtas uppgifter om sjukskrivning från Försäkringskassan och de som saknar uppgift antas inte vara sjukskrivna. På samma sätt hämtas uppgifter från flera andra administrativa register. Om man varaktigt, minst ett helt kalenderår, inte vistats i landet finns det rimligen inga uppgifter i dessa register.

Vi vet alltså att det finns viss övertäckning i registren, men hur påverkar det resultaten när vi gör statistik? Eftersom vi drar urval till intervju- och enkätundersökningar ur register så borde både den statistik som görs med hjälp av uppgifter direkt från register och den statistik vi gör genom att ställa frågor, vara berörd.

Anta att vi vill skatta en andel, exempelvis andelen förvärvsarbetande, som kan tas fram utifrån uppgifter om till exempel inkomst från Skatteverket. Som en konsekvens av övertäckningen kommer andelen förvärvsarbetande att underskattas något till följd av att nämnaren, befolkningen, är för stor. Antalet förvärvsarbetande påverkas inte, eftersom det inte finns några registeruppgifter som säger att personerna är förvärvsarbetande, medan däremot gruppen som inte varit förvärvsarbetande blir överskattad med övertäckningens storlek.

För en urvalsundersökning ställs motsvarande fråga om sysselsättning direkt. Om det register vi drar urvalet ifrån innehåller övertäckning innebär det även att urvalet sannolikt kommer att innehålla personer som tillhör övertäckningen. Eftersom dessa per definition inte finns kvar i landet kommer de med största sannolikhet att bli bortfall.

Utifrån de svarande gör man sedan en uppräkning som tar hänsyn till skillnader mellan gruppen som svarat och de som inte svarat. Summan av de som angett att de varit sysselsatta respektive ej sysselsatta blir lika med befolkningen, som vi hämtat från registret.

Övertäckningen kommer alltså att fördelas i princip proportionellt mot de sysselsatta/ej sysselsatta och inte påverka andelsskattningarna. Däremot kommer antalsuppgifterna att överskattas, eftersom vi antagit att några personer som aldrig borde varit med i undersökningen antingen är sysselsatta eller ej sysselsatta.

I den mån det förekommer övertäckning i ett register kommer den alltså att påverka resultaten på olika sätt beroende på om registret används för att dra urval till en undersökning eller som statistikkälla.

Felen blir, som redan konstaterats, små om man ser till hela befolkningen. Statistiken för en specifik grupp kan dock påverkas mer. Beräkningar från 1990-talet visade att övertäckningen bland utomnordiska invandrare låg i intervallet 25 000–50 000 personer, vilket motsvarade 4–8 procent av de utomnordiska invandrarna. En mätning av andelen förvärvsarbetande i denna grupp leder till att skattningen blir cirka 4 procentenheter lägre i den registerbaserade undersökningen. I urvalsundersökningen blir antalet sysselsatta istället cirka 35 000 personer högre än om registret vore perfekt. Båda uppgifterna bygger på att vi antagit att övertäckningen är 50 000 personer.

Mycket talar för att övertäckningen snarare ökat än minskat under 2000-talet, men oklart till vilken nivå.

Man skulle kunna tänka sig att justera registren för övertäckning men det finns mycket som talar mot en sådan åtgärd. Det finns ingen säker metodik för att beräkna storleken på övertäckningen, än mindre att avgöra vilka enskilda individer som utgör övertäckningen. Regelverket kring folkbokföringen är omfattande och medför att det krävs mycket goda incitament för att avföra någon ur befolkningen.

Väljer man att justera statistiken kommer det att förekomma flera olika antalsuppgifter för exempelvis befolkningens storlek, vilket bland annat kommer att försvåra jämförbarheten med annan statistik. De utredningar som gjorts tyder på att övertäckningen i de allra flesta fall inte påverkar kvaliteten i statistiken, men att den kan ha betydelse när statistiken avser mindre redovisningsgrupper såsom grupper av utrikes födda. När statistiken tolkas bör man vara uppmärksam på denna felkälla på samma sätt som man bör beakta andra felkällor som inverkar på vilka slutsatser som kan dras från statistiken.

Etiketter