Urvalsundersökningar

Samhället behöver statistik inom många olika områden. Men det är för dyrt och besvärligt att regelbundet samla in uppgifter om varenda person i Sverige. Det finns ett enklare sätt som ofta räcker bra – att använda ett urval.

Här går vi igenom:

Urvalsundersökningar
Slumpens betydelse

Att man kan göra pålitlig statistik med hjälp av urval kan verka som lite av trolleri. Man går ut till personerna i ett urval av befolkningen, kanske några tusen personer, och ställer vissa frågor om dem. Utifrån svaren kan man sedan räkna fram statistik som gäller för befolkningen som helhet.

För att undersökningen ska vara tillförlitlig behöver den göras på rätt sätt. Bland det viktigaste är att personerna som är med i undersökningen väljs slumpmässigt och med på förhand kända urvalssannolikheter. Ett exempel på urvalsdragning är att dra lotter ur en tombola. I praktiken dras urvalen för större undersökningar med hjälp av särskilda datorprogram.

Urvalet hjälper oss att se helheten

Idén med urvalsundersökningar är ganska enkel. Vi tar ett exempel: Du är intresserad av att få veta hur stor andel av alla ungdomar som använder internet varje dag. I ett sannolikhetsurval visar det sig att 85 procent av alla ungdomar gör det. Du kan då dra slutsatsen att också ungefär 85 procent av samtliga ungdomar i hela Sverige använder internet varje dag. På så sätt kan du ta fram statistik som gäller en grupp som helhet, trots att du bara har uppgifter från ett urval personer ur den gruppen.

Det är egentligen fantastiskt att det fungerar. Men det gör det – om bara de rätta villkoren är uppfyllda! Ett par av de viktigaste villkoren är att:

Urvalet ska vara slumpmässigt och med på förhand kända urvalssannolikheter.
Urvalet ska vara tillräckligt stort.

Slumpen har fasta vanor

Tänk dig ett stort lotteri där det är vinst på 10 procent av antalet lotter. När du drar en enstaka lott beror det på slumpens nycker om det blir en vinst- eller en nitlott. Resultatet går inte att förutsäga.

Men det blir annorlunda om du drar ett stort antal lotter, säg 1 000 lotter. Då visar det sig ganska säkert att du bland dessa 1 000 lotter får ungefär 10 procent vinster. Andelen vinster blir ungefär lika stor som i hela lotteriet, alltså 10 procent.
När slumpmomentet upprepas, genom att du drar ett stort antal lotter, händer alltså något märkligt – slumpen tappar en del av sin ökända nyckfullhet. Resultatet blir nu ganska pålitligt, i form av ungefär ett visst antal vinster. Fenomenet kallas de stora talens lag.

Går det att få grepp om slumpen?

Med 10 procent vinster på 1 000 lotter får du 100 vinster. Naturligtvis kan du inte vara säker på att det blir på pricken 100 vinster på de 1 000 lotterna, bara att det blir däromkring. Slumpens lagbundenhet är trots allt inte exakt. Men det går att få grepp om det problemet också.

Vi tänker oss att du gör om alltihop ett stort antal gånger. Du drar 1 000 lotter i ett stort lotteri med 10 procent vinstlotter och räknar antalet vinster på dessa lotter. Sen upprepar du den proceduren många gånger. Du ser då hur antalet vinster varierar från gång till gång. Första gången blir det kanske 94 vinster, andra gången 113 vinster, tredje gången 102, och så vidare. Då talar man om slumpmässig variation eller slumpvariation. I sina variationer håller sig antalet ändå troget ganska nära 100. Lagbundenheten visar sig alltså klart. Antalet gånger du får olika antal vinster kommer i det långa loppet att fördela sig på ett visst sätt.

I vårt exempel har fördelningen en topp kring 100 vinster. Det är alltså det mest sannolika antalet vinster, men det är ändå liten sannolikhet att det blir exakt 100 vinster. Ju mer ett tal avviker från 100, desto mindre sannolikt är det att antalet vinster blir just det talet. Som tur är behöver du inte alls dra massor av lotter i många omgångar för att komma fram till det, utan det går att räkna ut med hjälp av en sannolikhetskalkyl.

Från lotteri till urvalsundersökning

Tack vare slumpens trogna lagbundenhet kan ett sannolikhetsurval ge en god bild av hela befolkningen eller den grupp av befolkningen du vill undersöka. Men den slumpmässiga variationen gör att bilden blir lite osäker. Sannolikhetskalkylen är ett utmärkt verktyg för att belysa hur stor den osäkerheten är.