Utveckling av röjandeskyddet
Det finns ett flertal metoder som kan användas för att göra statistiken möjlig att redovisa utan att man röjer sekretessbelagda uppgifter. När man väljer metod för röjandekontroll behöver man ha såväl skyddsvärdet för individen som användarnas behov i åtanke. Skyddet utformas därför så att inte informationsvärdet i den redovisade statistiken minskar i onödan.
Införande av Cell Key Method (CKM) i individbaserad statistik
SCB har beslutat att all registerbaserad totalräknad individstatistik ska utreda möjligheten att använda CKM som röjandekontrollmetod. CKM är en röjandekontrollmetod för frekvenstabeller som bygger på totalräknade uppgifter. Metoden innebär att en liten och kontrollerad slumpmässig osäkerhet automatiskt tillförs statistikvärdena i samband med framställningen. Metoden gör det möjligt att redovisa detaljerad statistik utan att behöva dölja statistikvärden, eller göra delar av redovisningen mindre detaljerad.
SCB använder CKM i Befolkningens arbetsmarknadsstatus (BAS) som redovisades första gången i maj 2022. Metoden används också för den registerbaserade folk-och bostadsräkningen Census 2021, enligt rekommendationer från Eurostat, samt i relevanta delar av statistik över inkomster och skatter. Sedan redovisningen i april 2026 tillämpas CKM även på integrationsstatistiken och undersökningen Hushållens boende.
Befolkningsstatistiken började under 2025 att implementera CKM och arbetet slutförs under våren 2026, då samtlig statistik för produkten redovisas med röjandeskydd. Metoden kommer även att införas i SCB:s övriga produkter där det bedöms lämpligt. Införandet kommer att ske successivt under de kommande åren.
CKM har införts även i de delar av uppdragsverksamheten som rör individbaserad statistik.
Tidsplan
Följande anslagsprodukt utreds under 2026 och planeras införa CKM under 2027:
- Yrkesregistret med yrkesstatistik (januari)
Under 2026 utreds även ett eventuellt införande av CKM i följande produkter inom utbildningsstatistiken:
- Befolkningens utbildning
- Yrkeshögskolan
- Konst- och kulturutbildningar och vissa andra utbildningar
- Folkhögskolestatistik
- Studieförbundsstatistik
Så påverkas statistiken av införandet av CKM
Vid CKM tillförs statistiken en liten slumpmässig osäkerhet på ett kontrollerat sätt, utan att bidra med skevhet i statistiken. Det sker genom att statistikvärden som är större än noll justeras med ett litet negativt eller positivt heltal, eller lämnas oförändrade. Justeringen väljs slumpmässigt från talen -3, -2, -1, 0, 1, 2 och 3. Det gäller även alla totaler. En följd av metoden är att de redovisade totalerna inte alltid är lika med summan av deras redovisade delar. Till exempel överensstämmer inte nödvändigtvis den redovisade totalen för kvinnor och män med summan av de redovisade statistikvärdena för kvinnor respektive män. SCB bedömer att den osäkerhet som tillförs genom användning av metoden i de allra flesta fall är försumbar i relation till övriga osäkerhetskällor som påverkar statistiken.
Så påverkas tidsserier, API:er och sparade frågor
Framöver kommer många tabeller i Statistikdatabasen, SSD, att bygga på en ny tabellstruktur. Detta är en följd av att det blir fler bakomliggande deltabeller när CKM införs. Det leder till att det inte går att fortsätta uppdatera befintliga SSD-tabeller. Därför kommer det att finnas länkar till både den äldre och den nya versionen av samma SSD-tabell på webbplatsen. För att ta ut långa tidsserier krävs alltså uttag från två olika tabeller i SSD. Statistik som redan publicerats kommer inte att påverkas av införandet av CKM.
Alla gamla API-länkar i SSD kommer att fungera även framöver. För att få tillgång till den nya statistiken som laddas in i nya tabeller behöver dock användarna komplettera med ytterligare ett API-anrop, som är riktat mot den nya tabellen. Detsamma gäller för sparade frågor i SSD.
Bakgrund
SCB tillämpar idag ett antal olika metoder för röjandekontroll. En vanlig metod, främst inom företagsstatistiken men även delvis i den individbaserade statistiken, är undertryckning. Undertryckning innebär att celler med för hög röjanderisk döljs (primärundertryckning). Därefter döljs även andra celler (sekundärundertryckning) för att undvika att de primärundertryckta cellerna ska gå att härleda med hjälp av marginalerna. Om statistiken presenteras med många olika indelningar kan det krävas omfattande sekundärundertryckningar för att skydda ett litet antal primärundertryckta celler, vilket kan innebära en relativt stor informationsförlust. Det är en av anledningarna till att undertryckning nu ersätts med CKM i den individbaserade statistiken.
Relaterat
Kontakt
- E-post
- ckm@scb.se