Frågor och svar om röjandeskyddet Cell Key Method (CKM)

Här redovisas vanliga frågor och svar om det röjandeskydd som införs i den individbaserad statistiken på SCB.

Varför införs röjandeskyddet?

SCB är skyldig att skydda enskildas uppgifter från att röjas i den redovisade statistiken. Röjandeskyddet införs för att säkerställa att sekretessbelagda uppgifter inte röjs. Enligt offentlighets- och sekretess­lagen får det inte via statistiken vara möjligt att identifiera en enskild (individ, hushåll, företag), eller avslöja något om dennes personliga eller ekonomiska förhållanden.

CKM möjliggör att redovisa små grupper utan att behöva undertrycka vissa värden och totaler. På så sätt får användarna mer heltäckande statistiska resultat. Metoden innebär att statistiken tillförs slumpmässig osäkerhet på ett kontrollerat sätt, utan att bidra med systematisk skevhet i statistiken.

I vilka undersökningar kommer röjandeskyddet att införas?

SCB har beslutat att all registerbaserad totalräknad individstatistik ska utreda möjligheten att använda CKM som röjandekontrollmetod.

Du kan läsa mer om införandet här: Utveckling av röjandeskyddet

Kommer även andra myndigheter i Sverige införa röjandeskyddet?

Införandebeslutet gäller bara SCB. Det är ett internt beslut men metoden är möjlig att använda även för andra.

Vad innebär röjandeskyddet?

Röjandeskyddet innebär att en liten och kontrollerad slumpmässig osäkerhet automatiskt tillförs de statistikvärden som är frekvenser. Frekvenser som är större än noll justeras med ett litet negativt eller positivt heltal, eller lämnas oförändrade. Detta gäller även alla totaler. Justeringen väljs slumpmässigt från talen -3, -2, -1, 0, 1, 2 och 3.

Metoden gör det möjligt att redovisa detaljerad statistik utan att behöva dölja statistikvärden (pricka), eller göra delar av redovisningen mindre detaljerad (aggregera). I de allra flesta fall är den osäkerhet som tillförs marginell i förhållande till övriga osäkerhetskällor i statistiken och påverkar inte det statistiska informationsvärdet.

Den osäkerhet som tillförs påverkar att redovisade delar inte alltid summerar till totalen. Läs mer om detta nedan under rubriken ”Varför summerar inte redovisade delar till totalen?”. 

Du kan även läsa mer om CKM här: Skyddsmetoder för röjandekontroll

Varför summerar inte redovisade delar till totalen?

CKM tillför en liten osäkerhet till varje statistikvärde var för sig, även totalerna. En följd av detta är att de redovisade totalerna i en frekvens­tabell som innehåller röjandeskyddade statistikvärden inte alltid är lika med summan av deras redovisade delar. Till exempel överensstämmer inte nödvändigtvis den redovisade totalen för kvinnor och män med summan av de redovisade statistikvärdena för kvinnor respektive män.

Blir inte statistiken missvisande när röjandeskyddet är tillagt i tabellerna?

Bedömningen är att det lilla bruset som tillförs inte förvanskar statistiken. De register som ligger till grund för statistiken har osäkerhetskällor som gör att inte heller statistik utan röjandekontroll är en total sanning i förhållande till verkligheten. Mer information om osäkerhetskällor i Registret över totalbefolkningen (RTB) finns här: 
Det statistiska registrets framställning och kvalitet - Registret över totalbefolkningen (RTB) 2025

Betyder brus, osäkerhet och justering samma sak?

Ibland används ordet brus, men osäkerhet eller justering är samma sak.

Kan jag göra egna summeringar av statistikvärden som redovisas?

Det går att göra egna summeringar men det finns en risk att den nya totalen innehåller större osäkerhet än vad som, enligt metoden, skulle ha tillförts det enskilda statistikvärdet. Det beror på att även osäker­heten adderas när röjandeskyddade statistikvärden summeras.

Den som väljer att göra egna summeringar bör ta hänsyn till att osäker­heten som tillförs genom CKM tillförs samtliga statistikvärden. Statistikvärden som är större än noll justeras med ett litet negativt eller positivt heltal, eller lämnas oförändrade. Det gäller även alla totaler. Ur ett teoretiskt perspektiv så minskar man risken att få en adderad osäkerhet om man summerar så få tal som möjligt.

Exempel: Om åldersgruppen 0–5 ska beräknas så är det bästa att summera gruppen 0–4 och gruppen 5-åringar. Den summeringen leder till färre summeringar än om åldersklasserna 0+1+2+3+4+5 summeras.

Hur kan jag räkna ut en procentuell fördelning när delarna inte summerar till totalen?

En konsekvens av röjandeskyddet är att en exakt procentuell fördelning inte går att beräkna utifrån redovisad statistik. Eftersom delarna inte alltid summerar till totalen så innebär det att den totala andelen inte alltid kommer att summera till 100 procent.

Varför måste alla siffror vara brusade där det inte finns någon röjanderisk? Skulle det inte räcka med att röjandeskydda små tal?

Att samtliga värden brusas innebär att vi får en stor flexibilitet när vi tar fram tabeller och att de kommer att bli konsistenta med varandra, det vill säga att de kommer att hänga ihop. Därför behöver samtliga värden vara brusade, även där det inte finns någon röjanderisk.

Metoden gör det möjligt att redovisa detaljerad statistik utan att behöva dölja statistikvärden (pricka), eller göra delar av redovisningen mindre detaljerad (aggregera). 

Metoden införs i hela statistiken. Detta för att möjliggöra att man alltid får fram samma resultat ifall att uppgifter tas fram på nytt eller med annan gruppering eller liknande. Metoden är skapad så att ett stort värde med stor sannolikhet förblir detsamma både före och efter att bruset har lagts på.

Innebär det här att vi framöver inte kommer att kunna beskriva exakt hur det ser ut i mindre grupper?

Det går att beskriva små grupper även fortsättningsvis. Men det är viktigt att komma ihåg att det är statistik som redovisas – inte exakta värden. Det finns inte något statistikvärde som är exakt rätt eller det sanna värdet. Som exempel kan nämnas att basregistret Registret över totalbefolkningen (RTB) innehåller både över- och underteckning, vilket vi vet sedan tidigare, och så har det alltid varit. Det innebär att statistiken redan är behäftad med fel. Kvaliteten på statistiken och dess olika felkällor finns redovisad i dokumentationen. Mer information om osäkerhetskällor i Registret över totalbefolkningen finns här: Det statistiska registrets framställning och kvalitet - Registret över totalbefolkningen (RTB) 2025

Hur kan man veta att statistiken är brusad med CKM-metoden?

Tabeller som innehåller statistik som brusats har en fotnot med information om att en liten kontrollerad slumpmässig osäkerhet är införd i samtliga redovisade uppgifter.

Kan CKM medföra att ett enskilt statistikvärde som redovisas i olika tabeller blivit brusat på olika sätt och således är olika?

Nej, varje statistikvärde som grundar sig på samma individer/­hushåll är samma i olika tabeller. Skyddet (bruset) skapas för varje statistikvärde och varje gång samma statistikvärde tas fram blir skyddet exakt likadant.

Den som väljer att göra egna summeringar av brusade statistikvärden bör vara medveten om att det finns en risk att den nya totalen innehåller större osäkerhet än vad som, enligt metoden, skulle ha tillförts det enskilda statistikvärdet. Det beror på att även osäkerheten adderas när röjandeskyddade statistikvärden summeras.

Kan man använda statistiken som tidigare?

Det är säkert att använda statistiken precis som tidigare.

Röjandeskyddet är en liten osäkerhet som införs över hela statistiken. Det går fortfarande att redovisa små grupper. CKM möjliggör att redovisa små grupper utan att behöva undertrycka vissa värden och totaler. På så sätt får användarna mer heltäckande statistiska resultat.