Till innehåll på sidan

Examensarbete inom statistik; maskininlärning och textanalys till SCB

Plats: Stockholms län
Referensnummer: SCB2025/424

Är du handlingskraftig, samhällsintresserad och nyfiken på att lära dig nya saker kommer du förmodligen att trivas på SCB. Vi är landets största och främsta kunskapskälla inom statistik och följaktligen en mycket lärorik arbetsplats. Vårt arbete är viktigt på riktigt. Välkommen till en öppen och prestigelös arbetsplats med hjälpsamma kollegor!

Kika in på scb.se/jobb och få reda på mer om oss!

Bakgrund

Företag kan rapportera sin årsredovisning i ett digitalt och strukturerat format till Bolagsverket. Det är idag frivilligt att skicka in årsredovisningen digitalt, men många företag väljer att göra det. Under 2024 kom drygt 50 % av årsredovisningarna för aktiebolag in digitalt. I DIÅR-registret (register över digitala årsredovisningar) har SCB tillgång till samtliga årsredovisningar som skickas in till Bolagsverket. Årsredovisningarna är såväl strukturerade, i form av databastabeller, som ostrukturerade i form av bildfiler.

Enligt årsredovisningslagen ska företag bland annat upplysa om hur företaget ägs i årsredovisningen och i vissa fall även upplysa om eventuella dotterbolag. SCB vill i det här examensarbetet undersöka hur maskininlärning och textanalys kan användas för att extrahera uppgifter om ägandeförhållanden ur DIÅR-registret. 

Syfte 

Uppdraget omfattar ett examensarbete på masternivå, vilket i normalfallet innebär en termins arbete. Uppdragets huvudsakliga uppgift är utforskande arbete avseende möjligheterna att använda uppgifter ur DIÅR-registret för att extrahera ägandeförhållanden. Detta examensarbete avgränsas till analys av strukturerade årsredovisningsdata.

Arbetes innehåll

  • Ta fram en problemformulering samt beskriva informationsbehov och kvalitetskrav
  • Beskriva och analysera dataunderlaget
  • Beskriva, träna och utvärdera möjliga modeller och deras egenskaper
  • Föreslå modellval för fortsatt arbete
  • Arbetet genomförs med stöd av SCB:s process för maskininlärning

Metod

I arbetet används statistiska metoder, textanalys och maskininlärning.

Om dig

Vi vill att du har:

  • intresse av samhällsfrågor och en vilja att utveckla SCB:s förmåga inom maskininlärning och textanalys,
  • förmågan att självständigt driva ditt arbete framåt,
  • goda kunskaper i programmering, främst i R och/eller Python,
  • god förmåga att uttrycka dig i tal och skrift, både på svenska och engelska,
  • goda kunskaper inom textanalys och maskininlärning

    och att du håller på att avsluta en högskoleutbildning inom statistik eller annan för examensarbetet relevant utbildning.

Meriterande är om du även har:

  • erfarenhet av arbete i SAS.    

För att det här ska bli en bra matchning för både dig och oss behöver du ha god problemlösande analysförmåga. Du måste själv kunna strukturera ditt arbete och driva det framåt. Du tycker samtidigt om att samarbeta, både med kollegor med samma kompetens som du och med kollegor från andra discipliner.

Mer information

Koncernspråk inom SCB är svenska och alla våra styrande dokument och de flesta rapporter är skrivna på svenska. Examensuppsatsen kan skrivas på engelska.

Omfattningen på uppsatsen är 30 hp.

Arbetet kan utföras antingen i Solna eller i Örebro. Resor till båda orterna kan bli aktuellt.

Vid frågor kontakta Kristina Strandberg, 0720844034.

Ansökan

Examensarbetet planeras att genomföras höstterminen 2025.

Sist ansökningsdag 25-06-02.

Diarienummer: SCB2025/424.

Din ansökan ska innehålla:

  • CV inklusive utdrag över relevanta kurser för examensarbetet. 

Ett personligt brev per student med:

  • En presentation av dig själv.
  • En beskrivning av din utbildning och kompetenser. 

Varmt välkommen med din ansökan!