Utbildningsstatistik för forskning – Ny rapport från Vetenskapsrådet

Jan Hylén
Jan Hylén
10 minuters läsning
Photo by m. on Unsplash

Vetenskapsrådets utbildningsvetenskaplig kommitté tillsatte vintern 2023 en utredning om tillgång till statistik och infrastruktur för forskning inom utbildningsvetenskap. Utredningen skulle beskriva de register och datamängder som finns, bedöma kvaliteten i dessa och beskriva vilka behov av ytterligare data och infrastruktur som finns för att främja ytterligare forskning.
En del i uppdraget var också att göra en jämförelse med övriga nordiska länder. Utredningen omfattar alla utbildningsformer från förskola till universitet, har offentliggjorts och finns för nedladdning här. Sammanfattningen i denna artikel berör endast skola och högskola.

Tre nivåer av kvalitet

Slutrapport – Ladda ned genom att klicka på bilden

För att kunna bedöma kvaliteten i statistiken för utredaren in ett resonemang hämtat från en brittisk forskare som handlar om att förbereda data för att kunna använda den för forskning. Den mest basala nivån handlar om tillgänglighet: finns det någon data att använda, har man som forskare rätt att använda den, kan den bearbetas av datorer, osv? Nästa nivå handlar om trovärdighet: går det att lita på de siffror som finns inrapporterade, saknas värden, är inrapporteringen likadan från olika rapportörer, med mera? Den sista frågan handlar om relevans: är datamängden relevant för de frågeställningar jag vill besvara? Men den är inte aktuell för utredningen.

Nationella data inom skolsektorn

I utredningen konstateras att det sker en omfattande insamling av uppgifter från skolhuvudmännen av Skolverket och Statistiska Centralbyrån (SCB). Bara sådana uppgifter samlas in som innebär att myndigheterna kan genomföra sina uppgifter enligt lag – myndigheterna får inte samla uppgifter enbart för att ”det skulle vara intressant att veta…”. Det är uppgifter om barn och elever, exempelvis resultat på nationella prov, betyg och meritvärde. Men också bakgrundsdata som kön, födelseland, föräldrars födelseland och utbildningsnivå samt en del uppgifter om skolsituationen. Vidare samlas uppgifter om personalens ålder och kön, utbildningsnivå, behörighet, antalet år som lärare med mera. Slutligen även information om huvudmannens kostnader för utbildningsverksamheten.

Skolverket och SCB tillgängliggör all denna data i aggregerad form. Om forskare vill ha ut mikrodata, det vill säga data kopplade till enskilda personer, så måste de ansöka hos myndigheterna.

Skolverket publicerar årligen kvalitetsdeklarationer som beskriver vilka data som samlats in, hur detta skett, eventuella bortfall etc. De konstaterar genomgående att statistiken är av god kvalitet.

Lokala data inom skolsektorn

Det ingick i utredningen att beskriva om huvudmännen samlar in egna data och i så fall vilken kvalitet den har samt om data är inlåst i verksamhetssystem eller om huvudmännen har full tillgång till all data man genererar. Här konstateras att sannolikt samtliga huvudmän samlar in egna uppgifter utöver det som rapporteras vidare. Det gäller främst elevdata och kostnadsdata.

Intervjuerna stärker det intryck som nog många redan har, nämligen att många huvudmän har problem med att få full tillgång till sina egna data. Det kan krävas extra avgifter till systemleverantörer eller dyra konsulttimmar för att få ut den data man vill ha och i ett format som man kan bearbeta. Systemen pratar ofta inte med varandra och det krävs inte sällan mycket arbetstid för att göra siffror jämförbara och användbara.

Vad gäller kvaliteten i dessa data är huvudmännen ofta uppriktiga och menar att det är så många personer inblandade i att rapportera in uppgifterna och det sker så sällan, att kvaliteten nog blir lidande. Samma slutsats kom ett forskningsprojekt fram till nyligen. Där konstateras att huvudmännens data är utspridda på flera system, att man inte hade full kontroll över data, att systemen inte var uppbyggda för dataexport, men också att huvudmännen ofta saknade kompetens att själva hantera sin data. Datakvaliteten är ofta låg, vilket yttrade sig i form av saknade data, felaktiga data eller alltför få data.

Brister i lokal och nationell skolstatistik

De brister som fastställts i lokala data återfinns sannolikt även i nationell data. Det är många olika personer inblandade hos varje huvudman som ibland saknar relevant utbildning, eller insikt om hur uppgifterna de rapporterar in ska användas. Med många personer inblandade kan tolkningar av begrepp och därmed inrapportering av data skilja sig åt, trots tydliga definitioner. Den bristande trovärdighet som återfinns i lokala data finns sannolikt till viss del även i nationell data.

I intervjuer med forskare framkommer att tillgängligheten ibland brister. All statistik som Skolverket och SCB publiceras finns tillgänglig i flera dataformat som kan laddas ned och bearbetas. Men det är inte alltid enkelt att veta vilka uppgifter som finns och var. Vissa menar att måste veta vad man letar efter för att kunna hitta det. Därmed brister tillgängligheten på grund av bristande överskådlighet.

Data inom högskolesektorn

Högskolan samlar in ungefär samma typ av uppgifter om studenter, lärare och kostnader som inom skolsektorn. Eftersom det är betydligt färre högskolor än huvudmän inom skolan och personalen vanligen bättre insatta i insamling och rapportering av data, så kan man anta att kvaliteten är bättre.

Detsamma gäller sannolikt den lokala högskolestatistiken. Men även här finns vissa brister att påtala. En är att eftersom högskolorna inte har några gemensamma examinationsformer så kan man inte jämföra kvaliteten eller effektiviteten mellan lärosätena. Det går inte att veta om en lärare, jurist eller sjuksköterska från Umeå universitet är bättre än en från Lund, eller om utbildningen bedrivs mer effektivt. Inte heller tycks lärosätena vara speciellt villiga att lämna ut egna data till forskare. Högskolan tycks både ovan och obenägen att vara forskningsobjekt.

Danmark föredöme

Den nordiska jämförelsen visar att det råder stora likheter i vilka uppgifter som samlas in och hur insamlingen går till. Möjligen är överblickbarheten bättre i Danmark, Finland och Norge – det verkar enklare att veta vilken statistik som samlas in och hur man kan hitta den. Danmark är ett föredöme genom att ha en tydlig manual för vilka data som samlas in, hur de relaterar till varandra och var man kan hitta data. Vidare har det danska utbildningsdepartementet ställt krav på leverantörerna av studieadministrativa system till skolor att staten ska ha rätt att automatiskt hämta in data från deras system med korta mellanrum. Därmed kan man hämta in uppgifter om schemaläggning, administration och pedagogiska tjänster. Dessa datakällor gör det möjligt att koppla samman elever i grupper, se vad grupperna undervisas i och vem som undervisar. Det innebär att kan man få en närmare statistisk bild än någonsin tidigare av den undervisning som äger rum i danska grundskolor, vilket ger nya möjligheter att undersöka faktorer som påverkar betyg, vidareutbildning av lärare, avhopp från skolan osv.

För att detta ska bli möjligt krävs inte bara tydliga riktlinjer från staten utan också en betydligt mer generös tolkning av GDPR än vad svenska myndigheter gör. För forskningsändamål är den nya databasen en guldgruva.

Behov av data och infrastruktur

Utredningen syftade inte enbart till kartläggning utan också att beskriva behov både ifråga om ytterligare datamängder och infrastruktur. Det främsta önskemålet från forskarna är att ha tillgång till samma typ av undervisningsnära statistik som i Danmark. Det kräver som sagt både tydligare riktlinjer från departementet samt en helt annan tolkning av GDPR. Vidare efterfrågas den typ av manual som Danmark tagit fram. Ett specifikt önskemål är att Sverige ska börja föra nationell statistik över elevers frånvaro, vilket inte sker idag. Likaså att fler uppgifter från de nationella proven ska publiceras, inte bara betygsresultaten. På högskolesidan efterfrågas möjligheter att jämföra kvalitet och effektivitet mellan olika lärosätens utbildningar.

På infrastruktursidan lyfts behov av fler register, olika åtgärder för bättre åtkomst till data från tidigare forskningsprojekt och tydligare regler för hur GDPR ska tolkas. Vidare vill man ha kompetensutveckling dels för forskare i kvantitativ metodik och databashantering, dels för skolpersonal i att samla in, lagra och bearbeta data.

Ett avslutande förslag är att bygga upp ett kvalitetsregister för skolan, motsvarande de som finns inom vårdsektorn. Detta för att man mer systematiskt och evidensbaserat ska kunna vidareutveckla skolans verksamhet.

Dela den här artikeln
Följ:
Jan Hylén är fil.dr i statsvetenskap och utbildningsanalytiker. Han verkar idag genom det egna bolaget Education Analytics som fristående analytiker, utredare och konsult åt myndigheter, kommuner, universitet, regeringar och internationella organisationer som OECD, UNESCO och EU.  Jan har även mångårig erfarenhet av forskning, tillämpning, utvärdering och utveckling inom utbildning, IT och digitala lärresurser inom såväl politik som offentlig förvaltning. Han har tidigare också arbetat på Skolverket och Utbildningsdepartementet och bistår kontinuerligt RISE med expertis inom området digitalisering, lärande och ledarskap.