Brev sendt til Utdanningsdirektoratet 22. april 2022
LNU engasjerer seg i Utdanningsdirektoratets (Udir) arbeid med å utvikle nye eksamener. Gjennom offentlig brev, tilbakemeldinger på publiserte eksempeloppgaver og debattinnlegg har LNU gitt uttrykk for at mye av det som skjer med eksamensarbeidet, uroer oss på norskfagets vegne. Vi vil i dette åpne brevet i hovedsak kommentere tre tekster som på ulike måter er helt sentrale i eksamensutviklingsarbeidet. Den ene teksten er det nye rammeverket for eksamen, den andre er de ulike eksempelsettene for norskeksamen som er publisert til nå, og den siste er en rapport om sensorreliabilitet på skriftlig eksamen i videregående opplæring som ser ut til å ha blitt tillagt mye vekt. Vi ønsker også å kommentere det vi ser på som mangel på åpenhet i prosessen med å utvikle nye eksamener.
Rammeverk for eksamen
Udir samarbeider med ulike miljøer når de utvikler nye eksamener. For norskfagets del er det Skrivesenteret som er samarbeidspartner. Når Skrivesenteret lager forslag til nye eksamener, skal de blant annet forholde seg til nytt Rammeverk for eksamen. Rammeverket gjør rede for en rekke kvalitetskrav som må innfris. LNU mener vi trenger et slikt rammeverk, men det er behov for å revidere det. Et rammeverk må nødvendigvis være på et overordna nivå siden det er noe eksamensutviklere i alle fag skal forholde seg til. Men slik rammeverket er i dag, gir det så stramme føringer at fagenes egenart settes på spill. Et eksempel på disse stramme føringene er at rammeverket kommer med ei “sterk anbefaling” om at de nye eksamenssettene må inneholde minst tre oppgavetyper. Hovedargumentet er at dette i større grad enn tidligere skal gi eleven den forskriftsfesta retten til å vise kompetanse i så stor del av faget som mulig. Alle eksempelsett for norskeksamen som hittil er offentliggjort, viser at den sterke anbefalinga om minst tre oppgavetyper, tolkes av eksamensutviklerne som et krav. LNU mener imidlertid at det ikke er noen automatikk i at flere oppgavetyper gir eleven mulighet til å vise fagrelevant kompetanse så lenge rammene for eksamen er som de er. Som vi straks skal komme til, mener LNU tvert om at vi vil miste muligheten til å prøve elevene i sentrale norskfaglige kompetanser om norskeksamen ender opp med tre oppgavetyper som foreslått.
Vi legger merke til at Udir har definert rammeverket som dynamisk, noe som vil si at det skal kunne utvikles ut fra erfaringer. LNU mener de første eksempelsettene til ny norskeksamen avdekker behov for å utvikle rammeverket, og vi ber derfor Udir se på muligheten for å gjøre rammeverket romsligere slik at de ulike skolefagenes egenart blir tatt hensyn til i større grad enn tilfellet er nå.
Eksempelsettene for norskeksamen
For en grundigere redegjørelse av LNU sitt syn på eksempelsettene for norskeksamen enn det vi har plass til i dette brevet, viser vi til LNUs tilbakemelding på eksempeloppgavene i norsk skriftlig, vg3. I dette brevet nøyer vi oss med å understreke to av våre hovedpoeng. For det første ser vi at flere oppgavetyper nødvendigvis fører til at langsvarsoppgava slik som vi kjenner den, blir mindre omfattende. LNU mener det er avgjørende at eksamen har rammer for langsvaret som gjør det mulig for elevene å vise helt sentral norskfaglig kompetanse slik det er nedfelt i læreplanen i norsk og i overordna del. Det ser vi ikke er mulig ut fra eksempelsettene som er publisert til nå. For det andre er det flere problemer knytta til de ulike oppgavetypene som er ment å måle ulike norskfaglige kompetanser. Særlige problemer knytter det seg til oppgavetype 1. Det heter seg at dette er en oppgavetype som skal måle tekstforståelse. Elevene får derfor beskjed om at de i denne oppgava ikke vil bli vurdert ut fra tekststruktur. Dette er et kunstig skille som ikke passer for en skriftlig eksamen i norsk. En teksts evne til å formidle innhold er sterkt knytta til dens formside, tekststruktur inkludert. Oppgavetype 1 framstår altså ikke bare overflødig, den er også problematisk med tanke på norskfagets egenart.
Reliabilitetsrapporten
Den siste teksten LNU ønsker å trekke fram her er rapporten Sensorreliabilitet på skriftlig eksamen i videregående opplæring (Björnsson og Skar, 2021). Rapporten er skrevet på oppdrag fra Udir, og den ser ut til å legge sterke føringer for endringsforslagene for nye eksamener. Rapporten presenterer analyser av sensorsamsvar og -enighet på grunnlag av de foreløpige karakterene - før fellessensur - på skriftlig eksamen i videregående opplæring mellom 2015-2019. Et hovedfunn er at sensorreliabiliteten varierer mye, også mellom fag. Typisk har for eksempel matematikkfaget langt høyere samsvar og enighet blant sensorene enn språkfagene, norskfaget inkludert. Dette er neppe overraskende for noen. Samtidig viser rapporten at selv om norskfaget preges av mindre sensorenighet enn matematikkfaget, er enigheten verken fraværende eller dårlig dersom en legger til grunn målestokken som rapporten presenterer som mest brukbar (se s. 6 i rapporten om vekta kappa-verdier). Et annet hovedfunn i rapporten er at statistiske analyser viser at sensorene ikke klarer å skille mellom de seks kompetansenivåene som i dag utgjør karakterskalaen (karakterene 1-6). Vi kommer tilbake til dette funnet nedenfor.
Rapporten er et viktig kunnskapsbidrag i arbeidet med å forbedre eksamen, men den er ikke ment som et selvstendig kunnskapsgrunnlag for ny eksamens- og sensorordning. Til det er det altfor mye som er uklart og ikke undersøkt. Vi vet for eksempel ingenting om hvilke utslag det har hatt at tallgrunnlaget analysene baserer seg på, er de foreløpige karakterforslagene før fellessensur. Vi vet heller ingenting om hva et sterkere tolkningsfellesskap vil kunne ha å si for sensorenes bruk av karakterskalaen. Forfatterne bak rapporten konkluderer da også med at de “analysene som ble presentert her må derfor brukes som et grunnlag for videre granskning av både egenskapene til eksamenene i sin helhet, en granskning av oppgaver og oppgaveformater, samt analyse av samsvaret mellom læreplaner, undervisning og oppgaver på eksamen. Videre må det gjøres en bedre og grundigere analyse av sensorenes arbeid” (s. 39). I så måte er det oppsiktsvekkende hvordan både rammeverket for eksamen og et nylig publisert utkast til vurderingskriterier for norskeksamen for 10. trinn, må ses på som forhasta svar på hovedfunnene i rapporten.
Vi ser nemlig hvordan rammeverket kommuniserer et særlig behov for å være oppmerksom på reliabilitetskrav knytta til prøvesettene, og flere oppgavetyper og analytisk vurdering framheves som måtene å styrke sensorreliabiliteten på. Dette er omfattende endringer som offentligheten ikke har blitt invitert til å komme med synspunkter på. Vi ser også hvordan utkastet til vurderingskriterier til 10. trinn følger opp rapportens hovedfunn ved å foreslå færre kompetansenivåer enn de seks vi er kjent med å bruke i dag. Skal vi tro utkastet, legger Udir opp til analytisk vurdering med fire kompetansenivåer der hvert nivå scores med poeng. Dette representerer en fundamental endring av sensorordninga som LNU sterkt vil fraråde før vi har fått belyst hvilke konsekvenser dette vil kunne få for eksamensordninga som helhet.
Totalinntrykket vi sitter igjen med er at styrking av sensorreliabilitet har blitt prioritert i utviklinga av ny norskeksamen på bekostning av norskfagets egenart. Det bekymrer oss. LNU er selvsagt også opptatt av å forbedre eksamensordninga, og vi har foreslått andre virkemidler enn det som nå ser ut til å skje gjennom implementering av et rammeverk som gir lite handlingsrom for eksamensutviklerne. Som alternative virkemidler har vi foreslått obligatorisk sensorskolering, videreføring av oppmannsordninga og initiativ for å styrke lærernes tolkningsfellesskap.
Manglende åpenhet og veien videre
Til sist ønsker vi å rette oppmerksomheten mot det som for oss framstår som en prosess uten særlig offentlig hukommelse. Så vidt vi kan se er det ikke etablert et tilgjengelig arkiv hvor en kan få oversikt over det som er gjort underveis i prosessen med å utvikle nye eksamener. Tvert imot er vår erfaring at når nytt eksempelsett blir publisert, forsvinner det gamle. Presentasjoner av eksamenskonstrukt er plutselig gjort utilgjengelige på Udirs hjemmesider. Mulighetene for å komme med tilbakemeldinger på eksempelsettene har begrensa seg til enkle og anonyme Questback-undersøkelser på de digitale eksempelsettenes siste sider. Piloteringsrunder setter ikke andre spor enn de en må gjette seg til etter å ha funnet justeringer fra det ene eksempelsettet til det neste. Og illustrerende nok opplever vi også under utarbeidelsen av dette brevet, at utkastet til vurderingskriterier etter 10. trinn som vi har kommentert over, uten varsel og uten forklaring er gjort utilgjengelig på Udirs hjemmesider. (Vi tillater oss likevel å vise til utkastet i dette brevet, da det har vært publisert på Udirs hjemmesider.) Det er også uheldig at arbeidsgruppa bak det nye rammeverket for eksamen er ukjent. LNU opplever at dette til sammen gjør det svært vanskelig å innta en konstruktiv og kritisk posisjon til det beste for skolens eksamensordning.
Vi har stor forståelse for at en så omfattende endring av eksamen som Udir legger opp til, er en krevende prosess. Desto viktigere blir det at direktoratet gir seg selv muligheten til å lytte til innspill som tilfører prosessen flere perspektiver. Vi ber derfor Udir utnytte tidsvinduet som avlyst eksamen har gitt. En ny, god start vil være å offentliggjøre det rike arkivet som er opparbeidet så langt, og invitere til åpne høringsrunder i det videre arbeidet. LNU ser fram til å bidra konstruktivt til det beste for elevene, norskfaget og norskeksamen.
Med vennlig hilsen
Lennart Jølle Siv Sørås Valand
Styreleder i LNU Daglig leder i LNU