Innsikt

Jussens digitale skattkammer

GULL VERDT: Digitale bibliotek er blitt verdifulle i stordatarevolusjonen. Jussens data – lover, forskrifter, rettsavgjørelser, lovkommentarer og andre rettskilder – er nøkkelen til å utvikle en juridisk kunstig intelligens. Foto: Istock

Stordatarevolusjonen er kommet til juss. Uten juridiske data, ingen juridisk kunstig intelligens. Når maskiner lærer å lese lover og dommer, starter kampen om jussens data.

I 1737 bad den dansk-norske kong Kristian 6. sin hoffprest Erik Pontoppidan skrive en lærebok i lesning. To hundre og femti år etter at Sandhed til Gudfrygtighed ble publisert første gang, kan nesten hver eneste sjel i kongeriket lese. Nå er turen kommet til en ny gruppe analfabeter: maskinene.

Det er muligens søkt å sammenligne leseundervisning med maskinlæring, med det er faktisk et ganske presist bilde på dagens tekniske revolusjon. Mens du leser dette, lærer verdens maskiner å lese. Forskjellen på dem og oss er at de kan lese latterlig mye mer og aldri stoppe.

Snart leser de også juss. Det kan bli en flodbølge for dagens Juss-Norge.

Supersekretærer og algoritmedomstol

Hva betyr det for jussen at maskiner endelig er i stand til å håndtere juridiske stordata?

Første konsekvens er at det utvikles en form for superadvokatsekretærer. De kan lete gjennom enorme mengder informasjon ekstremt raskt og finne relevante sammenhenger. På sikt kan disse «sekretærene» lære å se sammenhenger og trekke slutninger. Til slutt kan de også gi råd og ta beslutninger og fungere som en form for digitale dommere, advokater eller byråkrater. En kunstig intelligent jurist vil kunne gå gjennom millioner av aktuelle lover og rettskilder, som lignende eller relevante dommer, søknader og vedtak.

Vi har allerede sett begynnelsen i form av den amerikanske advokatteknologien «Ross». Ross kan gjennomgå titusenvis av lovtekster og dommer for å finne frem til de rettsavgjørelser en advokat trenger i en gitt sak. «Lillesøsteren» Eva går «kun» gjennom rettsavgjørelser.

Oppgaver som før krevde en jurist, automatiseres. Nettbutikken Ebay har utviklet en automatisert meklingsmekanisme, som brukes av over 60 millioner kunder hvert år. Kunstig intelligens klarte å forutsi rett utfall i tre av fire saker i Menneskerettighetsdomstolen i Strasbourg. Neste skritt kan være å ta dommeravgjørelser – i alle fall i enklere saker. I Norge finnes det en forsmak på digitaliseringens effekt i form av nye selskaper som LIGL, som har laget en automatløsning for å opprette aksjeselskaper, eller innslag i tradisjonelle firma som Haavind, som har laget en «konkursrobot». Huseiernes Landsforbund har fått roboten «Lucy» til å svare på enkle juridiske spørsmål fra medlemmene, mens Lexolve er en av de norske tjenestene som tilbyr kontraktgeneratorer.

Chatbot-advokatene

Chatbot-advokater kan det fort bli flere av. På årets «digital gründer-dugnad» for advokatbransjen vant en idé om en automatrådgiver som kan svare borgere som har spørsmål innen utlendingsrett og spørsmål til UDI.

Firmaet Simplifai, som leverer chatboter og kunstig intelligens for arbeidsplasser, sa i høst til Juristen at juridisk sektor endelig har blitt et marked.

– Det har vært en veldig konservativ bransje, som nå begynner å åpne seg litt mer for ny utvikling, sa Bård Myrstad.

Superlegen Watson vs. dommer Watson

Men chatboten, en slags form for snakkende hjemmeside, er antakelig bare første stopp.

Det IBMs kunstige intelligens «Watson» har gjort innen medisin, kan gi en pekepinn om hva kunstig intelligens kan gjøre innen juss. Watson har blitt en slags «superlege» via medisinske leksikon, ordbøker og databaser. Nå leser Watson daglig gjennom over 70 millioner sider ny og gammel kreftforskning i sekundet på mer enn ni språk. En kunstig intelligent lege kan på et øyeblikk gå gjennom millioner av kliniske caser og vurdere hvilken behandling som har virket best, og under hvilke betingelser. I en sammenligning med mennesker tok det Watson fire minutter å identifisere samme virkestoff som fire forskere hadde brukt et år på. Watson er dessuten ikke alene, også en norskbasert kunstig intelligens kalt Anzyz jobber med å «lese» helse etter å ha trent seg på 800 000 norske pasientjournaler.

Fordi lovgivning i stor grad er nasjonal, vil en «dommer Watson» og en «advokat Watson» i motsetning til kreftlege Watson både måtte lære alle språk lover finnes på, og tolke teksten ulikt for hvert land avhengig av loven i landet.

De kommende superjuristene trenger uansett en Pontoppidan, en lærebok, for å lære å «lese». Eller bedre forklart: De trenger et helt bibliotek – av data. Og en juridisk skolert kunstig intelligens trenger et bibliotek av juridiske data.

Åpne data: værdata

Data er altså alfa og omega. Et hverdagslig eksempel på stordatabruk er værvarslingstjenesten Yr. Yr lages av værdata fra Meteorologisk institutt: tusenvis av målinger av regn, vind og andre faktorer.

Meteorologisk institutts data er åpne. Åpne data defineres av at de gis bort gratis, kan lastes ned enkelt og kommer uten begrensinger på bruken, som «bare til forskning» eller «bare til undervisning», «kun i Norge» eller «ingen kommersiell bruk» (se oversikt).

Hvem som helst kan lage en ny app for værvarsling eller bruke rådataene som lager Yr, til å legge inn værvarsling i et system som styrer gardinene på et bygg, vaktlistene for et firma som er var for oversvømmelse, markedsføringsplanene i et iskremfirma eller digitale turplanleggere for fjell- og skiturer.

Lukkede data: pasientjournaler

Andre data er lukket. Pasientjournaler er lukket av hensyn til personvern, mens for eksempel Telenors og Telias data over hvem som har ringt hvem, eller hvor mye internett kundene bruker, holdes lukket av enten personvern- eller forretningshensyn.

Google, Facebook, Amazon og Apple sitter på enorme mengder private data, som de blant annet bruker til å selge annonser, produkter og tjenester og utvikle nye tjenester.

At maskinene nå kan tolke store mengder data, kan snu opp ned på maktforholdene i mange bransjer.

Netflix er et godt eksempel fra filmens verden: Først kjøpte de andres filmer og solgte fremvisningen. Så fikk de data om hva folk likte å se, og laget mer av det samme og ble filmprodusenter.

I teorien er ikke lenger en brusprodusent nødvendigvis den beste til å selge brus. Den beste til å selge brus er nå den som vet når folk blir brustørste. En bank som vet når folk trenger lån, har størst sjanse til å få lånt ut penger. Og kanskje er den beste advokaten i fremtiden hun som vet når du trenger en juridisk tjeneste.

Derfor er det makt i data.

Offentlig vs. privat

Foruten lukket og åpen kan datakildene være enten offentlige eller private. Offentlige data er definert som data «samlet inn av ansatte i en statlig virksomhet eller private data som er systematisert av offentlig ansatte». For eksempel gjelder det både værdata, kartdata, offentlige budsjetter og årsregnskaper.

Data Åpne data Lukkede data
Offentlige

Værdata, kartdata

Pasientjournaler, skatt

Private

Årsrapporter, regnskaper

Salgstall, priser

De store juridiske databasene

Også jussens data kan være åpne og lukkede, private og offentlige. Juridiske data er i praksis ofte det jurister best kjenner som rettskilder. Det vil si lovtekst, forskrifter, rettsavgjørelser, lovkommentarer, fagbøker og forarbeider til loven – men også kontrakter og mye mer. Juss er ikke like «lett» å analysere som regnskaper eller data basert på tall. Straffeutmålinger kan gjøres om til tall, men juridiske vurderinger er langt vanskeligere å kvantifisere.

Her er en oversikt over ulike typer juridiske data:

Juridiske data Åpne data Lukkede data
Offentlige

Norsk Lovtidende og kunngjort regelverk. Rettsavgjørelser fra Høyesterett.

Dommer man ber direkte om fra en domstol.

Private

Konsolidert lovtekst i Lovdata.

Lagmannsrettsavgjørelser og tingrettsavgjørelser i Lovdata – første år etter publisering.

Advokaters notater.

Lovkommentarer publisert av forlag.

Dynamiske data

Innen data skiller man også mellom dynamiske og statiske data, og dette skillet passer også inn i jussen. Gjeldende lov er dynamiske juridiske data. Lovene endres hele tiden etter hvert som nye lover vedtas og gamle utgår. Dommer, derimot, er statiske data. De er ferdige tekster som aldri endres etter at de er skrevet.

Norge har tre betalingsdatabaser med store mengder juridiske data samlet: Lovdata, Rettsdata og Juridika. De tre eies av henholdsvis en selveiende stiftelse og forlagene Gyldendal og Universitetsforlaget. (For ordens skyld: Juridika Innsikt eies av Universitetsforlaget, red. anm.). I tillegg kommer et utall digitale skattkister spredt utover. For eksempel sitter advokatkontorer på mange. Domstoladministrasjonen og Høyesterett sitter på dommer, DIBKunnskap samler dommer innen selskapsrett. Departementene har utredninger, proposisjoner og annet lovforarbeid. Stortinget har data på lovforarbeid og lovvedtak. Listen blir enda lengre om man regner med for eksempel Konkursregisteret, aksjonærregistre, nemnder og arkiver.

Nasjonalbiblioteket og Stortinget samarbeider for øvrig om et prosjekt, kalt Statsmaktene, der en mengde rettskilder legges ut for fri bruk. Her er det snart 4000 dokumenter, spesielt NOU-er, stortingsdokumenter, registre, stortingsforslag, odelstingsproposisjoner og -meldinger, stortingsforhandlinger, budsjettforslag, kunngjøringer og et taleregister.

En norsk Ross eller Watson vil antakeligvis utvikle seg raskere jo flere av disse databasene den kan få «lese» gjennom.

Policy for åpne data: Del godene

I både EU og Norge er man enig om at offentlige data i prinsippet skal være åpne. Begrunnelsen er at de er betalt av skattepenger, og at europeiske myndigheter håper tilgang til data kan gi europeiske bedrifter råstoff til å innovere digitale tjenester og konkurrere med giganter som Google og Amazon. Blant dem som jobber for mer deling, er næringsorganisasjoner for bedrifter som bruker data, blant annet Abelia og IKT Norge, og aktivistgrupper som «Holder de ord».

Det er imidlertid gode grunner også til å begrense delingen. Personvern og selvfinansiering av offentlige tjenester er to av dem. Hvis Kartverket eller Meteorologisk institutt må gi bort data de før solgte til profesjonelle, må regningen dekkes av skattebetalerne. Da er det en fare for at kundeorientering og insentiv for å levere gode data forsvinner. Inntektsbortfall var grunnen til at Kartverket lenge ble anklaget for å være en sinke på å dele data.

Tilgjengelige åpne data kan gi personvernutfordringer. Hvis man kobler nok data om for eksempel en sykdom med kjønn, alder og postnummer på en plass med få innbyggere, er man fort nede på enkeltperson. Lignende hensyn gjelder for domfelte personer. Frislepp av data kan dessuten føre til koblinger som de folkevalgte ikke ønsker, for eksempel kart over «innvandrergater» i byer, som man kan lage ved å kombinere data fra folkeregister, folketelling og eiendomsdata eller koble data om skoleresultater med skolekretser og adresser.

Bare fantasien setter grenser for hva data fra domstolene kan brukes til.

- Herman Westrum Thorsen, Holder De Ord

Frislepp fra regjeringen

Den norske strategien for offentlige data forvaltes av Direktoratet for forvaltning og ikt (Difi). Noen av de mest sentrale databasene forvaltes av departementene selv, kommunene, fylkene, NAV, Arbeidstilsynet, Arkivverket, Bibsys, Brønnøysundregistrene, Husbanken, Kartverket, Mattilsynet, Norges Bank, Norges vassdrags- og energidirektorat (NVE), Norsk Romsenter, Statens legemiddelverk, Statens strålevern, Statens vegvesen, Statistisk sentralbyrå, Utdanningsdirektoratet, Valgdirektoratet og Meteorologisk institutt.

De åpne datasettene samles på https://data.norge.no og øker stadig. Det nyeste datasettet da denne saken ble publisert, var «Leveranser til kornkjøper eller såvareforretning i landbruket i kornåret 2017–2018».

I sommer begynte dessuten Departementenes sikkerhets- og serviceorganisasjon (DSS) å dele departementenes offentlige utredninger, stortingsmeldinger og stortingsproposisjoner i formatene DOC, RTF, XML og PDF.

Blant flere datasett som er delt, er for eksempel lister over alle Norges statsråder, statssekretærer og politiske rådgivere siden 1945.

– Til nå har vi lagt ut dokumenter tilbake til midten av 1990-tallet, sier Petter Thorsrud, seniorrådgiver i DSS. Han håper regjeringen fortsetter å gi ut råfiler som maskiner, ikke bare mennesker, kan lese, og utvider delingen til høringsnotater og flere dokumenttyper.

I internasjonal sammenheng er Norge i snitt blant de ti fremste når det gjelder åpne data, selv om vi er slått av Taiwan, Storbritannia, Danmark, Finland, New Zealand, Australia og Frankrike.

Værdata og Stortinget drar opp (her er Norges nest best i verden), men på juss («national law») er Norge på en skuffende 45.-plass. Ifølge rankingorganisasjonen, Open Knowledges, tar det for lang tid å laste ned lovene, og de kommer ikke i maskinlesbare filer – selv om de er gratis og allment tilgjengelige.

Dataaktivister

Blant dem som har ivret for at Norge skal klatre på rankingene, er den frivillige organisasjonen «Holder de ord». Gruppen ble dannet for å få Stortinget til å gjøre sine data åpent tilgjengelige i maskinlesbart format, slik at man kan sjekke om politikerne holder løftene. Det gjelder også over 500 løfter gitt i justispolitikken.

Juridiske data ser de som neste slagmark.

– Data fra dømmende makt har vi ikke sett mye på ennå, sier Holder de ord-aktivist Herman Westrum Thorsen, som til daglig jobber i Justisdepartementet.

– Men bare fantasien setter grenser for hva data fra domstolene kan brukes til. Man kan for eksempel sammenligne dommer for samme type lovbrudd, slik Dagbladet gjorde da de dokumenterte at menn dømmes strengere enn kvinner for samme type fyllekjøring, sier han.

– Åpning av data er i forvaltningens interesse, ikke mot den. Tredjeparter kan gjøre ting med offentlig data som forvaltningen selv ikke tenker på eller har tid og råd til. Vi håper folk fra justissektoren vil bli med i gruppa vår, sier han og får støtte av Tiina Ruohonen.

– Pussig om domstolene skal være et unntak fra politikk. Domstoladministrasjonen legger jo til grunn at dommer skal være åpne. Tilgjengelig i 2018 betyr åpne datasett med dommer du kan søke fritt i, ikke bare tilgang på enkeltdommer du må vite om finnes, og som du i tillegg må be om, sier hun.

Opprør fra Rettspraksis.no

Det samme forholdet har fått en annen gruppe til å starte nettstedet rettspraksis.no. Rettspraksis ble lansert 17. mai i år og publiserte titusener av høyesterettsdommer som Lovdata tar seg betalt for i sin Pro-løsning. Lovdata svarte med å saksøke Rettspraksis.no. På mange måter ble rettssaken som fulgte, den første offentlige kamp om eierskap til juridiske digitale skattkister.

Lovdata mente dommene på Rettspraksis.no var skrapet (automatisk hentet ut) av deres database bak betalingsmur, og vant frem på flere punkter. Rettspraksis.no, derimot, sa at dommene var hentet manuelt fra CD-plater som ikke var beskyttet av åndsverkloven. Lovdata la vekt på åndsverkloven § 45 (databasevernet), som gir opphavsrettigheter til den som bearbeider og sammenstiller opplysninger i en database.

Rettspraksis.no la vekt på lovens § 9, som unntar rettsavgjørelser fra opphavsvern.

De ble i september dømt til å fjerne dommer fra 2005 til 2007 og alle sammendrag av dommene. Dommene eldre enn 15 år var unntatt fra databasevernet i åndsverkloven § 45. I tillegg ble de dømt til å betale 370 000 kroner i saksomkostninger. Rettspraksis.no har anket dommen og gjenåpnet nettstedet i oktober, men uten dommer og sammendrag som retten fant vernet av åndsverkloven.

Folk flest og loven

Rettspraksis.no mente Lovdata, som er en selveiende stiftelse, må regnes som såpass offentlig at den er underlagt offentlig informasjonsplikt.

– Slik vi ser det, er Lovdata under kontroll av offentligheten, sier Håkon Wium Lie, hoveddrivkraften bak Rettspraksis.no.

Lie var teknologidirektør i Opera Software fra 1998 til 2016 og dessuten en av stifterne av det norske Piratpartiet. Han var i konflikt med Lovdata allerede på 1990-tallet, da han (fra base i Sveits) la ut de fleste av Norges lover gratis på nett. Det erklærte målet var å tvinge Lovdata til å gjøre det samme, noe de i dag gjør.

– Folk flest kan ikke betale 12 500 kroner i året i Lovdata-abonnement for å lese dommer og lover, og de burde ikke heller. Skattepengene deres har allerede finansiert materialet. Vi blir angrepet for at vi på dugnad har laget en allmennyttig tjeneste som Lovdata eller Domstoladministrasjonen burde laget selv, sier Wium Lie, som planlegger å ekspandere databasen med flere kilder fremover.

– Vi sikter etter hvert også på lagmannsrettsavgjørelser i tillegg. Tingrettsdommer, derimot, skaper for lite presedens, sier han om planen videre.

– Vi trenger heller ikke stoppe ved domstolene. Neste stopp kan bli avgjørelsene fra Personvernnemnda og andre vedtak fra det offentlige, sier han.

Lie vil ikke ut med hvem som står bak Rettspraksis.no, utover å røpe at flere jurister er involvert.

Vaktbikkjer

Debatten om søksmålet fikk mange jurister involvert både for og mot delingen av dommer. Advokat Ina Lindahl Nyrud i Norsk Journalistlag mente at «hensynet til ytringsfrihet må overstyre andre hensyn». Hun får her støtte av Kristine Foss, jurist i Norsk Presseforbund.

– Ansvaret følger av offentlighetsloven. Informasjon som skal være åpent tilgjengelig for alle, må være tilgjengelig i praksis. Å kontakte den enkelte domstol for så å vente på svar pr. dom rimer ikke med en moderne definisjon av tilgjengelig, sier hun til Juridika Innsikt. Hun minner om at innsyn er viktig for å kontrollere avgjørelser i domstolen.

Derimot mente jussprofessor Jan Fridthjof Bernt ved Universitetet i Bergen at selv om Lovdata må regnes mer som offentlig enn som privat, er en betalingsmur rettferdiggjort av at databasen er så kostbar å vedlikeholde og bruken av den mest for spesialister.

Stiftelsen omsetter for vel 40 millioner kroner i året. Justisminister Tor Mikkel Wara sa i Stortingets spørretime før sommeren at å betale for Lovdata via statsbudsjettet vil medføre «en betydelig ekstrakostnad for staten, uten en bedre tjeneste for publikum».

Justispolitisk talsperson i Senterpartiet Jenny Klinge mener likevel at regjeringen bør utrede en alternativ finansiering av Lovdata, som gradert betaling eller lånekort for å bruke basen i en kort tidsperiode.

Vi driver for tiden et arbeid for å vurdere hvordan rettsavgjørelser skal formidles i en digital tid

- Sven Marius Urke, Domstoladministrasjonens direktør

Lovdata uten profitt

Odd Storm-Paulsen, direktør for Lovdata, minner om at dette blir to ulike diskusjoner. Rettssaken mot Rettspraksis, sier han, gjelder bruk av Lovdatas bearbeidede rettsavgjørelser. Den gjelder ikke tilgang til offentlige data.

– Motparten retter baker for smed når de angriper oss som staten. Diskusjonen om i hvilket omfang domstolenes avgjørelser skal legges ut offentlig, må de ta med Domstoladministrasjonen, sier Storm-Paulsen.

Han forklarer hvorfor Lovdata reagerer kraftig på at deres arbeid legges ut gratis.

– Vi bruker tid og krefter på å anonymisere dommene vi mottar fra Domstoladministrasjonen, tilrettelegge dem for nett og vedlikeholde databasen. Arbeidstiden må jo noen betale for. Man kan ikke bare fritt forsyne seg og legge gratis ut, sier han.

Storm-Paulsen drar frem dommen i den såkalte Lime-saken. Den brukte Lovdata fem ukeverk på å publisere.

Direktøren minner om at Lovdata er en privat stiftelse, at dataene de tilbyr i Lovdata Pro, er bearbeidet til et nivå som er nyttig for profesjonelle, at de som abonnerer på Lovdata Pro, betaler for Lovdatas arbeid med rettsavgjørelsene, og at Lovdata ikke har eiere som tar ut profitt.

– Vi bruker overskuddet til å videreutvikle tjenestene våre både for profesjonelle og for alminnelige borgere. Hva vi skal tilby gratis, er en løpende vurdering. For et drøyt år siden utvidet vi tiden dommer ligger åpent tilgjengelig på Lovdata.no, fra fire måneder til ett år og begynte å legge ut også tingrettsavgjørelser på de åpne sidene, sier Storm-Paulsen.

For øyeblikket prioriterer Lovdata flere engelske oversettelser av norske lover og forskrifter på de åpne sidene sine.

Frislepp i Domstoladministrasjonen

Uansett hvordan Lovdata skal organiseres, virker det som om Domstoladministrasjonen går med egne planer om å frigi dommer selv.

– Vi driver for tiden et arbeid for å vurdere hvordan rettsavgjørelser skal formidles i en digital tid overfor profesjonelle aktører, medier og publikum. I et demokrati må det være stor åpenhet rundt domstolens avgjørelser ettersom domstolene har så stor makt over enkeltindivider. Det er ingen tvil om at dagens regelverk for offentlighet i rettspleien ikke er tilpasset vår tid, sier Domstoladministrasjonens direktør Sven Marius Urke.

Han minner om at den planlagte moderniseringen krever en vanskelig balansegang mellom åpenhet og personvern.

– De løsninger vi utarbeider, må være ordentlige og i tråd med lover og forskrifter, sier han.

–  Rettspraksis.no har bare publisert noen få avgjørelser, i all hovedsak fra Høyesterett. Det vil være helt andre datamengder om 50 000 avgjørelser årlig skal publiseres på nett. Det vil være et krevende arbeid, men en viktig reform for åpenhet.

Juridiske databaser

  • Lovdata, etablert i 1981

    Eid av seg selv, men stiftelsens styre må bestå av representanter fra Justisdepartementet, Det juridiske fakultet ved Universitetet i Oslo, Advokatforeningen, Dommerforeningen og Stortinget.

    Base: alle norske rettskilder og en rekke internasjonale rettskilder.

  • Rettsdata, etablert i 1994

    Eid av Gyldendal Norsk Forlag.

    Base: Norsk Lovkommentar og dokumenter fra alle typer rettskilder.

  • Juridika (tidligere kommentarutgaver.no)

    Eid av Universitetsforlaget.

    Base: ajourførte lovkommentarer, juridiske fagbøker og tidsskrifter.

Stordata

Stordata, teknologi og analysemetodikk knyttet til datamengder som er for store, for mangeartede og for ustrukturerte til at man kan benytte tradisjonelle teknikker for å hente ut informasjon.

Kilde: Store Norske Leksikon