Viderebruksveileder/Hva er åpne data?

Fra Wikibøker – frie læremidler

3. Hva er åpne data?[rediger]

Data brukes som en betegnelse for biter av informasjon. Disse bitene er fleksible enheter som kan samles, struktureres og deles. Når mange databiter settes sammen får vi et datasett – som gir oss informasjon om større sammenhenger. Det å produsere, analysere og kombinere data er grunnlag for innovasjon både i privat og offentlig sektor.

Offentlig sektor har en strategi for data, som ivaretar og rendyrker det verdiøkende potensialet i systematisert kunnskap. Denne veilederen fokuserer på hvordan økt dataflyt mellom offentlig sektor og offentligheten kan bidra til at data kommer til nytte i nye sammenhenger, og bli en råvare som bidrar til positive prosesser i et samfunnsperspektiv.

Med åpne data menes data som er tilgjengelige for allmenheten. I denne sammenheng betyr dette at de i sin helhet er tilgjengelige for både mennesker og maskiner utenfor etaten.

Hva menes med å åpne data?[rediger]

Offentlige etater utfører sine arbeidsoppgaver med utgangspunkt i opplysninger lagret som informasjonsbiter i interne datasystemer. Når vi snakker om å åpne data er det egentlig bare snakk om noe så enkelt som å dele eksisterende faktaopplysninger med resten av samfunnet. Det innebærer også å tilgjengeliggjøre datagrunnlaget i maskinlesbare formater slik at eksterne aktører kan integrere data i digitale løsninger så sømløst og friksjonsfritt som mulig.

Open Knowledge Foundation sin definisjon: http://www.opendefinition.org/ Opengovdata.org definerer følgende: http://www.opengovdata.org/home/8principles

  • Offentlige data: Informasjon som offentlige etater og kommuner besitter i forbindelse med arbeidsoppgaver som utføres på vegne av innbyggerne.
  • Åpne offentlige data: Data produsert av etater og kommuner som er gjort tilgjengelig i et slikt format at dataene kan viderebrukes i nye sammenhenger av interne og eksterne aktører, kommersielle som ideelle organisasjoner.
  • Maskinlesbare data: Ikke alle formater er maskinlesbare. PDF’er og bildefiler kan for eksempel ikke leses av en maskin og egner seg dårlig til viderebruk, mens dataformater som f.eks. XML og CSV kan deles på tvers av forskjellige IT-systemer. For at maskinlesbarheten skal bli enda bedre kan RDF og JSON benyttes.

Hva slags data skal åpnes?[rediger]

Det vil som regel dreie seg om informasjon som er lagret i en database, enten det er del av en større sentralisert løsning, eller noe så enkelt som et regneark.

Selv om etaten selv har en god forståelse av hva som er nyttig og interessant, er det viktig å ta høyde for at eksterne brukere kan ha andre behov og ideer. Det er derfor viktig å tilgjengeliggjøre så komplette datasett som mulig.

Eksempler på slike datasett kan være alt fra enkle lister og tabeller i saksdokumenter og rapporter, til avanserte databaser med informasjon fra flere av etatens datasystemer.

  • Dataunderlag fra spørreundersøkelser
  • Ledige stillinger
  • Ledighetstall
  • Årsregnskap og budsjetter
  • Kontakt- og lokaliseringsinformasjon for etatens virksomheter
  • Aggregert informasjon om innbyggere

Hva slags data skal ikke åpnes?[rediger]

I arbeidet med å åpne data må det tas hensyn til at det er flere grunner til at noen typer data ikke kan eller bør åpnes for allmennheten. Datasettene må vurderes opp mot opphavsrett, personvern og offentlighetsloven før de gjøres åpent tilgjengelig.

Dersom andre enn etaten selv sitter på hele eller deler av opphavsretten til datasettene må tillatelse innhentes. Ved eventuelle problemer bør muligheten for å åpne deler av datasettet vurderes.

Ønsket om åpne offentlige data kan i noen tilfeller komme i interessekonflikt med innbyggernes behov for et sikret personvern. Det vil i stor grad være opplagt hva som er problematisk og hva som ikke er det, men dette må alltid vurderes før etatens datasett åpnes for allmennheten. I utgangspunktet skal personsensitive opplysninger ikke deles, mens aggregerte opplysninger om f.eks. arbeidsledighet og folkehelse kan deles under forutsetning av at datagrunnlaget er stort nok slik at enkeltpersoner ikke kan identifiseres. I tvilstilfeller må det settes av tid til en mer omfattende evaluering.

Offentlighetsloven skal sikre innbyggernes innsyn i offentlige etaters dokumenter, men har også regler for hva slags data som ikke skal deles av hensyn til taushetsplikt. Disse reglene er primært rettet mot personsensitive opplysninger som ikke skal åpnes av hensyn til personvernet, men datasettene må også vurderes opp mot reglene for å avklare eventuell andre grunnlag for taushetsplikt.