Viderebruksveileder/Hvorfor åpne data?

Fra Wikibøker – frie læremidler
Hopp til navigering Hopp til søk

Hvorfor åpne data?[rediger]

Utviklingen av digital informasjonsteknologi har gjort det som før var ugjennomtrengelige, overveldende tallkolonner til en råvare for viderebruk. Innbyggere, teknologiaktører, medier, politikere og offentlige virksomheter har i dag mulighet til å bruke data på helt nye og innovative måter.

Offentlige data er som hovedregel arkivert og forvaltet av den enkelte etat, uten tydelige overordnede nasjonale føringer. Derfor er det i dag vanskelig å få oversikt over hva slags data som faktisk produseres. Å gjøre disse dataene tilgjengelige vil gi vårt samfunn et konkurransefortrinn i et kunnskaps- og teknologibasert samfunn

Dataene kan settes sammen som byggeklosser for å lage helt nye informasjonstjenester, som igjen kan gjøre vår hverdag mindre sårbar, bedre informert og mer effektiv. Privatpersoner, organisasjoner og nettverk har forskjellige samfunnsbehov sett ut i fra sine særegne perspektiver. Ved å etablere et tydeligere regime for hvilke data som skal deles, og hvordan data skal deles, skaper vi en infrastruktur for ny innsikt og bedre samhandling. Internasjonal erfaring tyder på at en slik infrastruktur legger grunnlaget for nye informasjonstjenester og økt involvering fra innbyggere, organisasjoner og bedrifter.

Et sentralt poeng med åpne data er at data kommer til nytte i nye sammenhenger, og får ny verdi utover den sammenhengen de opprinnelig ble skapt i. Hvilke rådata som viser seg å være av spesiell samfunnsmessig verdi, er vanskelig å vite på forhånd. Innovasjon oppstår når det blir identifisert nye muligheter i eksisterende datasett. Erfaringer fra andre land viser at ny innsikt og spennende tjenester skapes når ulike datasett kobles sammen eller presenteres på nye plattformer og i nye sammenhenger. Ofte kombineres datasett med ulikt opphav i forvaltningen.

I det norske samfunnet har vi lang tradisjon for å dele kunnskap, og bygge samfunnets kollektive kompetanse gjennom skolesystemet og en velutviklet dialog mellom offentlig sektor, næringslivet og sivilsamfunnet. Tilgjengeliggjøring av offentlige rådata er et naturlig neste steg på veien inn i den digitale tidsalder.

Derfor er tilgjengeligjøring av offentlig data viktig[rediger]

Vi har allerede fascinerende eksempler i Norge, og utenlands, på hvordan private initiativ har laget nyttige tjenester som kommer samfunnet til gode ved å tilby sammensatt informasjon. Noen områder ser ut til å være av spesiell samfunnsmessig verdi:

  • Transparens. Ved å åpne data gis næringsliv og sivilsamfunn bredere innsikt i offentlige prosesser. Det bidrar også til en mer opplyst og faktabasert samfunnsdebatt, samt at det gjør offentlige strategier mer etterrettelige og etterprøvbare. Dermed styrkes også tillitten til offentlig sektor og det politiske systemet. Rådata gjør det også mulig for media å fremstille komplekse datasett gjennom visuelle applikasjoner, samt at det åpner for at borgere og media kan komme med korreksjoner til datagrunnlaget.
  • Effektivisering og innovasjon. Gjennom åpne data deles kunnskap på tvers av sektorer og forvaltningsorganer. Mer og bedre data gir grunnlag for bedre beslutninger. Ved å dele data åpner man også opp for nye blikk på offentlig sektors informasjonsløsninger, og legger tilrette for kreativt samspill med utviklere, media og andre teknologikyndige borgere.
  • Næringsutvikling. Åpne data bidrar til at kommersielle aktører kan skape verdiøkende tjenester, og er råvaren et hurtig voksende globalt marked for applikasjoner og verdiøkende tjenester.
  • Demokratisering. Ved å åpne data får borgerne tilgang til grunnlaget for beslutninger og prioriteringer i offentlig sektor. Det gir et bedre grunnlag for evaluering av politisk måloppnåelse, og bidrar til en mer bredspektret flora av ytringer og innspill i den politiske prosessen. Ved å etablere en "åpenhetskultur" rydder man også vei for nye måter å inkludere et bredere publikum i de politiske prosessene.

Slik kan offentlige data kommet til nytte[rediger]

Digital informasjonsteknologi (IKT) har dramatisk endret brukspotensialet for offentlige data. Data er drivverket i applikasjoner og nettbaserte tjenester, og det digitale formatet er egnet til å koble sammen ulike datasett til nye analyser og tjenester. Det gjør det blant annet mulig å visualisere komplekse sammenhenger, samt at det inviterer til videre utforskning av nye bruksområder.

EUs viderebruksdirektiv definerer viderebruk som «personer eller juridiske enheters bruk av offentlige myndigheter dokumenter til andre kommersielle eller ikke-kommersielle formål enn den offentlige oppgave som dokumentene ble utarbeidet til». Her kommer innovasjonspotensialet inn: Data kan komme til nytte i nye sammenhenger de opprinnelig ikke var ment for.

Når data deles med flere åpnes det for nye perspektiver på hvordan datene kan anvendes. Nedenfor har vi listet opp noen eksempler på de verdier offentlige data kan bidra til å skape.

  • Nyttige borgertjenester. De mest nærliggende eksemplene er hvordan frislipp av værdata og rutetidsdata har skapt grunnlag for helt nye og effektive informasjonsløsninger i både privat og offentlig sektor. Etter at Transport for London (TFL) åpnet sine rutetids- og sanntidsdata, dukket det opp en lang rekke nyttige informasjonstjenester som reduserte terskelen for å bruke kollektive transportmidler. På det danske nettstedet husetsweb.dk kan man enkelt finne ut hvordan energieffektiviserer hjemmet sitt, inkludert plan for finansiering og finne frem til de beste håndverkerne. Tjenesten bruker offentlige data som er sammenstillet med et register for lokal næringsvirksomhet.
  • Ny innsikt ved kobling av data. Ofte kan det gjøres nyttig og korrigerende innsats fra media og interesseorganisasjoner ved å kombinere ulike data. Et eksempel er miljøforkjempere i EU som har krysskoblet informasjon om hvilke fiskebåter som både mottar fiskerisubsidier og samtidig er domfelt for ulovlig fiske. Slik skaper de ny innsikt og legger grunnlag for debatt om subsidieregimet og hvorvidt insentivene understøtter målet om en bærekraftig fiskeriforvaltning. http://fishsubsidy.org/
  • Interaktiv visualisering av komplekse data. Særlig komplekse data har et stort potensiale i å kommuniseres mer effektiv. Et eksempel på slike komplekse data er offentlige budsjetter og regnskap. I Tyskland ble det tyske statsbudsjettet tilgjengeliggjort av idealister i Open Knowledge Foundation på nettstedet offenerhaushalt.de. Et liknende prosjekt ble gjennomført med bybudsjettet for Bergen kommune på nettstedet datagartneriet.no].
  • Ny forretningsutvikling. Viderebruk av offentlige data kan også skape grunnlag for ny næringsutvikling. Et nærliggende eksempel er selskapet StormGeo, som springer ut av TV2, og bygger hele sin virksomhet på viderebruk av meteorologiske data. Gjennom analyse, visualisering og videreforedling har de etablert spesialiserte værvarslingstjeneser for blant annet energisektoren, og er blitt en viktig kunnskapsbasert eksportbedrift.
  • Nye løsninger for innsyn i politiske prosesser. Andre interessante tjenester viser hvilke sosiale arrangementer ulike politikere vil delta i, og hvor skattepengene forsvinner. På folketsting.dk kan man følge med på hvordan lovprosesser arter seg og se status på gitte lovforslag og hvilke politikere som er sentrale i prosessen. Drammens Tidende har utviklet Buskerudbenken på nett, som kombinerer redaksjonell omtale av stortingspolitikere fra Buskerud, med fakta og stortingsstatistikk knyttet til den enkelte politiker.
  • Effektiviseringsløsninger i offentlig sektor. Selv om distribusjon av data på tvers av offentlige etater ikke er innenfor EUs definisjon av viderebruk, vil man ved å åpne data kunne utløse et innovasjonspotensiale også i den enkelte offentlige virksomhet. Dette kan utløses både ved intern utvikling, og via initiativ som kommer fra eksterne aktører. Et eksempel er Freie Universiteit i Amsterdam, som i et pilotprosjekt har lagd en helt ny informasjonsløsning for brannvesenet i Amsterdam. Løsningen kombinerer veidata, sanntids trafikkmålinger, adressedata med beboerdata og byggesaker knyttet til den enkelte eiendom. Slik kan man, i sanntid, få ut raskeste vei til stedet (basert på trafikksituasjonen akkurat nå), beboere med adresse på stedet, og oppdatert byggteknisk informasjon om bygget som brenner.

USA, Canada, Storbritannia og New Zealand er foregangsnasjonene for satsning på åpne offentlige data. Her ser vi fremveksten av møteplasser med lister over tilgjengelige data hvor disse vurderes og diskuteres. Disse møteplassene er yngleplasser for nytenking og promotering av nye tjenester. Nye løsninger oppstår også som et resultat av aktive initiativ fra dataeier (se flere detaljer i kapittel 4).

Man har også sett ideer vokse frem som løser pragmatiske utfordringer i bybildet eller unødvendig ressursbruk for individer. Vegvesenet har etablert en tjeneste der bilers registreringsnummer er koblet med eiers telefonnummer. Tjenesten kan for eksempel bidra til at man kan avverge feilparkeringer ved hjelp av mobile applikasjoner.

Offentlighetsloven og statlige føringer[rediger]

EU vedtok i 2003 viderebruksdirektivet (direktiv 2003/98/EF), som ble implementert i norsk lov gjennom den nye offentlighetsloven som trådte i kraft 1. januar 2009. Viderebruksdirektivet krever at alle aktører likebehandles, altså at all informasjon gjøres tilgjengelig på like vilkår. Samtidig oppfordrer direktivet til å gjøre mer informasjon tilgjengelig så enkelt som mulig.

Innen temaet viderebruk av offentlig informasjon trekkes ofte offentlighetsloven § 9 frem. Etter § 9 har man innsynsrett i en «samanstilling av opplysningar som er elektronisk lagra i databasene til organet», dersom sammenstillingen «kan gjerast med enkle framgangsmåtar». I en del situasjoner vil et aktivt arbeid med tilgjengeliggjøring av data derfor kunne redusere arbeidsmengden knyttet til behandling av innsynsbegjæringer.

I tillegg til dette er tilgjengeliggjøring av offentlig sektors data vedtatt som en av fem fellesføringer for 2011. Fellesføringen krever at etatene skal tilgjengeliggjøre «egnede rådata i maskinlesbare formater», men presiserer at dette kun gjelder data det er enkelt og billig å tilgjengeliggjøre. Hensikten med føringen er å tilgjengeliggjøre data det er enkelt å tilgjengeliggjøre først, for å komme igang og for å lære mer om hvordan offentlige data bør tilgjengeliggjøres og hvilken verdi det kan ha for samfunnet. Fellesføringen sier imidlertid også at data normalt skal gjøres tilgjengelig i maskinlesbare formater ved etablering av nye eller oppgradering av eksisterende publikumstjenester med utgangspunkt i rådata.

Selve fellesføringsteksten slik den er formulert i rundskriv P 5/2010:

Etatene skal gjøre egnede og eksisterende rådata tilgjengelige i maskinlesbare formater. Dette gjelder informasjon som har samfunnsmessig verdi, som kan viderebrukes, som ikke er taushetsbelagte og der kostnadene ved tilgjengeliggjøring antas å være beskjedne (bortfall av inntekter ved salg av data anses som en kostnad).
Formater og bruksvilkår må være i overensstemmelse med Referansekatalogen og FADs føringer på nettstedet data.norge.no. Informasjon om hvilke rådata som er tilgjengelige, skal publiseres på virksomhetens nettside. Dette bør ses i sammenheng med registrering av datasett på nettstedet data.norge.no.
Etater som vurderer å etablere nye eller å oppgradere eksisterende publikumstjenester med utgangspunkt i rådata, skal normalt gjøre disse rådataene offentlig tilgjengelige i maskinlesbare formater, dersom ingenting er til hinder for slik tilgjengeliggjøring av rådata. Før virksomheten eventuelt selv etablerer nye publikumsløsninger basert på rådata, må det vurderes om det er mer kostnadseffektivt å tilgjengeliggjøre rådata i maskinlesbare formater som grunnlag for at andre kan utvikle tjenester.
Det skal fremkomme av årsrapporten hvilke data som er gjort tilgjengelige. Dersom publikumstjenester blir etablert uten tilgjengeliggjøring av rådata, skal dette begrunnes i årsrapporten.

Vanlige motforestillinger[rediger]

Vi vet ikke hva dataene våre kommer til å bli brukt til. Helt korrekt, selvsagt, men et argument som veier desto tyngre for å frigjøre dataene er nettopp at dataeier ikke kan forutse hvilken bruk og nytteverdi alle egne datasett kan ha for andre. Det er nettopp der gjennomslagskraften for innovasjon er så stor. Det er ved utvelgelsen av hvilke datasett som er mulige å gjøre tilgjengelige, at dataeier sørger for at nyttige og brukbare faktarelaterte data kan frigjøres.

Pris og kostnader ved tilgjengeliggjøring. Initiering og vedlikehold av data vil selvsagt kreve ressurser. Den optimistiske siden ved dette er at man forhåpentligvis får igjen for investeringen, i form av økt innovasjonsrate, bedre utnyttelse av dataene og i det lange løp en kultur som allminneliggjør innovasjon og øker sjansen for innovasjon i offentlig sektor. Data skal i hovedsak være fritt tilgjengelig. I enkelte tilfeller kan man prissette bruk av data. Les mer om dette i seksjonen om salg av data.

Er dette våre data? Ingen føler eierskap til dataene. Arv av både systemer og datainnhold er vanlig i mange organisasjoner. Gjenbruk av gamle strukturer som er uoversiktlige er utfordrende og få eller ingen har eierskap til disse dataene. Ved å samle små sett av data i lister eller i andre formater kan disse dataene få nytt liv ved at både eierskap gjenopprettes og nye muligheter for bruk kan skapes - i og utenfor egen organisasjon.

Datapubliseringer er utenfor kjerneaktivitetene. Datapublisering er et virkemiddel som kan bidra til å nå spesifikke mål. Fordelen med å gjøre sine egne data tilgjengelige er at organisasjonen åpner for at eksterne lager tjenester som på sikt kan lette arbeidet som ligger innenfor kjerneaktivitetene. Oversikt over tilgjengelige data, kompetanse i organisasjonene og god teknisk infrastruktur er av nytte uavhengig av om man skal dele data.

Vi har ingen kontroll over hvilke datasett som krysses med våre egne. Nei, det har du ikke i utgangspunktet. Det at datasett kombineres eller tilgjengelligjøres i nye sammenhenger vil ofte bidra til ny innsikt og spennende løsninger. Derfor er så åpne lisenser som mulig å anbefale. Ulike lisenstyper kan i noen grad bidra til at du får en oversikt over hvem som laster ned dataene, og regulere adgangen til å videreforedle dem.