Diskusjon:Viderebruksveileder

Fra Wikibøker – frie læremidler
Hopp til navigering Hopp til søk

Diverse kommentarer[rediger]

Jeg har noen kommentarer og forslag til endringer, men velger å legge dem her i diskusjonen heller enn å redigere dem inn (og ut?).

--- Takk for alle kommentarer og innspill så langt! Vi leser alle forslag, og vi diskuterer de i fellesskap her vi sitter og skriver. Flere av innspillene deres er allerede på vei inn i teksten. Keep em coming! abrenna

---

a) Innledning, inngress: definisjon av data:

Data behøver ikke å være nøytrale faktaopplysninger. De enkelte observasjoner kan være vel så mye utsatt for feilregistrering eller manipulasjon som tolkningene av dem. Foreslår at setningen blir "Data er små biter av opplysninger".

Dette går igjen et par steder i teksten: I første avsnitt under kapittel 2 vil jeg gjøre som over og endre ”nøytrale faktaopplysninger” til ”opplysninger”.

Første avsnitt under kapittel 3 lyder:

”Data brukes som en betegnelse for biter av meningsnøytral informasjon, og kan enkelt beskrives som nøytrale faktaopplysninger. Et datasett er således et sett med nøytrale faktaopplysninger som settes sammen av datamaskiner for å gi brukerne informasjonen de trenger.”

Jeg synes heller ikke at definisjonen er helt god, og vil foreslå at avsnittet skrives om til:

”Data brukes som en betegnelse for biter av informasjon, og et datasett er en organisert samling av relatert informasjon som er gitt verdier og har blitt registrert. Et datasett gir oss dermed mulighetene til å se informasjonsbitene i sammenheng og vil ofte gi oss mer informasjon enn hva vi kan få fra summen av informasjonsbitene hver for seg.”

Denne definisjonen har jeg sydd sammen fra oppføringene om data, datum, data file, og data set i W.Paul Vogt (1999): Dictionary of Statistics and Methodology, 2nd ed. (finnes også i en tredje utgave fra 2005 og en fjerde utgave kommer i mars 2011).

---

b) Innledning, eksempel 1: Hvilke næringer vokser i hvilke regioner?

Et lokalt eksempel på dette er ideas2evidence (Jostein Ryssevik) sitt arbeid for Vestlandsrådet: http://www.vestlandsraadet.no/nøkkeltall

Et annet eksempel på dataløsning som krysser næringsdata, stedsdata (og demografiske data) er Business Analyst fra GeoInsight: http://geoinsight.no/Produkter/Business-Analyst/ Begge baserer seg på tall fra Brønnøysundregistrene og SSB, men de har kjøpt en del spesialkjøringer av disse dataene, og gitt dataene merverdi også ved egeninnsats.

Disse eksemplene kan også være relevante under delkapittel 2.2, avsnittet ”Ny forretningsutvikling”

---

c) Innledning, delkapittel 1.2, tredje avsnitt: Dette avsnittet er litt vanskelig uten å ha en liste med definisjoner først. Hva er for eksempel rådata for demografi, skoleverk og helse? Snakker vi her om individdata?

---

d) Innledning, delkapittel 1.6, ordliste: Jfr kommentar c. Om noe, bør ordlisten kanskje komme tidligere, samt inkludere en definisjon av rådata.

---

e) Kapittel 2, fjerde avsnitt: ”Et viktig poeng med frislipp av offentlig (sic.) data er at nytenkingen kan finne sted hos dyktige utviklere og nyskapere som ser nye muligheter med eksisterende datasett”. Her savner jeg statistikere og analytikere (det dere senere kaller superbrukere) blant de som kan ha nytte av åpne data.

---

f) Kapittel 4, delkapittel 4.4, avsnittene under "Gjør dataene mer strukturert":

Det bør presiseres at man ikke standardiserer data på en slik måte at man mister informasjon (for eksempel ved at man ikke kan regne seg tilbake til dataenes opprinnelige verdi). Avrundinger (for eksempel til hele 1000) bør unngås, fordi man da ikke lengre leverer rene rådata, men lett bearbeidede data der detaljrikdommen i datasettet er redusert. Dess ”rikere” datasett, dess større variasjon, og dermed mer anvendbare datasett til (statistiske) analyser. Hvis dette går på bekostning av lesevennlighet vil jeg oppfordre om at avrundinger gjøres slik at de fremstår som avrundinger for det blotte øyet, men at datamaskinen leser de opprinnelig registrerte verdiene.

Et eksempel:

1, 2, 3, 4, 5, 6, osv

1891, 1893, 1895, 1897, 1899, 1901, osv

En slik matrise vil gi en perfekt korrelasjon mellom første og andre rad, mens dersom andre rad regnes om til hele 1000 vil resultatet være overhodet ingen korrelasjon.


Det var mine kommentarer så langt. God helg!

- Oppdatert 20.1.11: Tydeligvis noe galt med personverninnstillingene mine, jeg får ikke gjort noe som innlogget. Kommentarene over er skrevet av Stian Skår Ludvigsen den 14.1.11, og brukerinfo er lagt inn manuelt: Stianlud (diskusjon) 20. jan 2011 kl. 14:22 (CET)

Wikiformatering[rediger]

Hei. Jeg leste igjennom teksten og rettet skrivefeilene jeg kom over. I tillegg har jeg «wikiformatert» teksten, dvs. endret til «norske» anførselstegn, satt tankestreker som ndash (–) og lagt inn noen lenker. Kåre-Olav (diskusjon) 16. jan 2011 kl. 16:59 (CET)

Bruksvilkår[rediger]

Utenom kapittelet som tar det opp så ser det ut som dere nesten overser bruksvilkårene knyttet til tilgjengeliggjøringen som en like viktig faktor som maskinlesbare formater. Har prøvd å rette på det.

I kapittelet som omtaler lisens bør en skille mellom lisens og belastningsproblemstillinger (som jeg tror yr.no har vært inne på) --Dittaeva (diskusjon) 31. jan 2011 kl. 16:59 (CET)

Lisensiering[rediger]

Å gi lisens til opphavsrettsbeskyttet arbeid erstatter ikkje opphavsrettslige bestemmelser og retter. En sier ikke en gang fra seg de retter en har. Det en gjør er å bruke sin eksklusive rett til å gi andre brukere rettigheter. Dersom det gjøres omfattende nok (CC-BY) kan det se ut som en gir fra seg opphavsretten, men det er ikke mulig, og heller ikke tilfellet. Jeg har prøvd å rette på dette, der det kommer fram.

Det kontraktsrettslige aspektet ved lisensiering og selve ordet bør nok forklares bedre / mer utdypende. Det er ikke like lett forståelig på norsk som på engelsk. Og iallfall ikke like forståelig utenfor juss som innenfor.

Jeg har endret en del som gikk på lisensiering, f. eks. «datakvalitet, oppdateringer og tidsbegrenset bruk, mv.» fordi det kan virke som oppfordring til å ta i bruk «uopne» lisenser. Det gagner ingen. --Dittaeva (diskusjon) 31. jan 2011 kl. 16:59 (CET)