Community på Sveriges dataportal
Hur vill Ni som använder datamängder kunna bidra med Wikidata Q-koden?
-
@Magnus-Sälgö Perfekt! Då fortsätter jag min satsning
Och som förtydligande för er som inte hängde med nu - detta syftar till en konversation vi hade på telefon -
@Maria-Söderlind en vag tanke är att ni skulle precis som Nobelprize.org ha era persistenta identifierare och ha landningssidor och API för dom med samma mönster som ovan ---> att ni kan kanske undvika länkröta.... eller åtminstone som Nobelprize.org kan städa upp det själva...
Litteraturbanken har lite samma stuk ex. August Strindberg WD: Q7724#P5101 -> Litteraturbanken författare StrindbergA -->
- API https://litteraturbanken.se/api/get_author/StrindbergA
- Websida https://litteraturbanken.se/författare/StrindbergA
Litteraturbanken har som Nobelprize.org samma som Wikidata och hämtar från WIkidata även Riksarkivet SBL och SKBL
-
@Maria-Söderlind sa i Hur vill Ni som använder datamängder kunna bidra med Wikidata Q-koden?:
När det gäller Owner så föreslår du samma som Wikidata eller annat, men vi kommer fortsatt vilja ha ett textfält här (sen kanske man lägger till ett fält där man kan bidra med wikidata). Anledningen är att vår "portal" för öppna data inte enbart är för utvecklare, utan även för de som inte kan något alls om det utan bara vill gå in på portalen och kika på datan. Då har de mer nytta av textfältet. Även våra egna medarbetare jobbar en hel via portalen (kanske inte just med denna datamängd) och då vill de kunna se "Umeå kommun", eller något annat värde, direkt och inte endast en referens till wikidata.
Kom ni fram till något angående ID för owner? Det måste ju ingå i myndighetens förvaltning att använda beständiga identifierare för referenser till objekt, och är inget som hindrar att man också har beskrivande fält. Lägger ni till fält för identiteter, eller ska det finnas en mappning från text till URI?
-
@jonor Nope, ambitionen för oss i Umeå är att vi (för wikidata som vi nu pratar om) börjar med två datamängder som vi inte redan publicerat. För dessa två finns det specifikation framtagna där attributet Wikidata ingår. Dvs vi kommer inte att lägga till något som inte finns i specifikationerna.
Det är följande två som är vår ambition att börja med (tror inte vi kommer att använda fälten där man anger specifikt detta finns/detta finns inte men vem vet)
https://lankadedata.se/spec/lekplatser/
https://lankadedata.se/spec/utegym/Är det något ni anser fattas i dessa?
-
@Maria-Söderlind Moduler/redskap på lekplatsen borde kanske inte vara en uppsättning separata fält utan en lista enligt någon vokabulär, vad gör man när nya redskap introduceras? Framför allt bör ni till tänka till framöver angående att använda URI:er och standardiserade begrepp tycker jag om ni vill göra datan mer användbar, men det här kanske var en begränsad frågeställning om just hur man tekniskt ska ange referenser til Wikidata inom ramen för de publicerade specarna.
@Maria-Söderlind sa i Hur vill Ni som använder datamängder kunna bidra med Wikidata Q-koden?:
Dvs vi kommer inte att lägga till något som inte finns i specifikationerna.
-
@jonor Du har helt rätt, det här är ett designfel som förekommer i flera specifikationer, skapade av såväl ÖDIS, som NSÖD och Dataverkstan. Bl.a. @Magnus-Sälgö har också uppmärksammat detta.
Dessutom är det mycket problematiskt att specar skapas på engelska. Risken är stor att det blir en egensnickrad svengelska (som jag sett i massvis med IT-system som skapats av våra stora drakar). Kanske det är struntsamma för grillplatser, men det kommer få tråkiga konsekvenser för datamängder som redan hanteras av normativa informationsägare. T.ex. inom trafik, lag om vägtrafikdefinitioner . Ska Dataverkstan knåpa ihop egna översättningar? Fråga Transportstyrelsen? Googla? Fråga "Kalle på hörnet"? (ja, jag tror det blir de två sistnämnda alternativen). @Maria_Dalhage - ytterligare ett exempel på det jag menar är kompetensbrist inom Dataverkstan (m.fl liknande öppna data-projekt). Den här datainsamlingen med märkliga specar kommer bli oerhört svårförvaltad (och dyr att underhålla), det skulle förvåna mig om man lyckas hitta en fungerande modell för förvaltning och utveckling av specar (och därmed insamlade data).
Idén att utländsk offentlig sektor ska ta efter vår modell med NSÖD,/Dataverkstan, som jag sett någon konsult presenterat, kan jag bara hoppas man inte lyckas sälja in.
-
@jonor Håller helt med dig i din åsikt och kommer att jobba för den internt hos oss. Tänker även att datamängderna blir lättare att ajourhålla då (men kan ha helt fel här)
Men - vi måste också på något sätt förhålla oss till de befintliga specifikationerna. -
@mistral Vi kanske kan välja att se på detta ur en annan synvinkel också?
Tänka att här jobbar vi agilt och tillsammans. Om ingen tar fram en första specifikation så har vi inget att förhålla oss till - blev det inte perfekt, då knådar vi på den. Ärligt talat Vad blir perfekt första gången?
Enligt min erfarenhet så är det först när man konkret tar fram något som åsikter kommer fram. Om jag frågar tio personer vilken nyans jag ska måla ett hus i så säger de flesta "bestäm du, vilket som blir bra". Om jag sen bestämmer och målar huset så har flera av dessa tio en åsikt om att det var fel nyans, hur tänkte jag osv. De andra säger ingenting. Dåligt jämförelse, jag vet, men hoppas min poäng kommer fram
Jag är jätteglad att några har gjort jobbet med att ta fram specifikationer som vi kan inspireras av - lika glad är jag över att ni som användare lyfter fram bristerna i dem! -
@Maria-Söderlind Absolut! Jag håller med dig. Men anledningen till att jag kan verka hård i min kritik är att Datverkstan själva trycker på att deltagarna ska få "Tillgång till expertis inom öppna och delade data från den nationella expertgruppen". Det här som @Magnus-Sälgö och @jonor pekar på är grundläggande aspekter på datainsamling och borde rimligen hanterats tidigt av en "expertgrupp". Jag vet fortfarande inte vilka som ingår i "Expertgruppen" och utan insyn, så är det ju svårt att förhålla sig. Enligt min mening ska ett expertstöd kunna navigera i områden som standardiseringsprocesser, datautbytesformat, unika beständiga identifierare, master-/grunddatakällor mm. och bistå deltagarna i detta. Att öppna data handlar ju inte bara om publicering, utan även långsiktigt åtagande om ägandeskap, kvalitetssäkring och förvaltning. Det kan bli svårare om vi missar viktiga pusselbitar i början.
Med det sagt, vill jag ge dig en eloge för ett fantastiskt engagemang i frågan. Det är precis genom denna typ av dialog och diskussion vi, tillsammans, kan få saker att hända
-
@Magnus-Sälgö Japp, håller med. För att återkoppla till det @jonor och @Maria-Söderlind var inne på om datastruktur, så uppmanar Dataverkstans specar till "messy data" (till skillnad från "tidy data"). Väletablerade begrepp inom databehandling, data science mm. Stökiga data är svåra /dyra att underhålla, dela och utveckla.
-
Nu har vi i Umeå lagt ut Utegym som öppna data. Vi har i den datamängden introducerat möjlighet för er som efterfrågar wikidata att bidra med den. Efter att ha lyssnat av kommentarer här i tråden så uppfattade vi det som att man gärna ser en möjlighet att kunna bidra med "bulkdata". I just detta fall kanske det inte är så aktuellt eftersom vi inte har mängder med utegym, men vi har beslutat att testa att ta in information på två olika sätt.
Man kan gå in på datamängden på var dataportal och på aktuell rad lägga till en kommentar om vad Q-koden bör vara.
Man kan skicka in en fil med id för utegymmet kopplat till Q-kod. Allt finns dokumenterat i Wikidata-fliken för datamängden. -
@Maria Grattis till publiceringen. Magnus gjorde inom en dag en synkronisering mha OpenRefine, upptäckte brister i både er datamängd och i den på Wikidata, OSM och Google Maps. Han skapade sen de objekt som saknades och uppdaterade OSM och GM.
Han gjorde även en färgad karta mha SPARQL så ni tydligt ser de tre utegym som ni saknar i er datamängd.
Jag hittade förresten den i Stöcksjö
https://github.com/salgo60/ProjectOutdoorGyms/issues/124
Vi saknar bra bilder på gymmen fortfarande så det tänker jag försöka bidra med i sommar när jag ändå är ute och karterar alla adresser som saknas. -
@Dennis_Priskorn Härligt. Dock saknar vi fortfarande återkoppling kring q-koden för utegymmen, visst planerar ni att bidra med den
Toppen att ni hittat gym som vi saknar i vårt system. Har ni sett att man även kan föreslå nya poster? Den möjligheten finns i fliken med tabellen, gå till "pratbubblan" längst ner så kan ni föreslå nya poster. Har ni redan datan som vi inte har så skulle jag kunna föra den infon vidare till informationsägarna, hoppas att de tacksamt tar emot informationen.