Community på Sveriges dataportal
Hjälp folk att bada i sommar med Öppna Data! (Tips och hjälp behövs)
-
Hej!
Inom samverkansprojektet i VGRegion "Dataportal Väst" har vi börjat ta fram specifikationer och mer konkret hjälp till deltagarorganisationerna att dela data.En idé vi har är att skapa en datamängd lagom till sommarsäsongen för Badplatser. Det finns en bra datamängd hos Havs- och vattenmyndigheten, och vi tänker oss att vår kompletterar den, genom att till exempel kunna ha med badplatser som inte har vattenkontroller.
Vi har ett alldeles första utkast skrivet, och jag önskar nu er feedback - gärna genom kommentarer direkt i dokumentet, eller via mail, eller här som svar.
Tanken med datamängden är att det ska vara lätt att sätta samman och publicera den, så vi har valt ett kolumnbaserat format som gör sig bra i ex. ett kalkylblad. Det här gör det kanske lite mer svårläst och lite "fulare" rent tekniskt, men vi har diskuterat andra väger och ändå beslutat att det här känns enklast för våra dataproducenter som troligen kommer att bestå av personal inom turist- och besöksfunktioner i kommunerna.
Vi har kikat på befintliga modeller, lånat lite av Californiens datamängd om sina stränder, Fiware och Havs- och vattenmyndighetens upplägg samt knyckt lite allmänt
Några kommentarer och iakttagelser har redan gjorts i dokumentet, bland annat kring beständiga identifierare. Hjälp mig gärna att klura på det och jag tar även gärna emot tips om verktyg för att utan att behöva stansa i en text-editor, som hjälper mig att visuellt skapa scheman för json osv. Kanske finns en bra allmän verktygslåda jag kan ha nytta av?
Kika gärna in på DelaDigitalt där jag har publicerat ungefär samma fråga, eller direkt i dokumentet. Jag har en Google-docs-länk där du ska kunna skriva kommentar, eller en PDF där du kan ladda ned.
Hjälp oss bli klara och vara smarta, innan det är +21 (hoppas hoppas) i vattnet i sommar!
Mvh
Tomas Monsén, IT-utvecklare, Töreboda Kommun (samt Kim Lantto Göteborgs stad och Fredrik Eriksson, regionens samordnare öppna data).Länk till Google Docs -dokument/referenskopia i sin allra första Alpha-version:
https://docs.google.com/document/d/1GxNucD_E_eoHnlyJAL3tjCel-BdWvwF5TB_lYl7bs94/edit?usp=sharing -
@tomasmonsen bra ide....
Mina funderingar
- alltid bra att ha egna unika persistenta identifierare.... ta även höjd för att bad försvinner , byter namn, eller externa idn byts ut....
- jag kollade kort på hav och vatten API:et och känner att det vore bra att även ha med en identifierare hos Open Street Map --> då kan du se storleken på badet och enklare hålla OSM kartan uppdaterad med erat värde....
- Open Street Map kopplar WIkidata och Wikidata håller reda på Open Street Map
- @Dennis_Priskorn har säkert bättre koll på detta men en bra sak är att skall ni ange ex. wheelchair så "smygkolla" hur OSM gör och se till att det ni anger kan vara kompatibelt med deras... så kan någon frivllig uppdatera deras data... du har en aktiv svensk OSM grupp på FB "OpenStreetMap Sverige"
- samma public_transit kolla hur detta identifieras i Trafiklabs API och ange detta id eller vad dom har så blir det enklare för dom som programmerar appar
- som Wikidata nerd så skulle jag gärna se att Wikidata ID:et och/eller Wikipedia artikeln finns --> att man med lite pyssel även hittar bilder på badet... Jag skapade förra året
- Wikipedia Järvabadet
- samma som Wikidata Q96252109
- samma som OSM relation/11224474 som pekar på Wikidata Q96252109
- bilder i WIkicommoins finns då att hämta som alla som har motiv Q96252109 --> haswbstatement:P180=Q96252109
Exempel bilder som avbildar badet Q96252109
-
Väldigt roligt att ni gör det här tänker jag som gillar att bada, sommar och nu också i år, på vintern:) Som sagt, man ångrar aldrig ett dopp! Eftersom jag inte kan programmera kommer här kanske några riktiga amatörfrågor:)
-
Hur säkerställer man att inte samma badplats "mappas" mer än en gång? Alltså, att kanske en kommun och nån organisation lägger upp samma badplats med t.ex. lite olika koordinater eller namn...
-
Skulle det vara intressant att lägga in parametern "kallbad"? Alltså att skriva in om det är möjligt att bada på vintersäsongen.
-
Hur funkar det om andra aktörer än den som först angav datat för en viss badplats vill lägga in mer info eller ändra på nåt? Jag tänker att den som först la in infon kanske inte alltid har koll på förändringar som görs senare på badplatsen, t.ex. att en kanotförening sätter ut bojar för rodd i vattnet.
-
-
- Hur säkerställer man att inte samma badplats "mappas" mer än en gång?
Är det ett problem enklast är väl att bara lägga ut det på en karta och se var fler punkter dyker upp... men annars så är det att använda externa persistenta egenskaper och se att man inte har dubletter.... jag skrev en längre artikel om svenska runstenar och hur våra runstenar sedan 1750 har haft unika id:n länk även dessa kloka gubbar från 1750 lyckades skapa dubbletter och då får man peka på dom 2 ggr eller om dubletterna uppstår i ex. Wikidata så finns det ett menyval för att koppla ihop 2 poster (@Kristine_ ställde den frågan under en jobtech session)
Exempel hur det ser ut i Wikidata du anger ett annat Qnummer sedan kopplas dom ihop... och skulle någon gå till det id som "inte finns längre" så har en redirect skapats
Tips är att du testar att jobba praktiskt med data och koppla ihop datamängder jag brukar använda ett verktyg från Google som heter Open Refine där man ofta tar sitt data och gör "reconciliation" mot externa källor så att man får samma som. Tips är som sagt att jobba praktiskt så inser man vad som är viktigt....
- kallbad den utmaning man får ofta när man jobbar med data är att som i detta fall definiera vad som är kallbad en variant är att peka på Wikipedia Badhus#Kallbadhus (gissar att Kallbadhus inte är det du tänker på) i detta fall finns inte ett eget Wikidata objekt plus att definitionen av det du skriver inte är lika. En variant är då att skapa ett Wikidata objekt som är den typ av "kallbad" du syftar på... läser man på engelsk WIkipedia "samma artikel" Public_bathing så inser man att dom beskriver mycket mer i sin artikel... dvs. vi har ett problem och måste bena upp semantiken....
Tingsryd kommun verkar ha den typ av kallbad du syftar på... kollar vi på Open Street Map så saknas den info se relation/10701080
Som Wikipedia och andra communities fungerar så saknar man ett sätt att beskriva en sak så får man gå in och beskriva vad man vill ha så får man sedan se hur resten av dom som skapar saker reagerar på det. Kollar du på Tag:amenity public_bath så finns många kombinationer av bad.... där folk har kommit överens att det skall beskrivas....
Data är dynamisk och mycket dialog behövs
Min oro med projektet nationellt ramverk för grunddata inom den offentliga förvaltningen är att man sitter för sig själva i 2 år och inte har denna dialog så det man skapar är inte det folk vill ha... när jag jobbade på SEB slängde man bort miljarder på projekt som definierats men inte tagit höjd för att alla kommer ha mobilapplikationer --> resultat projekten lades ned och miljarder förlorades..... efter det försökte SEB börja jobba agilt och ha mer dialog med produktägarna...3a). "Hur funkar det om andra aktörer" det är där man bör ha verktyg som GITHUB där man enkelt kan hantera olika versioner.... enklast kan vara att kommuner har basdata och dit rapporterar man rena felaktigheter. Vill man lägga till massa olika saker så fungerar nog det bäst på öppna plattformar som Wikidata Open Street map...
3b). "Hur funkar det om andra aktörer" en tanke är att datat om bojar för rodd hanteras av roddföreningen men att dom refererar till kommunens data (då är det bra med unika identifierare i kommunens data så man kan säga att bojarna finns på badplats med id xxx hos kommunen....
tanken med länkad data är att du väljer vems data du litar på .....
-
@salgo60 använde frågespråket Overpass och frågade Open Street Map hur många "amenity"="public_bath" dom har
dvs. det saknas en hel del. Eftersom Open Street Map används mer och mer så är det bra om ni laddar upp ert data där och/eller levererar ert data så det är enkelt att använda på OSM....
Annan sak vi önskar av kommuner är Vindskydd
- finns en Facebook grupp som samlat in > 1000 vindskydd men vore bra att få från kommunerna var dessa finns, hur man anmäler fel, vad som finns etc....
- Facebook grupp "Vindskydd i Norden"
- deras Google karta
- när jag var ny och naiv med "Öppen Data" skrev jag ihop vad jag förväntade mig att alla kommuner skulle ha om vindskydd länk blogpost
- Open Street map fråga amenity=shelter
-
@salgo60 sa i Hjälp folk att bada i sommar med Öppna Data! (Tips och hjälp behövs):
dvs. det saknas en hel del. Eftersom Open Street Map används mer och mer så är det bra om ni laddar upp ert data där och/eller levererar ert data så det är enkelt att använda på OSM....
-> Dvs CC0 licens och i maskinläsbart format
-
@salgo60 sa i Hjälp folk att bada i sommar med Öppna Data! (Tips och hjälp behövs):
Tingsryd kommun verkar ha den typ av kallbad du syftar på... kollar vi på Open Street Map så saknas den info se relation/10701080
Som Wikipedia och andra communities fungerar så saknar man ett sätt att beskriva en sak så får man gå in och beskriva vad man vill ha så får man sedan se hur resten av dom som skapar saker reagerar på det. Kollar du på Tag:amenity public_bath så finns många kombinationer av bad.... där folk har kommit överens att det skall beskrivas....
@josefinlassi Du är hjärtligt välkommen att skapa ett OSM-konto och lägga till i Wikin om du kommer på nått bra sätt att etikettera den här typen av bad. Sen är det bara att ändra relationen ifråga https://www.openstreetmap.org/relation/10701080 -> logga in -> lägg till din nya etikett. Efter några minuter går den att söka på via Overpass för alla.
Inget av detta kräver programmeringskunskap. Dock kan det kräva lite att lära sig att redigera i en wiki om det är första gången och likaså med redigeraren på osm.org som f.ö. har en bra nybörjarguide som starter automatiskt
-
@dennis_priskorn Jag ska fundera på om jag kommer på någon bra beskrivning och om jag isf hinner försöka lägga in det. Tror att det kan bli lite knöligt, för dom "kallbad" som jag tänker på kan liksom vara ett ställe längs en älv (där isen aldrig fryser), eller nåt ställe där någon brukar såga upp en vak... så det är kanske inte någon vidare struktur eller långsiktighet för dom badställena:)
-
@josefinlassi testa gärna med andra saker om detta är för för svårt.... det är denna dialog vi måste ha mellan konsumenter av data och leverantörer.... det viktiga är att vi hittar ett agilt arbetssätt med dialog (hör min reflektion i Bonn 2018 på konferansen Semantic Web in Libraries)
Min erfarenhet är att man måste göra detta genom dialog. WIkidata startade 2012 och ingen skulle kunnat räkna upp vilka egenskaper vi skulle ha 2012. Idag 2021 har vi > 9000 egenskaper och 1000 ggr mer dialog än jag ser med öppen data i Sverige
- senaste skapade externa egenskaper
- senaste övriga https://w.wiki/3CyA
Dennis som är en doer av guds nåde skapade nu en karta med data från Open Street Map med vindskydd och grillplatser GITHUB där DIGG kan ha sin nästa kickoff kring Sundsvall
- jag som kommer från gnällbältet undrade direkt varför har vi inte allt data om handikappanpassade bad på en karta från OSM och lika snyggt som Öppen data
- varför har vi inte handikappanpassade bad med arabisk beskrivning se MKG (Multilingual Knowledge Management)
- när ett vindskydd som drivs av kommunen ser ut som man rapporterar i FB borde det inte finnas öppen data som gör att man vet var man kan rapportera in detta och att status finns om vindkyddet repareras eller annars tas direkt bort från kartorna/öppen data..... kan Facebook visa vilken frukost alla käkar borde vi kunna hantera vindskydd/bad/bajamajor/toaletter/utegym....
-
@salgo60 Kul att du gillar den. Jag vill bara inflikade att det är fullt möjligt att göra en arabisk/svensk/romani version av kartan. All text i popuppen kan anpassas. I dagsläget är det bara på engelska för att det är arbetsspråket i OSM, men det skulle säkert gå att dynamiskt översätta allt via Wikidata leksemer eller openstreetmaps strukturerade data i wikin.
-
verkar som detta diuskuteras även på "community.entryscape.com", det galna i denna kråksång är att en spec skapats på "Dela digitalt https://deladigitalt.se/delameddig?visakort=1568" som är en sluten website dit inte alla kan registrera sig....
-
@salgo60 jag skulle gärna testa, men dagarna fylls upp väldigt snabbt, så det finns knappt tid att "producera" dom saker som jag måste göra, så det blir redan en hel del kvällsarbete redan. Jag skulle gärna ha en klon:)
-
@salgo60
Ursäkta om det blivit rörigt och otydligt från min sida, det var verkligen inte meningen - jag sökte helt enkelt bred träffyta och publicerade på tre olika platser.
Specifikationen är inte skapad på Dela Digitalt, det är ett delat inlägg där, som beskriver ungefär det jag skriver i mitt första inlägg på det här forat.
Det är samma dokument, alltså GoogleDocs-dokumentet som utgör specifikationen.På Dela Digitalt står det bara "Jag behöver hjälp, läs det här dokumentet och kommentera".
-
ok men dela gärna och jag ger dig samma tips att testa att lägga till saker på Open Street Map för att lära dig hur dom jobbar.... min magkänsla är att även fast det är en öppen och spretig community som de flesta öppna grupper är så har dom > 18 års erfarenhet att snacka ihop sig och lyckats styra "skutan" så att även jättar som Apple använder deras data mer och mer....
Min magkänsla är idag fungerar ingenting med svensl Öppen data. När jag läser "Specifikation för leverantörsreskontra klar " så är det 15 fält som finns definierade och första utkast skapades 2019-09-05 dvs. det har tagit > 19 månader att definiera 15 rel. självklara fält... jmf vi det med Wikidata som har > 9000 egenskaper så skulle detta ta > 9000 man månader...
Det behövs nog att alla ser sig omkring och lär sig mer och att någon ser till att saker inte dyker upp efter 19 månader.....
-
@salgo60 fick tips om Tillgänglighetsdatabasen dvs. data som publiceras om badplatser bör anpassas så Tillgänglighetsdatabasen kan använda det... söker jag bad fås 98 svar vilket känns som detta är en grupp i samhället som kommuner etc borde göra det enklare för.... där bra öppen data är en variant
Det borde även skapas
- checklistor att då man publicerar nya datamängder inte missar
- Tillgänglighetsdatabasen
- att data fungerar med Open Street Map
- ?!?!?!
- checklistor att då man publicerar nya datamängder inte missar
-
@salgo60 den observante kan ovan se i sökningen varför man skall ha kunskapsgrafer som även hjälper dig vid sökning att hitta rätt....
-
söker jag bad så fås träff "Återvinningsstation .... vid Askimbadet" dvs. den posten handlar om Återvinningsstationen och är inte det jag letar efter och skall inte dyka upp....
-
bra enkel video på 5 min om Linked data med exempel att söka på "Venus"
-
-
@salgo60
Tack för input, mycket matnyttigt men det snurrar lätt med all feedback som jag fått. Om vi förenklar enormt - kan det räcka med om jag har med fält i datamängden som refererar till OSM - räcker det med ett fält som pekar på just det objektet som utgör badplatsen? (exempelvis /way/688795404 för Hattarevikens badplats?)Detsamma för Wikidata - kan det räcka med ett fält som pekar på en Q-kod på Wikidata eller måste båda dessa referenser beskrivas som arrayer som kan hålla flera arrayer?
Funderar på om någon av er @salgo60 @josefinlassi @Dennis_Priskorn har någon idé om hur jag kan skapa upp unika identifierare för varje rad i datamängden, genom ett system som kan delas av alla dataproducenter och säkrar att de blir unika - jag har funderat över ett datumbaserat system, kombinerat med kod för kommun eller motsv?
Kommunkod + år + månad + dag + eget löpnummer eller nåt sånt? Eller ska man återanvända något kring NUTS-kod från Eurostat eller nåt sånt för att få koppling till geografi? Det är viktigt att ha en unik identifierare per rad känner jag som dels är beständig och som säkrar att det inte uppstår dubletter eller att de återanvänds om en plats tas bort.
-
@tomasmonsen Jag är lite sen till partyt här, men har följt er diskussion ett tag. När det gäller stabila identifierare så tänker jag personligen att det finns något bakomliggande system där informationen om badplatsen bor. Detta system blir då det som skapar/äger identiteten och den bör därför utformas så att den kan användas för att hitta tillbaka till just den "registerposten" i källsystemet. En metod för namngivningen kan till exempel vara någon form av namespace som se.toreboda.anlaggningar.badstrand.217. Att däremot blanda in datum och tid i namnet känns inte helt naturligt för mig.
-
Jag är inne på lite liknande frågor som dem @tomasmonsen ställer.
Om man skapar egna utsagor om något, ska man då också skapa unika resurs-identifierare för utsagorna.
Finns det någon offentlig vägledning kring sådant med konkreta exempel?
Är det administrativt betungande inbegripande registrering av domännamn, eller kan man lättvindigt generera universellt unika ID:n som andra kan referera till?