Data och API:er
-
@Maria_Dalhage Jag har en synpunkt som främst riktar sig till dataproducenterna. Det är bra om man döper sin datamängd, begreppsmängd, terminologi eller specifikation till något bra så träfflistan för våra tre sök blir lätt att tolka vid första ögonkastet.
Sedan har jag en synpunkt till oss själva och det är att vi kanske behöver se över våra riktlinjer till producenterna vad beträffar den här namnsättningen? -
@Nina_Berlin Tänker att det är viktigt att kunna filtrera ut API:er. Men hur det benämns i sökrutan ser jag mer som en UX-fråga, har ingen speciell synpunkt på benämning.
En sökfunktion som enbart opererar på datasetets eller API:et namn blir i sin natur ganska begränsad.
Varje dataset på dataportalen kan taggas med metadata ("nyckelord"). Att på ett systematiskt sätt tagga dataseten (@Magnus-Sälgö har snokat fram en standard) tror jag skulle ge mest effekt i sökningar.
-
@jonass Behöver vi göra en förändring i DCAT-AP-SE-specen för att åstadkomma det här? Eller kan vi lösa det med ren UX?
-
@Nina_Berlin Redan nu kommer ju nyckelorden med i "skördningsfilen" (a la dcat-ap-se) till dataportalen. Jag gjorde ett testskott och sökte på ett nyckelord från en av Umeås datamängden. Ett nyckelord som inte fanns med i namnet på datamängden. Den datamängd jag var ute efter dyker upp i sökresultatet
Min uppfattning är att sökfunktionen funkar bra redan idag. -
@Jonas-Nordqvist sa i Data och API:er:
Sök datamängd
Ingen som har några synpunkter på mitt förslag på att byta namn från "Sök data & API" till "Sök datamängd"?
-
@Jonas-Nordqvist Har som sagt ingen stark åsikt. Men tycker nog dagens formulering fungerar bra.
-
@jonass Så är fallet, men det var inte så det var tänkt. Och i dagsläget är det ju inga problem att hitta. Problemet är snarare att det finns för lite att söka efter. Den stora diskussionen på forumet är ju att det saknas datamängder och inte brister i att hitta dom. Men man kanske borde ta tag i själva portalen så att den blir lite användarvänligare idet fallet fler datamängder tillkommer. Just nu är det lite latjolajban.
-
@Jonas-Nordqvist Jag begriper sök datamängd, men när jag söker på ngt så kommer även begrepp och specifikationer upp i mina träffar. Genom att klicka i API:er slipper jag det som inte är data. I övrigt har jag inga synpunkter.
-
@Maria_Dalhage Inte så bra att begrepp och specifikationer kommer med när du söker efter datamängd. Och workarounden att klicka i API gör väl att du även filtrerar bort datamängder som som inte har API.
-
@Jonas-Nordqvist Men söker du på "utegym" så kommer bara datamängder upp. Inga specifikationer. Så jag förstår inte riktigt hur du söker.
Sen när man klickar i API så försvinner 6 st av utegymsträffarna. Bland annat Stockholms stads "Utegym ur Hitta Service API)". Och även Lommas som har JSON, men det kanske inte är det som triggar vad som är API eller inte?
-
@Jonas-Nordqvist jag tror att det kan finnas ett behov att se över ux-upplevelsen tillsammans med dataanvändare och dataproducenter. Dataportalen har funnits ett par år nu så det är väl dags att fånga in feedback och göra relevanta justeringar. Så toppen att du tycker till. I samband med att Dataportalen från ett nytt utseende och expanderas nästa vecka så är timing för feedback klockren, eller hur @Nina_Berlin
-
Jag ser att det kommit bra synpunkter och förbättringsförslag, så väljer att passa på att informera lite om det som ligger "under huven" och det som ni som dataproducent ansvarar för som påverkar möjligheterna att söka och hitta resurser.
Dataportalen visar upp data som är beskriven och tillgängliggjord enligt de tekniska krav som är specificerad under https://docs.dataportal.se/dcat/ . Dessa beskrivningar kallas metadata och följer en gemensam metadataspecifikation, så att de är enhetliga och kan hanteras automatiskt och maskinellt för dataportalen. Både datamängder och API:er kan beskrivas med metadata. Ibland kan man få åtkomst till en datamängd på flera olika sätt, t.ex genom flera filer i olika format och ett gränssnitt/tjänst/API. Dessa kallas distributioner. För fördjupning om distributioner, API:er m.m. kopplat till metadatabeskrivningarna läs här och här.
Ibland krävs det eftertanke hur man beskriver just sin datamängd, tidsserie, API, m.m. på bästa sätt. Data i dess olika former, tillämpningsområden och sektorer är ibland komplexa ting och behoven om hur och vad som ska kunna beskrivas kan variera. Därför lutar vi oss på EU:s rekommendationer som i sin tur bygger på W3C.
@Jonas-Nordqvist sa i Data och API:er:
Sen när man klickar i API så försvinner 6 st av utegymsträffarna. Bland annat Stockholms stads "Utegym ur Hitta Service API)". Och även Lommas som har JSON, men det kanske inte är det som triggar vad som är API eller inte?
I det fallet har ni sannolikt inte märkt upp i metadata att det är ett API. Vissa systemstöd för datapublicering har ännu inte implementerat stöd för API-beskrivningar, vilket också kan förklara varför API:erna "försvinner".
@Nina_Berlin sa i Data och API:er:
Det är bra om man döper sin datamängd, begreppsmängd, terminologi eller specifikation till något bra så träfflistan för våra tre sök blir lätt att tolka vid första ögonkastet.
Sedan har jag en synpunkt till oss själva och det är att vi kanske behöver se över våra riktlinjer till producenterna vad beträffar den här namnsättningen?Här är de rekommendationer som vi hittills har tagit fram gällande namnsättningar och för användning av tema och nyckelord . Man ska dessutom översätta fritextfält som titel och beskrivning till åtminstone engelska, och komma ihåg att märka upp med språkangivelse pga webbtillgänglighet.
-
@Maria_Dalhage Japp, vi borde göra en guide för datakonsumenterna. Hittills har vi av naturliga skäl främst fokuserat på dataproducenterna, eftersom vi behöver få in datamängder till konsumenterna.
-
@Nina_Berlin @Kristine_ @Maria_Dalhage https://data.norge.no/specification/dcat-ap-no#Krav-til-kontrollerte-vokabularer i Norge verkar det vara mer strikt hur ord rapporteras. Tips från @Magnus-Sälgö som verkar intressant att följa upp.
-
@jonass Och dom har även förstått vad jag menar angående separation av datamängder och API...
-
@Jonas-Nordqvist jag tolkade fel i mitt sökresultat och du har rätt. API-boxen exkluderar övriga dataformat. Naturligtvis blir det missvisade.
-
@jonass sa i Data och API:er:
https://data.norge.no/specification/dcat-ap-no#Krav-til-kontrollerte-vokabularer i Norge verkar det vara mer strikt hur ord rapporteras
Vad jag kan se är det samma kontrollerade vokabulärer som dataportalen använder och som bygger på EU:s rekommendationer: https://docs.dataportal.se/dcat/sv/ , se till vänster längst ned ser du de vokabulärer. Men kanske har de gjort någon utvidgning som inte jag ser på rak arm. Det är en viktig och aktuell fråga om ytterligare kontrollerade vokabulärer ska tas in, men det är en avvägning om och isåfall hur långt den nationella anpassningen ska avvika från den europeiska. Vi har resonerat hittills att vi så långt det är möjligt göra en nära anpassning, så att Sverige inte börjar divergera från resten av EU.
För att tillgängliggöra stabila vokabulärer på ett maskinläsbart sätt så erbjuds "Begreppstjänsten" på dataportalen. Idag ligger många centrala begreppslistor i PDF:er eller i inlåsta system tyvärr och det hindrar möjligheterna att de nyttjas i ekosystemet bland dataanvändare och dataproducenter. Begrepptjänsten på dataportalen erbjuder stöd för att tillgängliggörande och återanvändning av dessa begrepp. Läs gärna mer om begreppstjänsten och varför det är viktigt för datadelning och interoperabilitet här. Där kan ni även läsa om hur central terminologihantering på Sveriges dataportal öppnar upp för ett mer komplett sök och navigeringsstöd för datamängder.
-
@Jonas-Nordqvist sa i Data och API:er:
@jonass Så är fallet, men det var inte så det var tänkt. Och i dagsläget är det ju inga problem att hitta. Problemet är snarare att det finns för lite att söka efter. Den stora diskussionen på forumet är ju att det saknas datamängder och inte brister i att hitta dom. Men man kanske borde ta tag i själva portalen så att den blir lite användarvänligare idet fallet fler datamängder tillkommer. Just nu är det lite latjolajban.
Jag skulle säga att det största problemet inte har att göra med att dela data utan att kvaliteten när datan väl delas är så låg att det knappt är värd min tid och möda och att utsikterna till dialog med de som underhåller och utvecklar datamängder hos myndigheterna är icke-existerande i dagsläget
️
Jag tar hellre lite bra data än mycket värdelösa datasilon på nivå1-3 som kastas upp likt kräk och sen inte går att begripa sig på, inte går att läsa med maskin och inte går att lita på att någon faktiskt äger och bryr sig om.
-
Kunde inte uttryckt det bättre. Tycker även Fia Ewald talar klarspråk.
Öppna data idag är mycket publicering för publiceringens skull, mäts efter antal datamängder, antal deltagare i workshops mm.
-
@mistral Tack för länken! Digitaliseringsstrategin som länkas i artikeln gav 404 hos regeringen. Det i sig säger väldigt mycket om hur det går med samordningen och kvaliteten i arbetet kanske?
Här finns den arkiverat: https://web.archive.org/web/20220728071334/https://www.regeringen.se/49adea/contentassets/5429e024be6847fc907b786ab954228f/digitaliseringsstrategin_slutlig_170518-2.pdf (i juli i år, dvs länken dog därefter)