Community på Sveriges dataportal
Wikidata inom offentlig sektor
-
Hur kan offentlig sektor jobba med wikidata och på vilket sätt skapar det värde? Finns en vision och hur kan offentlig sektor designa sina lösningar för att skapa ett ekosystem där medborgare kan ta del av och bidra till våra data? Är wikidata en del av den lösningen?
Under denna NOSAD lunch-timme finns tillfälle att ställa barnets frågor och fundera över möjligheter och utmaningar.
Möt bl.a. @Maria-Söderlind, @mattias, @johanlinaker och i chatten @jonass.
Till bokning: https://www.goto10.se/event/wikidata-for-offentlig-sektor/
-
@Maria_Dalhage Var där eller var rektangulär!
Vi ses på tisdag lunch. -
@Nina_Berlin vi ses!
-
Här är blogginlägget som jag hämtade bilden i slutet ifrån.
Jag nämnde i chatten också Riksantikvarieämbetets tester med att hämta tillbaks data. Visserligen inte huvudsakligt fokus på Wikidata, men ändå relevant i sammanhanget: Wikimedia Commons Data Roundtripping.
-
@Maria_Dalhage Finns det några wikidata-initiativ kopplade till data spaces? Kompetensförsörjning och livslångt lärande, t ex?
Jag har stämt av vårt öppna data på CSN mot den där mognadstrappan som Tim Berners-Lee föreslår. Vad jag förstår verkar det som att vi får 3 stjärnor på det data vi delar eftersom vi använder PxWeb (tack SCB! ).
Vad skulle kunna vara nästa steg för oss? Finns det någonting befintligt vi skulle kunna titta på för inspiration? -
@Nina_Berlin Om vi gör en vid tolkning av begreppet dataområden så ser vi att exempelvis SCB jobbat en hel del med Wikidata. Bland annat bytte myndigheten för ett par år sedan datalicens till CC0 vilken möjliggör för vem som helst att använda datamängderna. https://wikimedia.se/2021/07/19/scb-byter-licens-pa-oppna-data-till-cc0/
Arbetsförmedlingens Jobtech har ett API med kompetensord och yrken och dessa har kopplingar till SCB:s bransch- yrkes och utbildningskoder.
För denna taxonomi sker det ett regelbundet kopplingsarbete, som förvaltningsmässigt hanteras av en en "redaktion" på Arbetsförmedlingen (Jobtech) i samverkan med branschorganisationer.
Eldsjälar som jag vill nämna med namn men inte vågar för att då strider jag mot forumets användarregler har kontaktat oss och laborerat med våra dataset. https://forum.jobtechdev.se/t/ssyk-egenskap-i-wikidata/164/7
-
Det fanns några Wikibase som nämndes här i forumet tidigare som kan fungera som exempel på nivå fem. Typ
https://oswald.wikibase.cloud/wiki/NOSAD-POC
https://sweopendata.wikibase.cloud/wiki/Main_Page -
@Maria_Dalhage här hittar ni inspelningen https://nosad.se/workshops
-
@Nina_Berlin sa i Wikidata inom offentlig sektor:
Jag har stämt av vårt öppna data på CSN mot den där mognadstrappan som Tim Berners-Lee föreslår. Vad jag förstår verkar det som att vi får 3 stjärnor på det data vi delar eftersom vi använder PxWeb (tack SCB! ).
Vad skulle kunna vara nästa steg för oss? Finns det någonting befintligt vi skulle kunna titta på för inspiration?Som @VisbyStar nämnde finns på oswald.wikibase.cloud ett försök att strukturera upp data om evenemang och presentationer från NOSAD.
https://oswald.wikibase.cloud/wiki/NOSAD-POC
Entiteter som organisationer och presentationer har unika ID för referens, och de är också länkade till andra källor.
Därmed är kriterier för 5-star data uppfyllda.Exempel
- Presentation (länkar till organisation och session)
https://oswald.wikibase.cloud/wiki/Item:Q251 - Organisation (länkar ut via org.nr och lite annat)
https://oswald.wikibase.cloud/wiki/Item:Q27 - Session/evenemang (länkar ut till mediafil eller videotjänst).
https://oswald.wikibase.cloud/wiki/Item:Q180
Datan är hämtad från nosad.se/workshops och nosad.se/organisationer, som väl i dagsläget kan klassas som 1-star data.
Det har därmed krävts ganska mycket tid och jobb för att ordna källdatan som utgörs av ostrukturerad text på en webbplats.
Det finns en förfrågan om att strukturera upp informationen redan vid källan, vilket är väsentligt för att bespara arbete för vidare användning.https://gitlab.com/open-data-knowledge-sharing/open-data-knowledge-sharing.gitlab.io/-/issues/2
Strukturerad data för nosad.se workshops
Dec 2, 2022 10:45pm GMT+0100 - Presentation (länkar till organisation och session)
-
@Nina_Berlin sa i Wikidata inom offentlig sektor:
vi har tydligen varit 4 star tills relativt nyligen, men våra metadataspecar strular lite
Berätta gärna lite mer om det, vad är det för metadata?
-
@jonor Vi delar 10 datamängder med hjälp av PxWeb:
CSNs datamängderDatamängderna finns alltså tillgängliga i CSV-format, vilket ger oss 3 stjärnor.
Fram tills ganska nyligen hade vi också DCAT-AP-SE-specar för de här datamängderna uppladdade i nationella förteckningen, men de specarna fungerar inte som de ska just nu. Jag vet inte exakt varför, jag tror vi kanske har en mismatch. Arbete pågår för att rätta till det här så vi kan få tillbaka vår fjärde stjärna.
-
@Nina_Berlin Ok, det står ju en del om datamängderna på dataportalen, antar den informationen kommer från insamlad metadata.
PxWeb upplever jag som ganska svåröverskådligt, man möts av en enorm lista över "tabeller" med kombinationer av nästan samma fält i första steget, och varför är tabellerna ordnade i en hierarki enligt vissa värdeserier? Det är svårt att förstå strukturen och urskilja det essentiella i datan tycker jag.
-
@jonor Menar du PxWeb i allmänhet, eller just CSNs användning av PxWeb?
Om det är PxWeb i allmänhet kan du starta en tråd här och pinga in SCB för att diskutera verktyget, så kan de använda det i sin behovsfångst. @Maria_Dalhage
Om det är CSNs användning av PxWeb kan jag ta med mig frågan internt om du vill, jag jobbar inte själv med det men jag jobbar med dem som gör det. -
@Nina_Berlin Svårt för mig att säga hur mycket som har att göra med CSN:s tillämpning.
Jag tycker det blir enklare om man får se en översikt över innehållet innan man tvingas göra en massa konfigurationer för den data man vill ha ut.Är dessa t.ex. olika datamängder eller är det urval ur samma datamängd?
- Studiemedel för studier i Sverige och utomlands
- Studiemedel för studier utomlands
- Studiemedel för studier i Sverige
Väljer jag i dataportalen "Åtkomst" för den förstnämnda kommer jag till en sida med rubriken Officiell statistik inom området studiestöd och en uppmaning "Välj tabell" från en omfattande trädstruktur jag ska navigera mig ned i.
- Utbetalning och beviljning av studiestöd
- Kalenderår
- Studiehjälp
- Studiemedel
- Studiemedel för studier i Sverige
- Studiemedel för studier i Sverige och utomlands
- Studiemedel för studier utomlands
- Studiestartsstöd
- Lärlingsersättning
- RG-bidrag
- Utländska medborgare
- Kalenderhalvår
- Studieår
- Studiehalvår
- Läsår
- Kalenderår
- Studieskulder och inbetalning av studiestöd
Väljer jag Kalenderår > Studiemedel för studier i Sverige och utomlands så finns därunder en lista med kombinationer av olika kolumner.
- Studiemedel Sverige och utland efter Stödform, Skolform, Utbildningsnivå, Kalenderår, Kön och Antal personer, Utbetalt beloppUppdaterad: 2023-01-20
- Studiemedel Sverige och utland efter Stödform, Skolform, Utbildningsnivå, Ålder vid årets slut, Kalenderår, Kön och Antal personer, Utbetalt beloppUppdaterad: 2023-01-20
- Studiemedel Sverige och utland efter Stödform, Bidragsnivå, Kalenderår, Kön och Antal personer, Utbetalt beloppUppdaterad: 2023-01-13
- Studiemedel Sverige och utland efter Skolform, Bidragsnivå, Kalenderår, Kön och Antal personer, Utbetalt beloppUppdaterad: 2023-01-27
- Studiemedel Sverige och utland efter Stödform, Folkbokföring län/kommun, Kalenderår, Kön och Antal personer, Utbetalt beloppUppdaterad: 2023-01-13
- Studiemedel Sverige och utland efter Stödform, Folkbokföring län, Kalenderår, Kön och Antal personer, Utbetalt beloppUppdaterad: 2023-01-13
- Studiemedel Sverige och utland efter Skolform, Folkbokföring län/kommun, Kalenderår, Kön och Antal personer, Utbetalt beloppUppdaterad: 2023-01-13
- Studiemedel Sverige och utland efter Skolform, Folkbokföring län, Kalenderår, Kön och Antal personer, Utbetalt beloppUppdaterad: 2023-01-13
- Studiemedel Sverige och utland efter Utbildningsnivå, Folkbokföring län/kommun, Kalenderår, Kön och Antal personer, Utbetalt beloppUppdaterad: 2023-01-13
- Studiemedel Sverige och utland efter Utbildningsnivå, Folkbokföring län, Kalenderår, Kön och Antal personer, Utbetalt beloppUppdaterad: 2023-01-13
- Studiemedel Sverige och utland efter Stödform, Studietakt, Bidragsnivå, Ålder vid årets slut, Kalenderår, Kön och Antal personer, Utbetalt beloppUppdaterad: 2023-01-24
I den listan så förekommer total 10 fält, varav 3 är lika för varje tabell och 7 varierar mellan tabellerna:
- Skiljer sig:
- Stödform
- Skolform
- Utbildningsnivå
- Ålder vid årets slut
- Bidragsnivå
- Folkbokföring län/kommun
- Folkbokföring län
- Studietakt
- Gemensamma fält
- Kalenderår
- Kön och Antal personer
- Utbetalt belopp
De huvudsakliga dimensionerna i hierarkin är nog också färre än vad listan ger intryck av.
- Utbetalning och beviljning av studiestöd
- Studieskulder och inbetalning av studiestöd
- Serie/period
- Aggregering tid
- Kalenderår
- Kalenderhalvår
- Studieår
- Studiehalvår
- Läsår
- Annuitetslån
- Studielån
- Studiemedel
- Återkrav av studiestöd
- Övrigt
Det jag undrar är varför kan jag inte på ett mer direkt vis kan välja och söka ut de dimensioner och fält som är intressanta istället för att navigera mig igenom en komplicerad hierarki av långa listor med förvirrande kombinationer och upprepningar?
-
@jonor Nu har jag pratat med dem som tar fram den här statistiken, de svarar såhär:
"Databasen togs fram för att från och med år 2016 ersätta den statistik vi tidigare publicerat i tryck form och Excel-filer. Strukturen motsvarar i stort den som fanns i de tryckta publikationerna. Vi förstår synpunkten och fördelen att mer flexibelt ha samtliga variabler i en och samma tabell. För att komma dithän behöver vi dock göra om en hel del i hur vi tar fram underlaget, något som inte ligger i den närmaste planeringen. Vi får ta idén med oss inför framtida förändringar av databasen." -
@Nina_Berlin Tack för vidarebefordran och återkoppling iaf.