Community på Sveriges dataportal
Frågor om metadatakvalitet och ev bugg?
-
Detta diskuterades lite på https://community.entryscape.com/t/statistik-over-publicering-psi-datakollen/1421/9
Bäst verkar EDP vara aom anger på fältnivå... gissar att DIGG bara kopierat EDP
EDP har dock problem

Verkar som ni skall fokusera på
🧭 Dataset-nivå- dcat:keyword — nyckelord
- dcat:theme — kategori/tema
- dct:spatial — geografisk information
- dct:temporal — tidsperiod
- dct:accessRights — åtkomsträttigheter
- dcat:contactPoint — kontaktpunkt
- dct:publisher — publicerande organisation
- dct:issued — datum för publicering
- dct:modified — datum för senaste ändring
Distribution-nivå- dcat:accessURL — åtkomstlänk
- dcat:downloadURL — nedladdningslänk
- dct:format — filformat
- dcat:mediaType — MIME-typ
- dct:license — licensinformation
- dct:rights — rättigheter (om särskilda villkor gäller)
- dcat:byteSize — filstorlek i bytes
- dct:issued — publiceringsdatum
- dct:modified — ändringsdatum
🧩 Teknisk validering
- SHACL-validering mot DCAT-AP 3.0.0 — säkerställer formell kompatibilitet
-
Hittade ett verktyg som jag testade på Skövdes dataset #2 och började med Nobelpriset #3....
https://mjanez.github.io/metadata-quality-react/

- Du får per dataset feedback kvaliten
- Du kan enkelt skapa nya ttl versioner och testa vad som gör det bättre
- Bättrra data laddas upp på portalen och det känns som en perfect match med ChatGPT
- det finns bara stöd för spanska proilen DCAT-Aå-ES vet inte vad status är på svenska profiler vet att Norge har en variant DCAT.AP.NO och att saker diskuterades 2019
-
@Magnus-Sälgö Ja det verkar vara EDP.
Problemet med den är (verkar det som) hur DIGG väljer att tillämpa.
Tex dct:spatial kräver en koordinat-ruta över ett område för att "ge poäng".
En punkt som också är valbart i Entryscape ger inte poäng.
Om jag har en datamängd med tex mätningar vid ett visst område så fungerar inte punkten (om man vill få sina poäng).Samma med dct:temporal. Det avser ju en tidsperiod och det är ju relevant vid tex mätningar (partikelhalter period YYYY-MM-DD tom YYYY-MM-DD)
Men vad ska anges vid geodata? Den datan har ju ingen tidsperiod.
Har man mycket geodata så får man per definition "låg metadatakvalitet". -
@Andreas-Sundberg
dct:spatial- "controlled vocabulary or with geographic coordinates"tycker ni skall ange ex. https://www.wikidata.org/wiki/Q516336
Chatgpt

-
-
@Andreas-Sundberg kollade snabbt på ert data i dataportaln se #5
- har Södertälje kommun en egen SPARQL endpoint?
- SPARQL säger 207 dataset DIGG portalens websida säger 105 / sökning web
Fråga: vad är rätt
-
@Andreas-Sundberg här har du hur DIGGs 9 dataset och deras metadata #6 känns som dom kunde göra bättre..
Min sorg är att dom inte använder kontrollerade vokabulär något vi pratade om 2019




Dom har 2 smaker av dcterms:spatial
dcterms:spatial http://sws.geonames.org/2661886;


dcterms:spatial .... http://www.w3.org/ns/locn#geometry "POLYGON((-9.29 71.5,34.5 71.5,34.5 36,-9.29 36,-9.29

Metadata kvalitet inte data kvalitet...
Galet att efter 10 år med dataportalen att vi inte börjat kvalitetsbedömma datat jag skrev om det 2024

Kommuner och dataset
Kollade igenom en PSI-data lista jag skapade 2020 och dom som då hade en psidata katalog så har många 2025 inte blivit mer att peka på kolada eller tom med länkröra








