Community på Sveriges dataportal
Frågor om metadatakvalitet och ev bugg?
-
Detta diskuterades lite på https://community.entryscape.com/t/statistik-over-publicering-psi-datakollen/1421/9
Bäst verkar EDP vara aom anger på fältnivå... gissar att DIGG bara kopierat EDP
EDP har dock problem

Verkar som ni skall fokusera på
🧭 Dataset-nivå- dcat:keyword — nyckelord
- dcat:theme — kategori/tema
- dct:spatial — geografisk information
- dct:temporal — tidsperiod
- dct:accessRights — åtkomsträttigheter
- dcat:contactPoint — kontaktpunkt
- dct:publisher — publicerande organisation
- dct:issued — datum för publicering
- dct:modified — datum för senaste ändring
Distribution-nivå- dcat:accessURL — åtkomstlänk
- dcat:downloadURL — nedladdningslänk
- dct:format — filformat
- dcat:mediaType — MIME-typ
- dct:license — licensinformation
- dct:rights — rättigheter (om särskilda villkor gäller)
- dcat:byteSize — filstorlek i bytes
- dct:issued — publiceringsdatum
- dct:modified — ändringsdatum
🧩 Teknisk validering
- SHACL-validering mot DCAT-AP 3.0.0 — säkerställer formell kompatibilitet
-
Hittade ett verktyg som jag testade på Skövdes dataset #2 och började med Nobelpriset #3....
https://mjanez.github.io/metadata-quality-react/

- Du får per dataset feedback kvaliten
- Du kan enkelt skapa nya ttl versioner och testa vad som gör det bättre
- Bättrra data laddas upp på portalen och det känns som en perfect match med ChatGPT
- det finns bara stöd för spanska proilen DCAT-Aå-ES vet inte vad status är på svenska profiler vet att Norge har en variant DCAT.AP.NO och att saker diskuterades 2019
-
@Magnus-Sälgö Ja det verkar vara EDP.
Problemet med den är (verkar det som) hur DIGG väljer att tillämpa.
Tex dct:spatial kräver en koordinat-ruta över ett område för att "ge poäng".
En punkt som också är valbart i Entryscape ger inte poäng.
Om jag har en datamängd med tex mätningar vid ett visst område så fungerar inte punkten (om man vill få sina poäng).Samma med dct:temporal. Det avser ju en tidsperiod och det är ju relevant vid tex mätningar (partikelhalter period YYYY-MM-DD tom YYYY-MM-DD)
Men vad ska anges vid geodata? Den datan har ju ingen tidsperiod.
Har man mycket geodata så får man per definition "låg metadatakvalitet". -
@Andreas-Sundberg
dct:spatial- "controlled vocabulary or with geographic coordinates"tycker ni skall ange ex. https://www.wikidata.org/wiki/Q516336
Chatgpt

-
-
@Andreas-Sundberg kollade snabbt på ert data i dataportaln se #5
- har Södertälje kommun en egen SPARQL endpoint?
- SPARQL säger 207 dataset DIGG portalens websida säger 105 / sökning web
Fråga: vad är rätt
-
@Andreas-Sundberg här har du hur DIGGs 9 dataset och deras metadata #6 känns som dom kunde göra bättre..
Min sorg är att dom inte använder kontrollerade vokabulär något vi pratade om 2019




Dom har 2 smaker av dcterms:spatial
dcterms:spatial http://sws.geonames.org/2661886;


dcterms:spatial .... http://www.w3.org/ns/locn#geometry "POLYGON((-9.29 71.5,34.5 71.5,34.5 36,-9.29 36,-9.29

Metadata kvalitet inte data kvalitet...
Galet att efter 10 år med dataportalen att vi inte börjat kvalitetsbedömma datat jag skrev om det 2024

Kommuner och dataset
Kollade igenom en PSI-data lista jag skapade 2020 och dom som då hade en psidata katalog så har många 2025 inte blivit mer att peka på kolada eller tom med länkröra
-
M Magnus Sälgö referenced this topic on
-
@Andreas-Sundberg sa i Frågor om metadatakvalitet och ev bugg?:
@josefinlassi sa i Frågor om metadatakvalitet och ev bugg?:
Ok @Andreas-Sundberg Ja, vi är medvetna om att det är svårt att förstå hur metadatakvalitet räknas ut, och vad man kan göra för att få upp resultatet. Det är fler som har påpekat det. Så du har helt rätt i att det behövs en insats från oss i att förtydliga det. Status är att frågan ligger i våran backlogg men att vi har varit tvungna att prioritera annat ett tag (bl.a. besvara mätningar från bl.a. både EU och OECD, remisser, uppstart av regeringsuppdrag mm). Och jag tror inte att det bara är en snabbfix som behöver göras kring MQA, utan antagligen ett lite större arbete. Vi skulle kunna bjuda in till ett möte om MQA för att reda lite mer i problembilden. Jag kan tyvärr inte säga exakt när det skulle kunna ske.
@josefinlassi Ja det var bara det här jag ville veta. Att det finns i en backlog och att det är planerat att åtgärdas.
Jag är gärna med på ett möte kring det så snart det finns tid och möjlighet hos er.Jag är gärna också med på ett sånt möte, då jag irriterar mig på att jag inte når högre i kvalitet på min metadatabeskrivning trots att jag tycker att jag "har gjort allt". Det är OK att jag inte leder, däremot vill jag veta varför jag inte leder.

Har kört vår katalog i omgångar mot europeiska dataportalens valideringstjänster och får en del märkliga fel som jag tror är enkla att åtgärda, som är svåra att åtgärda och som jag inte förstår vad de betyder...
-
Om mötet blir av så diskutera gärna dcterms:publisher
idag
- identifieras DIGG med SE2021006883
- PTS med SE2021004359
Utmaningen är att dcterms:publisher inte är stabil över tid om organisationen förändras, byter namn eller – som nu – slås ihop med en annan myndighet.
Vad händer när PTS och DIGG slås ihop med dcterms:publisher
Ett scenario när PTS och DIGG går ihop:
- de kommer troligen att få samma gemensamma organisationsnummer.
- därmed kommer både tidigare PTS- och DIGG-metadata peka på en enda ny organisation via dcterms:publisher.
- historisk koppling till vem som faktiskt publicerade en datamängd riskerar att försvinna.
- system som förlitar sig på dcterms:publisher som nyckel får plötsligt ambiguitet och risk för datakorruption.
se tankar om detta när nu PTS och DIGG troligen slås ihop och kommer att ha samma organisationsnummer

-
Relaterat diggsweden/persistent-identifiers-investigation och diskussionen i “Tillåt organisationsnamn som domännamn i beständiga identifierare”
: inför den förväntade sammanslagningen känns det helt fel att använda verksamhetsnamn och organisationsnummer som delar av beständiga identifierare....#Göromgörrätt
Svensk standard för persistenta myndighetsidentifierare (SMPID) -
M Magnus Sälgö referenced this topic
-
Mer om hur fel det är att använda organisationsnummer som dcterms:publisher och att SFS 2007:755 inte definierar en persistent unik identifierare för myndigheter länk










