Community på Sveriges dataportal
Hur man kan använda Wikidata
-
Detta inlägg är raderat!
-
Detta inlägg är raderat!
-
Detta inlägg är raderat!
-
Detta inlägg är raderat!
-
Detta inlägg är raderat!
-
En före detta användarereplied to En före detta användare on Senaste redigerad av En före detta användare
FYI: Wikidata skapar nu en plattform för att hantera mismatch mellan data i Wikidata och externt data se Wikidata:Mismatch_Finder
Fråga: har SCB en ändringsprocess för fel i datat? och hur rapporteras till den? var ser man bäst skillnad om en uppdatering publiceras, vilken som är aktuell version av datat?
Wikidata är en öppen plattform --> att alla kan ändra så vi ör beroende av bra extern data som vi hela tiden kan jämföra Wikidatas data med (för att upptäcka ex. vandalisering). Jag har hemsnickrat några Notebooks för Nobelprize.org, Svenska akademin, SKBL.... och det finns andra som gjort liknande men mig veterligen finns ingen samordning på detta men det är dit jag hoppas Wikidata vill....
En annan spännande utveckling som jag pratade kort med SCB om är att vi Wikipedia blir mer data drivet iom ett nytt projekt Abstract Wikipedia där tanken är att vi bättre än idag skall skala och kunna skriva en artikel en gång i ett "metaspråk" som sedan publiceras på flera 100 språk....
- exempel eran Kommun i Siffror där vi nu länkar er på > 1400 ställen på svenska Wikipedia medans engelska Wikipedia som är en av världens 20 största webplatser endast länkar SCB 3 ggr
- om ni levererade data/sidor på engelska skulle kunna länkas från en:Wikipedia som ofta har fler läsare än svenska Wikipedia
- jämförelse Solna kommun där vi har artiklar på 52 språk och antalet läsare i år är 54 742 på en:Wikipedia medans sv:Wikipedia har 29 761 länk statistik
- om ni levererade data/sidor på engelska skulle kunna länkas från en:Wikipedia som ofta har fler läsare än svenska Wikipedia
Ps. Wiki världen är enormt spretig och olika personer gör olika saker med väldigt lite samordning så förvänta er inte att om ni pratar med en person att övriga vet om denna dialog, i bästa fall hamnar saker i en backlog se sökning SCB i Phabricator som visar lite vad som gjorts med SCB...
- exempel eran Kommun i Siffror där vi nu länkar er på > 1400 ställen på svenska Wikipedia medans engelska Wikipedia som är en av världens 20 största webplatser endast länkar SCB 3 ggr
-
@Magnus-Sälgö Off topic för min fråga, men jag ska försöka svara. Både arkivinstitutionen (Landsarkivet i Härnösand) och depå (Kusthöjden 46) är auktoritetsposter. Jag ser i databasen att arkivet är kopplat till Landsarkivet i Härnösand, men inte omedelbart var kopplingen till Kusthöjden 46 finns. I RDF-representationen kommer nog bägge att finnas med när den är komplett.
Arkivinstitution med schema:holdingArchive
Depå måste jag reda ut mer om för att veta vad för property -
Detta inlägg är raderat!
-
@Magnus-Sälgö Tveklöst så kommer det mesta innehållet i API:er från offentliga organisationer vara på svenska. Sen tror jag inte att det offentliga ska försöka sig på att värdera hur bra språk en individ behöver för att förstå. Mer binärt konstatera vilket språk något är utryckt i. Men just API:er tycker jag är svårt, vacklar själv i denna fråga. Är nog bra att vi resonerar om det här.
-
@jonass ett "problem" vi har i Wikidata där poster mergas enormt mycket som är lite relaterat se SPARQL fråga vad som mergats senaste veckan som är kopplat till Europeana = 63 poster
dvs. 17 aug mergades Q106629593 versionshistorik med Q4767743 - versionshistorik
Problemet här är att om man har en Wikidata identifierare så kan man inte vara säker att det inte är samma objekt som ett annat eftersom den kan ha mergats.... kan enkelt kollas med https://www.wikidata.org/wiki/Special:EntityData/Q106629593.json --> då redirektas till Q4767743
-
@Magnus-Sälgö fast att ta till sig materialet är inte något som t.ex. en utvecklare måste göra, man kan ju bygga tjänster på svenska även om man inte kan ett ord svenska, vilket underlättas när API:er och JSON-svars nycklar är på engelska oftast.
-
@jonass Ja, jag håller med om att språkvalet är klurigt. Det är frestande att säga "engelska", över hela linjen, men det innebär att en mängd verksamhetsbegrepp måste översättas. Min erfarenhet är att dessa översättningar ofta görs fritt av respektive utvecklarteam, vilket leder till svengelska och märkliga svenska "varianter" på översättningar. Ta t.ex. utbildningsområdet, det är inte självklart vad "arbetsplatsförlagt lärande" heter på engelska (som dessutom kan skilja sig mellan brittisk och amerikansk osv).
För många år sen ansåg staten att korrekta översättningar var viktigt och bl.a. utbildningsdepartementet lät ta fram en "Svensk-engelsk ordbok för utbildningsområdet". För att skapa korrekta informationsutbyten och API:er skulle vi behöva normativa ordböcker för resp. domän.
Om vi ser till hur data flödar i en organisation, så färdas begreppen genom ett antal integrationsgränssnitt och mellanprogramvaror. Det finns risker med att ett verksamhetsbegrepp som ursprungligen är på svenska översätts fram och tillbaka ett antal gånger.
-
@mistral och vad händer om ett begrepp delas upp....
tror Wikidatas modell med
- unika egenskapsnummer (uttalande)
- unika objekt id
- möjligt att merga objekt
- hantera alias --> bra för NER
kan hantera viss del av det kaos verkligen utgör....
-
@Magnus-Sälgö Kan nog vara en framkomlig väg. Jag tror på framgång med formella/kontrollerade språk. Varje domän har en specifik, begränsad nomenklatur svenska/engelska, som har en tydlig ägare. "Vem äger den?", kanske någon undrar. Tja...förslagsvis hanterar DIGG en ämnesindelad begreppskatalog, där resp. ansvarig myndighet skapar sin "Master Glossary of Terms".
-
Detta inlägg är raderat!