-
@Magnus-Sälgö Off topic för min fråga, men jag ska försöka svara. Både arkivinstitutionen (Landsarkivet i Härnösand) och depå (Kusthöjden 46) är auktoritetsposter. Jag ser i databasen att arkivet är kopplat till Landsarkivet i Härnösand, men inte omedelbart var kopplingen till Kusthöjden 46 finns. I RDF-representationen kommer nog bägge att finnas med när den är komplett.
Arkivinstitution med schema:holdingArchive
Depå måste jag reda ut mer om för att veta vad för property -
Detta inlägg är raderat! -
-
@Magnus-Sälgö Tveklöst så kommer det mesta innehållet i API:er från offentliga organisationer vara på svenska. Sen tror jag inte att det offentliga ska försöka sig på att värdera hur bra språk en individ behöver för att förstå. Mer binärt konstatera vilket språk något är utryckt i. Men just API:er tycker jag är svårt, vacklar själv i denna fråga. Är nog bra att vi resonerar om det här.
-
@jonass ett "problem" vi har i Wikidata där poster mergas enormt mycket som är lite relaterat se SPARQL fråga vad som mergats senaste veckan som är kopplat till Europeana = 63 poster
dvs. 17 aug mergades Q106629593 versionshistorik med Q4767743 - versionshistorik
Problemet här är att om man har en Wikidata identifierare så kan man inte vara säker att det inte är samma objekt som ett annat eftersom den kan ha mergats.... kan enkelt kollas med https://www.wikidata.org/wiki/Special:EntityData/Q106629593.json --> då redirektas till Q4767743
-
@Magnus-Sälgö fast att ta till sig materialet är inte något som t.ex. en utvecklare måste göra, man kan ju bygga tjänster på svenska även om man inte kan ett ord svenska, vilket underlättas när API:er och JSON-svars nycklar är på engelska oftast.
-
@jonass Ja, jag håller med om att språkvalet är klurigt. Det är frestande att säga "engelska", över hela linjen, men det innebär att en mängd verksamhetsbegrepp måste översättas. Min erfarenhet är att dessa översättningar ofta görs fritt av respektive utvecklarteam, vilket leder till svengelska och märkliga svenska "varianter" på översättningar. Ta t.ex. utbildningsområdet, det är inte självklart vad "arbetsplatsförlagt lärande" heter på engelska (som dessutom kan skilja sig mellan brittisk och amerikansk osv).
För många år sen ansåg staten att korrekta översättningar var viktigt och bl.a. utbildningsdepartementet lät ta fram en "Svensk-engelsk ordbok för utbildningsområdet". För att skapa korrekta informationsutbyten och API:er skulle vi behöva normativa ordböcker för resp. domän.
Om vi ser till hur data flödar i en organisation, så färdas begreppen genom ett antal integrationsgränssnitt och mellanprogramvaror. Det finns risker med att ett verksamhetsbegrepp som ursprungligen är på svenska översätts fram och tillbaka ett antal gånger.
-
@mistral och vad händer om ett begrepp delas upp....
tror Wikidatas modell med
- unika egenskapsnummer (uttalande)
- unika objekt id
- möjligt att merga objekt
- hantera alias --> bra för NER
kan hantera viss del av det kaos verkligen utgör....
-
@Magnus-Sälgö Kan nog vara en framkomlig väg. Jag tror på framgång med formella/kontrollerade språk. Varje domän har en specifik, begränsad nomenklatur svenska/engelska, som har en tydlig ägare. "Vem äger den?", kanske någon undrar. Tja...förslagsvis hanterar DIGG en ämnesindelad begreppskatalog, där resp. ansvarig myndighet skapar sin "Master Glossary of Terms".
-
Detta inlägg är raderat!