Sveriges dataportal, DIGG - Myndigheten för digital förvaltning
Sök data Nyheter Om oss Community
  • Hem
  • Kategorier
  • Senaste
  • Taggar
  • Populära
  • Användare
  • Grupper
  • Sök
  • Ser ut som din anslutning till %1 gick förlorad, vänta medan vi försöker att återansluta.
  • Registrera
  • Logga in

Navigering

    Ang. SCBs val av licens

    Data
    licens scb publicera data
    4
    13
    523
    RSS Feed
    Laddar fler inlägg
    • Äldst till nyaste
    • Nyaste till äldst
    • Flest röster
    Svara
    • Svara som ämne
    Logga in för att posta
    Det här ämnet har raderats. Endast användare med ämneshanterings-privilegier kan se det.
    • Jonas Nordqvist
      Jonas Nordqvist @Dennis_Priskorn Senaste redigerad av

      @dennis_priskorn Är wikidata en konsument?

      /Jonas Nordqvist
      Storsthlm

      E Ett svar Senaste svaret Svara Citera Gilla 1 Post Tools Trigger
      • E
        ej aktiv @Jonas Nordqvist Senaste redigerad av ej aktiv

        @jonas-nordqvist Wikidata är WIkipedias datalager och kunskapslager där man kopplar ihop alla > 300 språk plus även kopplar till > 5000 externa identifierare.... dvs. alla artiklar på alla språk om August Strindberg knyts ihop i Q7724 eftersom allt är objekt kan saker visas på svenska, arabiska, kinesiska och sedan återanvändas och förstå av alla oberoende av språk det är så Google, Facebook, Amazon jobbar med sitt data och har semantiska specialister för att få så mycket "bang for one's buck" att skapa Öppen data bara på svenska blir inte bra skalbart plus har man en kunskapsgraf som är gemensam så kan man slippa dubbelarbete....

        Samma modell skulle vi vilja se som sagt med svensk Öppen data och även för museerna.... Jag kopplar nu ihop svenska runstenar med Litteraturbanken / karta / video och vilka museer dom databaserna finns hos .... känns som en nyutveckklad applikation från Riksantikvarieämbetet inte vet om det arbete som Litteraturbanken med kartor gör --> det dubbelarbetas med massa textsträngar istället för att göra som Wikidata add once use many times

        36e2ff75-837f-4607-af52-4c4ab2f20ad2-image.png

        Allt data i Wikidata är fritt att använda CC0 vi gjorde en övning med Södertälje kommun som nu för Naturreservat säger samma som Wikidata, Naturvårdsverket istället bara för en textsträng "Things not strings" se 5 star Open Data .... blogpost om Södertäljes data

        e31cfc3e-d6e7-498d-9f09-7ca9610f2e6a-image.png

        Jonas Nordqvist Ett svar Senaste svaret Svara Citera Gilla 0 Post Tools Trigger
        • Jonas Nordqvist
          Jonas Nordqvist @ej aktiv Senaste redigerad av

          @salgo60 Jojo, men är wikidata en konsument?

          /Jonas Nordqvist
          Storsthlm

          E Ett svar Senaste svaret Svara Citera Gilla 0 Post Tools Trigger
          • E
            ej aktiv @Jonas Nordqvist Senaste redigerad av ej aktiv

            @jonas-nordqvist definiera konsument

            data som finns i Wikidata visas i Wikipedia.... konsumeras av massa andra.... efterom vårt data är Länkade data så är det oftast enkelt att konsumera... plus vi stödjer flera språk...

            Nu startas ett projekt Abstract Wikipedia där man bygger "ord funktioner" som skall kunna skapa artiklar direkt på olika språk om det finns tillräckligt med data i Wikidata.... dvs, alla större och mindre språk i Sverige som arabiska, samiska... skall kunna lära sig om Naturreservat, Riksdagen et al som finns i dagens Wikipedia bara på svenska...

            För att det skall fungera bygger vi även nu upp i ett projekt att ha alla världens ord med alla ordens böjningsformer på alla världens språk.... se Wikidata:Lexicographical_data

            Problemet är att konsumera data som inte är kurerat dvs. vi måste "knåda datat".... med bättre data skulle det vara enormt enkelt....

            Sedan finns det externa "konsumenter" som Google som läser Wikidatas change stream och 20 minuter senare gör om sin produkt se tweet med Älvrosgården

            Jonas Nordqvist Ett svar Senaste svaret Svara Citera Gilla 0 Post Tools Trigger
            • Jonas Nordqvist
              Jonas Nordqvist @ej aktiv Senaste redigerad av

              Ok då vet jag. Wikidata är inte en konsument.

              Jag tror att vi skulle ha bättre möjlighet att övertyga SCB att köra CC-0 om det fanns någon specifik anledning, typ ett projekt som man håller på med. Finns det något sådant specifikt projekt eller konkret syfte med att få ta del av SCB:s öppna data?

              /Jonas Nordqvist
              Storsthlm

              E D 2 svar Senaste svaret Svara Citera Gilla 0 Post Tools Trigger
              • E
                ej aktiv @Jonas Nordqvist Senaste redigerad av

                @jonas-nordqvist sa i Ang. SCBs val av licens:

                Wikidata

                Det är lättare om du definierar konsument ... som jag sa det är datalagret till Wikipedia och till många andra...

                • WHO har hoppat i säng med Wikipedia eftersom det är galet många som läser Wikipedias artiklar.... en av 10 största websiterna och konstigt nog högtrovärdighet ...

                • Pratar du med Apple watch eller Alexa så är det ofta datat från Wikidata som ger dig svaret dvs. det data vi bygger upp med i bästa fall bra Öppen data

                • Kollar du på Google Map så har dom ett nytt lager som visar Corona och ofta är det baserat på Wikidata/Wikipedia
                  e79a3866-a76e-46bf-94c2-cc26b1076e4f-image.png

                • med SCB kopplade vi nyligen på alla kommunsidor till SCB efter en förfrågan från dom Task T266863 .... jag har sagt till SCB att vi borde prata men det är lite trögt se Task T266870

                men som sagt det finns kanske bättre aktörer som kan få SCB att bli mer intresserade... lite intressant är att SCB levererar kommuninfon ovan endast på svenska.... kollar vi antal personer som läser artikeln om Solna kommun så är det fler som läst den på engelska än svenska --> SCB borde kanske leverera på engelska...

                29ed20cc-6f3c-4282-a8bc-4f5b033cf200-image.png

                Jonas Nordqvist Ett svar Senaste svaret Svara Citera Gilla 0 Post Tools Trigger
                • Jonas Nordqvist
                  Jonas Nordqvist @ej aktiv Senaste redigerad av

                  @salgo60 Ja det vore bra med definiering av 'konsument'. Det är kanske är helt rätt att wikidata är en konsument och wikipedia är nästa konsument i kedjan. Jag menade ursprungligen att 'konsument' är själva slutkunden. Alltså den som slutligen tillförskaffar sig värdet av det arbetet som ni lägger ner.

                  Men nu hänger jag med mer. Du arbetar i huvudsak med utveckling av wikidata och wikipedias "slutkunder", vilket är intressant och bra. Jag är själv kund till dessa tjänster.

                  /Jonas Nordqvist
                  Storsthlm

                  E Ett svar Senaste svaret Svara Citera Gilla 0 Post Tools Trigger
                  • E
                    ej aktiv @Jonas Nordqvist Senaste redigerad av

                    @jonas-nordqvist 😉 jag slutade jobba 2012 och hänger runt lite --> 760 000 redigeringar på Wikidata / backlog

                    Det jag tror skall ske är att man funderar över vart man vill... och skall Öppen data fungera så tror jag det underlättar att man är tydlig med sina egna mål och prioriteter nu känns öppen data mer som en lekstuga för konsulter....

                    Skall SCB presentera statistik om kommunerna så kan

                    • Wikidata/WIkipedia kanske göra detta tillgängligt på fler språk i artiklar eller länka dom från dessa språk
                    • SCB skulle troligen relativt enkelt hämta texter på olika språk och om det saknas fixa översättningen som andra kan använda....
                      • svenska / karta
                      • engelska
                      • kinesiska
                      • arabiska saknas en hel del men är Sveriges andra språk.... gör SCB jobbet med att "fylla på" med arbiska så kan andra dra nytta av det....

                    ÖPPEN data är mycket om att skapa communities och jobba ihop är min tro....

                    Jag kallar det co-create dvs, skapa mervärden för flera genom att sammarbeta

                    cf43578c-515a-44bc-a7de-ee02d780f7a8-image.png

                    Ett svar Senaste svaret Svara Citera Gilla 0 Post Tools Trigger
                    • D
                      Dennis_Priskorn @Jonas Nordqvist Senaste redigerad av

                      @jonas-nordqvist sa i Ang. SCBs val av licens:

                      Ok då vet jag. Wikidata är inte en konsument.

                      Jag håller inte med. Wikidata konsumerar data från hundratals ställen som tex Riksdagen. Vi frivilliga håller i kontakten med uppström å hela gemenskapens vägnar.

                      Ger det mening?

                      Jag tror att vi skulle ha bättre möjlighet att övertyga SCB att köra CC-0 om det fanns någon specifik anledning, typ ett projekt som man håller på med. Finns det något sådant specifikt projekt eller konkret syfte med att få ta del av SCB:s öppna data?

                      Att inte dela som öppet data med vettig licens kan få stora konsekvenser på sikt. Tex samlar Google in all data på Wikidata och förbättrar sin sökmaskin med detta, men de är bara en av många andra.

                      Om Google tvingas med CC-BY att ange källa med namn överallt då kommer de strunta i datan precis som vi på Wikidata gör i dagsläget av licensskäl.

                      Var det skäl nog?

                      Ett svar Senaste svaret Svara Citera Gilla 1 Post Tools Trigger
                      • L
                        LarsC Senaste redigerad av LarsC

                        Hej
                        CC-BY är ändrat till CC0 för de SCB dataset som hittas via dataportal.se.
                        Hälsningar Lars Carlsson, SCB

                        E Ett svar Senaste svaret Svara Citera Gilla 2 Post Tools Trigger
                        • E
                          ej aktiv @LarsC Senaste redigerad av ej aktiv

                          @larsc tackar jag publicerade denna nyhet på sv:Wikipedia

                          67b71102-9298-43fa-927e-3db5cf6465f0-image.png

                          Fråga 1 var ställer man bäst frågor till SCB?

                          Fråga/Önskan 2 jag har en känsla att SCB aggregerar data ex. utbildningsnivån per riksdagsmän. Vi i Wikidata önskar denna information per riksdagsman så vi kan jmf med andra länder på lite olika sätt....

                          Fråga/Önskan 3 vi i Wikidata världen har idag ca > 5000 externa egenskaper kan man se någonstans vilka SCB relaterade egenskaper som finns? Jag tänker då på ex. "DeSO – Demografiska Statistikområden" -

                          • Exempel på egenskap Property:P4093 "Australian Statistical Geography 2016 ID" Identifier of a geographic region defined in the Australian Statistical Geography Standard 2016
                          • Property:P8654 "SSYK 2012 Standard för svensk yrkesklassificering"
                          • Property:P4652 "ESCO Occupation ID"
                          • Property:P2657 "EU Transparency Register ID"
                          • Property:P9605 "CDep.Ro NGO ID" identifier for a Non-Governmental Organization in the database of the Chamber of Deputies of Romania on the CDep.Ro website

                          Fråga/Önskan 4 vi i WIkidata världen ser gärna att ni har samma som Wikidata ex. för Riksdagsmän kommuner eller annat och att vi enkelt kan ha era egenskaper. Hör av er om ni har frågor....

                          E Ett svar Senaste svaret Svara Citera Gilla 0 Post Tools Trigger
                          • E
                            ej aktiv @ej aktiv Senaste redigerad av ej aktiv

                            FYI: Wikidata skapar nu en plattform för att hantera mismatch mellan data i Wikidata och externt data se Wikidata:Mismatch_Finder

                            Fråga: har SCB en ändringsprocess för fel i datat? och hur rapporteras till den? var ser man bäst skillnad om en uppdatering publiceras, vilken som är aktuell version av datat?

                            Wikidata är en öppen plattform --> att alla kan ändra så vi ör beroende av bra extern data som vi hela tiden kan jämföra Wikidatas data med (för att upptäcka ex. vandalisering). Jag har hemsnickrat några Notebooks för Nobelprize.org, Svenska akademin, SKBL.... och det finns andra som gjort liknande men mig veterligen finns ingen samordning på detta men det är dit jag hoppas Wikidata vill....

                            En annan spännande utveckling som jag pratade kort med SCB om är att vi Wikipedia blir mer data drivet iom ett nytt projekt Abstract Wikipedia där tanken är att vi bättre än idag skall skala och kunna skriva en artikel en gång i ett "metaspråk" som sedan publiceras på flera 100 språk....

                            • exempel eran Kommun i Siffror där vi nu länkar er på > 1400 ställen på svenska Wikipedia medans engelska Wikipedia som är en av världens 20 största webplatser endast länkar SCB 3 ggr
                              • om ni levererade data/sidor på engelska skulle kunna länkas från en:Wikipedia som ofta har fler läsare än svenska Wikipedia
                                • jämförelse Solna kommun där vi har artiklar på 52 språk och antalet läsare i år är 54 742 på en:Wikipedia medans sv:Wikipedia har 29 761 länk statistik

                            d5875f56-1c5b-405c-964b-51b36b70f233-image.png

                            Ps. Wiki världen är enormt spretig och olika personer gör olika saker med väldigt lite samordning så förvänta er inte att om ni pratar med en person att övriga vet om denna dialog, i bästa fall hamnar saker i en backlog se sökning SCB i Phabricator som visar lite vad som gjorts med SCB...

                            Ett svar Senaste svaret Svara Citera Gilla 1 Post Tools Trigger
                            • Referenced by  E ej aktiv 
                            • Referenced by  E ej aktiv 
                            • Moved from Efterfråga data och API:er by  Kristine_ Kristine_ 
                            • Första inlägg
                              Sista inlägg