Crowdsourcing på arkiver og museer i DanmarkI gamle dage hed det “brugerberigelse” eller “indtastningsprojekter”. I dag kalder vi det crowdsourcing, men pointen er den samme: Frivillige er en drivende kraft i skabelse eller forbedring af online-ressourcer. Her kommer et forsøg på en lille inventering.

Det er et karakteristisk træk for arkiver – hele lokalarkivbevægelsen ikke mindst – at have langvarige, intensive og meget resultatorienterede samarbejder med frivillige. I forrige århundrede kom frivillige typisk på arkivet for at deltage i fx registreringsprojekter, billedidentifikation og “udklipning”. Før verden blev digital, brugte frivillige masser af timer på at indeksere lokale nyheder og artikler fra aviser i mapper, sådan at brugere fik nemmere indgang til materialerne. Da computeren begyndte at blive hvermandseje, var det oplagt at “digitalisere” samarbejdet med frivillige. Resultaterne er overvældende.

Dansk Demografisk Database
Projektet er så vidt vides det største og ældste af sin slags i Danmark, og udgør dermed en kronjuvel i dansk kulturavs-crowdsourcing. KIP (Kildeinstastningsprojektet) startede som et samarbejde mellem arkiver og brugere i 1992, og drives af Statens Arkiver.  Det kan altså i år, 2012, fejre 20 års fødselsdag. Målet er at indtaste ældre, danske folketællinger, og i skrivende stund rummer basen over 15 millioner brugerskabte poster. De frivillige har indtastet efter ældre fotokopier af de originale tællinger, og et slag på tasken er, at den indsats, som er ydet  svarer til omkring 400.000 timer. Eller 40 millioner kroner, hvis man havde regnet med en timeløn på omkring 100 kr. Der er op mod 1.000 frivillige, som har været engageret, og basen nyder desuden stor opmærksomhed fra brugerside, med op imod 2 millioner brugersessioner om året på Dansk Demografisk Database.

Politiets Registerblade
Projektet startede i 2008 med Københavns Stadsarkiv som værtsinstitution og på foranledning af de tre landsdækkende genealogiske foreninger. “Politiets Registerblade” er en slags kartotekskort over københavnere i perioden 1893 – 1923. Kortene blev skabt af det københavnske politi som en slags forløber til folkeregisteret. Målet var at indeksere og siden indtaste kortenes oplysninger udfra digitaliserede film. I 2010 blev projektet åbnet for indtastning og i efteråret 2011 var de ca. 1.4 millioner indekseringsposter færdige.
I skrivende stund er ca. 1/3, omkring 500.000 komplette registreringer.  Ca. 400 frivillige har været engageret i arbejdet, som Københavns Stadsarkiv skønner ville svare til 15 års fuldtidsarbejde.

Nygårds Sedler
Initiativet til projektet, som startede i 2007, kom fra en gruppe arkivbrugere, som ønskede at afftotografere og indeksere et seddelkartotek på 205 kasser, som kun kunne benyttes på læsesalen på Rigsarkivet i København. Det håndskrevne kartotek rummer jyske slægtsnavne fundet i forskellige Rigsarkiv-kilder (embedsansøgninger, kancelliet, rentekammeret, etc.) og udgør dermed en indgang til kildegrupper, som ikke er mainstream. Da de frivillige fotografer var baseret i Vest-danmark, blev der indledt samarbejde med Herning Bibliotek. Det betød, at fiberæsker med kartotekssedler blev sendt fra Statens Arkiver til Herning i portioner, og altså i en periode ikke kunne benyttes på læsesalen. I løbet af 14 måneder fotograferede 5 frivillige de ca. 425.000 sedler mens ca. 40 stod for indekseringen. Arbejdet afsluttedes i januar 2010, og ressourcen er idag en del af Dansk Demografisk Database.

Sejrs sedler
Projekt Sejrs sedler drives af Aarhus Stadsarkiv. Der er tale om et kartotek på ca. 100.000 sedler, som især indeholder udtræk af artikler, taget fra Århus Stiftstidende i perioden ca. 1794 -1920. Her foregår indtastningen ved, at frivillige har hjemlånt én af flere eksisterende fotokopier af seddelkartoteket.
Projektet åbnede 24. januar 2012, og pt. er ca. 16.500 sedler fra emneregisteret og 72.379 fra personregisteret skrevet ind. Ca. 90 personer meldte sig som interesserede ved den første “efterlysning” af frivillige.

Postmester Sørensens vendelboarkiv
Projekt “Nygårds sedler” inspirerede brugere og personale på Historisk Arkiv i Hjørring til at få digitaliseret og indekseret “vendelbooarkivet” et seddelkartotek, skabt af af postmester T. M. Sørensen i perioden 1967- ca. 1986. Sedlerne – organiseret i 104 kasser – omfatter i alt ca. 130.000 kort af forskelligt udseende: fotokopier, udklip og maskinafskrevne ekstrakter. Kortenes indhold er oplysninger fra årbøger, blade, m.m. om “indfødte vendelboer”, født før 1924.
I alt 8 personer fra det frivillige arkivlaug driver opgaven med digitalisering af arkivet, der siden sommeren 2010 har været søgbart på nettet.

Odensedatabasen
Databasen er udviklet siden 2001 med udgangspunkt en base, skabt i forskningsmæssigt øjemed i forbindelse med publicering af “Odense Bys Historie” tilbage i 1986. Basen samler oplysninger fra mange kilder om borgere i Odense, startende i 1740. Fra 2004 har Odense Stadsarkiv og Slægtshistorisk Forening for Odense samarbejdet om indtastning af yderligere kilder, bl.a. kirkebøger og nyere folketællinger. Omfanget er betydeligt, idet alene folketællingen 1901 omfatter 60.000 poster.

Esbjerg-databaserne
Esbjerg Byhistoriske arkiv arbejder et antal på ca. 30 frivillige med forskellige indtastningsopgaver. Modellen her adskiller sig fra de øvrige ved, at deltagerne kommer på det fysiske arkiv 1 – 3 gange ugentligt. Indtastningerne omfatter især oplysninger fra skattemandtaller, men rummer også fx lister over beværtere samt navne fra det kommunale begravelsesvæsens protokoller.

Screening af kirkebøger for CPR-numre
I marts 2010 måtte Statens Arkiver nedtage en række af de nyere kirkebøger, fordi det viste sig, at nogle af dem indeholdt CPR-numre. En screeningsopgave var meget omfattende, da det drejede sig om næsten 1 million sider, der skulle gennemgås. Materialet er ikke maskinlæsbart, men bestod af billedgengivelser af håndskrevne kirkebogsindførsler, som skulle ses igennem manuelt. Brugere, fra foreningen DIS-Danmark, tilbød deres hjælp og i løbet af få dage havde ca. 150 personer meldt sig til opgaven. Det tog ca. 10 måneder før alle 800.000 sider i de 3235 kirkebøger atter var tilgængelige som del af arkivalieronline, der har ca. 2 mio. årlige brugersessioner.

Frederikshavn fattigvæsens korrespondance
Stadsarkivet i Frederikshavn driver et lille projekt, hvor frivillige transskriberer korrespondancesager fra fattigvæsnet 1869 – 1897. En del af projektet udføres af frivillige, der kommer fysisk på arkivet, men via arkivets website er der åbnet op for, at enhver med lyst til transskribering kan deltage. Dog foregår indtastningen ikke online, men ved, at tekster fremsendes til arkivet for publicering.

Lokalhistoriske wiki´er
De lokalhistoriske wiki´er udgør en særlig gruppe crowdsourcede tiltag i kølvandet på bl.a.   “Lokalhistorisk Netværk”, der lukkede i 2008 og den store norske, nationale lokalhistoriewiki. Wiki´er findes i fx Vejle og Silkeborg. Andre lokalleksika, fx Kolding Leksikon, Viborg Historie og Århus Leksikon (oprettet før dobbelt-aa´ets tilbagekomst), bygger ikke på wiki-teknologi, men udarbejdes af ansatte ved de kulturhistoriske institutioner, med udgangspunkt i bl.a. forespørgsler og brugerforslag.

Hvad er egentlig crowdsourcet?
Projekter, som er taget med på min liste er karakteriseret ved, at deltagere selv udfører hovedparten af aktiviteterne: Dvs. at det er frivillige der taster, validerer etc. Projekter, hvor brugertilføjet indhold skal valideres af fagpersonale, før det antages til publicering, er ikke inkluderet. Er denne type projekter “reel crowdsourcing”, når det ikke er deltagergruppen og dennes mekanismer, der har den afgørende indflydelse på det tilgængeliggjorte indhold? Ud fra denne synsvinkel kan det måske også diskuteres, om frederikshavner-protokollerne burde have været udeladt. Én-mands-brugerskabte ressourcer som fx www.skippere.dk, www.rakker.dk eller Den Almindelige Enkekasse er heller ikke medtaget.

Til gengæld har jeg taget flere ret lokale tiltag med, og dermed gået udenom forholdet mellem communitysourcing og crowdsourcing. En skarpere sondring ville nok placere fx ressourcer som Odensedatabasen, Vendelboarkivet og Esbjerg-databaserne i denne kategori, fordi der er indgået mere formelle samarbejder mellem lokale institutioner og lokale deltagere.

Hvad har jeg glemt eller misforstået…
Ovenstående liste er naturligvis langtfra komplet, så kommentarer, rettelser og tilføjelser er mere end velkomne. Jeg har placeret et lille Google spreadsheet om crowdsourcet kulturarv i Danmark her til fri redigering. Og jeg savner eksempler på crowdsourcede projekter fra museer :-)

Links:
Dansk Demografisk Database
Politiets registerblade
Nygårds Sedler
Sejrs Sedler
Postmester Sørensens vendelboarkiv
Odensedatabasen
Esbjerg-databaserne
Frederikshavn fattigvæsens korrespondance

Andre poster om crowdsourcing
Er arkiver og deres brugere danmarksmestre i crowdsourcing?
Projektet er vigtigere end institutionen
Crowdsourcing – hvad motiverer deltagere?
Passion i det digitale rum (Slides fra oplæg på Nyborg-mødet 2011)

Indlægget står desuden i gæld til artiklen “Store fælles indtastningsprojekter” af Svend-Erik Christiansen, bragt i omSLAget, som publiceres af Sammenslutningen af Lokalarkiver.

3 Kommentarer

 1. Kære Charlotte

  Fremragende artikel! Og inspirerende! Jeg synes vi skal glemme alt det der med reglerne for “rigtig” crowdsourcing – for målet er naturligvis ikke at lave rigtig crowdsourcing, men at forbedre de redskaber der er tilgængelige for alle de, der er passionerede i forhold til at bruge arkiverne. Og som – og det er vigtigt – er passionerede i forhold til selve den opgave det er at deltage i projekterne. Enten fordi man synes det er sjovt at sidde og taste, eller fordi man har en dybtfølt interesse i at være med til at forbedre adgangen til kilderne. En af de regler vi skal lade være med at give for stor en rolle er rolleopdelingen “organisation /projektudbyder-bidragsyder” – den er begrænsende og kedelig – og upræcis. Se f.eks. på DIS-DK´s “kildeportal” hvor DIS-DK-medlemmer og måske også andre – indekserer billeder på Statens Arkivers Arkivalier-Online – altså “bidragerne” der organiserer sig for at berige “organisationens” selvskabte tilbud til bidragsyderne (understøttet af den noget primitive form for åben API, der består af de åbne-billedadresser i AO) og hvor SA i praksis ikke har nogen form for kontrol eller definitionsret på nogetsom helst, men blot en interesse i at opmuntre og hjælpe til at resultatet bliver så godt som muligt….. det er da ikke så ringe!

 2. Hej Allan,

  – og tak for kommentaren! Hvor kunne jeg dog glemme kildeportalen på http://kilder.dis-danmark.dk/ ? Tak for heads up på den.

  Den er, som du skriver, spændende, ikke mindst fordi det (vist?) er en ny form: “brugerorganiseret crowdsourcing”. Jeg kunne godt gætte på, at det en form, vi vil se mere til, efterhånden som der kommer mere og mere tilgængeligt indhold, åbne API´er etc. fra kulturarvsinstitutionerne.

  Men jeg er nok ikke helt enig med dig i dét med at se bort fra nuanceforskellene i forskellige typer af projekter og tilgange. Ikke fordi noget nødvendigvis er “bedre” end andet, men fordi forskelle i interesse, motivation etc. måske skal understøttes på forskellige måder. Jeg tænker, at der er forskel på, om man er samarbejdspartner for et community eller en crowd?

  Det er et gæt, men jeg tror måske også, at det påvirker deltagernes motivation og interesse, om det er fællesskabet, der korrekturlæser, slutpublicerer etc. eller om man indsender til en institution, der validerer?

 3. Meget spændende artikel. Jeg har en enkelt kommentar til Frederikshavnerordningen, hvor vi i øvrigt er i gang med byrådssagene også. Valideringen foretages ikke af personalet men af frivillige, som er ekstra dygtige til læsning af gotisk. De nye frivillige har således mulighed for at få deres indlæg tilbage i rettet udgave og har dermed ved hjælp af andre frivillige gode rimuligheder for en stadig forbedring af deres evner til at transkribere. Jeg ved ikke helt, om det giver en ekstra nuance i en skelnen som nævnt ovenfor

Der er lukket for kommentarer.