donderdag 21 juni 2012

Hergebruik Open Data Nationaal Archief


Tour de France , Andre Darrigade voor de start
































Nationaal Archief, Den Haag, Rijksfotoarchief: Fotocollectie Algemeen Nederlands Fotopersbureau (ANEFO), 1945-1989 - negatiefstroken zwart/wit, nummer toegang 2.24.01.05, bestanddeelnummer 911-3766


Op zaterdag 16 juni pitchte ik rond 9.55 de Open Cultuur dataset van het Nationaal Archief bij de hackathon georganiseerd door Hack de Overheid:

 




















Meer dan 140.000 records (afbeeldingen en metadata) uit de collectie van het Algemeen Nederlands Fotopersbureau (ANEFO) werden daarbij vrijgegeven onder een CC-BY-SA (de afbeelding) en CC0 (metadata) licentie. De kern van dit fotoarchief beslaat de periode 1959 - 1989 en geeft een prachtige doorsnede van het Nederlandse politieke, maatschappelijke en culturele leven tussen 1959 en 1989. Al het grote en vooral het kleine nieuws uit de jaren zestig, zeventig en tachtig.


De pitch viel in het cluster Open Cultuurdata waarin we met een flinke afvaardiging deelnemers en data-eigenaren die hadden deelgenomen aan de Masterclass Open Cultuurdata, Open Data afkomstig van culturele - en erfgoedinstellingen presenteerden aan een zaal vol programmeurs, datajournalisten, open data-adepten en geïnteresseerden. Ook zijn er een aantal prijzen verbonden aan het hergebruik van deze datasets, een competitie die loopt tot en met 31 december 2012. 


Tijdens de hackathon werden er workshops en break-out-sessies georganiseerd waarin we als data-eigenaren onze datasets verder konden toelichten, uitleggen aan iedereen die daarin geïnteresseerd is. Sowieso waren alle data-eigenaren goed herkenbaar aan een groot opgespelde, felgekleurde knoop:



















De grote vraag is natuurlijk gaat 'men' nu aan de slag met je data? Daar kan ik inmiddels na vijf dagen volmondig JA op antwoorden. Op zondag zag ik via een Google-alert dat op Wikipedia een artikel was geïllustreerd met een Anefo afbeelding uit de set: voetballer Cees Groot. Na wat door-geklik en contact met collega's van www.opencultuurdata.nl bleek dat inmiddels door handige Wikipedians zo'n 1875 records uit de Anefo-set Wikipedia zijn binnengehaald om te dienen als illustratiemateriaal. Daarvan blijken er tot op heden 57 afbeeldingen te zijn gebruikt op 63 verschillende Wikipedia lemma's. Het merendeel uiteraard op Nederlandstalige pagina's maar ook Duits-, Frans- en Engelstalige lemma's zijn geïllustreerd. Zo blijkt de afbeelding van Andre Darrigade, bovenaan deze post, op een drietal pagina's (Nederlands, Frans, Engels) voor te komen.

En met een dergelijk gebruik ben ik blij! Simpelweg door het geweldige bereik en gebruik wat bijvoorbeeld Wikipedia heeft. In 2010 hebben we als Nationaal Archief al eens 1000 afbeeldingen van politici (overigens goeddeels afkomstig uit de collectie die nu is vrijgegeven) voor verder gebruik aan Wikipedia gegeven. Uit de effectmeting bleek dat: 
Uit dit onderzoek blijkt dat gedigitaliseerd cultureel erfgoed dat beschikbaar gesteld wordt aan Wikipedia aantoonbaar veel vaker bekeken wordt. De beschikbaar gestelde collectie is in 4 maanden meer dan 2 miljoen keer bekeken op Wikipedia, in tegenstelling tot enkele honderden bezoeken aan de selectie op de beeldbank van het Nationaal archief zelf.

Tegen dergelijk traffic kan je als simpel Nationaal Archief met zo'n 100.000 unieke website bezoekers per maand niet op.


Ik ben benieuwd hoe de hoeveelheid afbeeldingen en vooral het gebruik in lemma's er over pak 'm beet een maand eruit ziet? Wordt vervolgd!