Industriële digitalisering natuurhistorische collecties

Industriële digitalisering
natuurhistorische collecties
Kirsten van Hulsen ■
In 2010 is Naturalis gestart met het programma FES Collectie Digitalisering – een van de grootste
programma’s wereldwijd op het gebied van digitalisering van natuurhistorische collecties. In totaal
worden er ten minste 7 miljoen objecten gedigitaliseerd. Met nog een jaar te gaan, staat de teller op
ruim 4 miljoen objecten.
Naturalis
Natu
Na
turalis Biodiversity Center
In 2010 hebben het Zoölogisch Museum
Amsterdam, het Nationaal Herbarium
Nederland en Nationaal Natuurhistorisch
Museum Naturalis hun krachten
gebundeld in het Naturalis Biodiversity
Center. Daarmee behoort Naturalis qua
omvang en samenstelling wereldwijd
tot de top vijf in het natuurhistorisch
domein: een collectie van 37 miljoen
botanische, geologische en zoölogische
objecten.
Vanuit het Fonds Economische Structuurversterking (FES) is in 2009 een bedrag
van 30 miljoen euro toegekend aan
Naturalis. Dit bedrag is bestemd voor
het integreren van de drie organisaties
en collecties, de inrichting van een
laboratorium voor DNA-barcoding en
het grootschalig digitaliseren van de
collectie. Met de 13 miljoen euro die
beschikbaar is voor digitalisering is het
programma FES Collectie Digitalisering
(FCD) opgericht, met als doel voor
medio 2015 ten minste zeven miljoen
relevante collectieobjecten te digitaliseren, de overige 30 miljoen objecten
op het niveau van bewaareenheid te
ontsluiten en een permanente infrastructuur in te richten die de voortzetting
van de collectiedigitalisering na afloop
van het programma faciliteert.
Dit programma levert binnen Naturalis
tijdelijk circa zeventig extra arbeidsplaatsen op. Voor veel afgestudeerde
biologen, geologen en archeologen een
22
2014 n u mmer 6
mooie kans voor een eerste baan in het
natuurhistorische domein.
Prioritering en werkprocessen
Een van de eerste uitdagingen binnen
het programma was om te bepalen
welke zeven miljoen van de 37 miljoen
objecten in aanmerking komen voor
digitalisering. Daarvoor is gekeken naar
welke collectie-onderdelen het meest
relevant waren voor de door Naturalis
geprioriteerde onderzoeksprogramma’s,
naar de economische of maatschappelijke relevantie van collecties en naar
welke collecties vanuit het oogpunt van
collectiebeheer het beste kunnen
worden gedigitaliseerd.
Vervolgens was het belangrijk om voor
de geprioriteerde collecties werkprocessen
te definiëren. Hiervoor is binnen en
buiten het natuurhistorische domein
gekeken naar aanwezige ervaring bij
andere instituten. Zo is er binnen
bibliotheken en archieven veel ervaring
met digitalisering. De objecten die in dat
domein binnen massadigitaliseringsprojecten gedigitaliseerd worden, zijn
veelal platte ‘2D-objecten’, wat een
uniforme wijze van digitalisering
mogelijk maakt en waarbij het gedigitaliseerde object het fysieke object voor
(een deel van) het gebruik kan vervangen.
De complexiteit van digitalisering van
natuurhistorische objecten is: 1) het feit
dat het 3D-objecten betreft; 2) het feit
dat we te maken hebben met grote
verschillen in formaten, van muggen tot
olifanten; 3) het feit dat een object
zonder de taxonomische gegevens en
gegevens over waar en wanneer het
object gevonden is, wetenschappelijk
gezien vrijwel waardeloos is. Dit alles
samen maakt dat er bij de inrichting van
het programma FCD wel lering getrokken
kon worden uit bestaande, lopende
digitaliseringsprojecten in het cultuurhistorische domein, maar dat veel
processen toch nog ontwikkeld moesten
worden. Binnen de natuurhistorische
sector richtten digitaliseringsprojecten
zich voorheen doorgaans op één
specifieke soortgroep of collectietype,
bijvoorbeeld alleen insecten of alleen
herbariumbladen, met een gemiddelde
prijs van € 5,00 per object. En het doel
van Naturalis was om alle verschillende
collectietypen te digitaliseren tegen een
gemiddelde prijs van € 1,86 per object.
Om dit te realiseren was het dus nodig
een nieuwe, industriematige werkwijze
te ontwikkelen, waarbij de collectie door
middel van gestandaardiseerde,
productiematige processen wordt
gedigitaliseerd.
Digistraten
Voor deze productiematige digitalisering
heeft Naturalis negen zogeheten
‘digistraten’ ingericht: productielijnen
voor specifieke collectieonderdelen, elk
met een focus op een specifieke
objectsoort of bewaarmethode. Zo zijn
er digistraten ingericht voor het digitaliseren van microscopische preparaten,
droge vertebraten, objecten op alcohol,
entomologische collecties, boeken,
mollusken en geologische objecten. Voor
iedere straat zijn werkprocessen uitgewerkt en geïmplementeerd, passend
bij het betreffende collectie-onderdeel.
Uitvoering
Hoe gaat het digitaliseren nu precies in
zijn werk? Als voorbeeld nemen we een
kijkje in de glasstraat. In deze straat
worden bijna een miljoen microscopische glaspreparaten gescand en
ingevoerd.
In de glasstraat wordt ieder microscopisch
preparaat voorzien van een unieke
datamatrix-code. In speciaal ontwikkelde
scanmallen worden 100 preparaten
geplaatst. De mal wordt gescand en met
software worden uit deze scan de foto’s
van de afzonderlijke microscopische
preparaten geknipt en hernoemd naar
de datamatrix-code. Het resultaat is een
set van 100 individuele foto’s. Op basis
van deze foto’s wordt de informatie die
aanwezig is op de labels van de
preparaten door de digistraatmedewerkers
ingevoerd in het collectieregistratiesysteem van Naturalis.
Nieuwsgierig geworden? De glasstraat is
gevestigd in het museumgedeelte van
Naturalis in de zaal LiveScience en kan
iedere dag bezocht worden.
Herbariumcollectie
Alle bovengenoemde digistraten worden
door tijdelijke medewerkers van
Naturalis bemand en binnen Naturalis
uitgevoerd. Voor de collectie herbariumbladen is er echter voor gekozen om de
digitalisering uit te besteden. Na een
Europese aanbesteding is hier een
samenwerking met Picturae uitgekomen.
Speciaal voor Naturalis is door Picturae
een digitaliseringsset op basis van een
lopende band ontwikkeld. Hiermee
kunnen op hoge snelheid herbariumbladen worden gedigitaliseerd, met
3 lopende banden worden gemiddeld
35.000 foto’s per dag gemaakt. Het
fotograferen van de bladen is inmiddels
afgerond: in 10 maanden tijd zijn er in
dit project bijna 4 miljoen herbariumbladen over de lopende band gegaan.
Op basis van de foto’s wordt door een
gespecialiseerd bedrijf in Suriname de
data-invoer gerealiseerd door een team
van 40 getrainde medewerkers.
2D-materiaal
Naast de collectie van biologische en
geologische diversiteit beheert Naturalis
een contextcollectie die van belang is
om deze kerncollectie te kunnen
bestuderen. Deze contextcollectie
bestaat enerzijds uit gepubliceerd
materiaal (boeken, tijdschriften,
microfiches), anderzijds uit ongepubliceerd materiaal (bijvoorbeeld registerboeken, archieven, dia’s, foto’s).
De zogeheten 2D-straat beoogt de
digitalisering van onderdelen van deze
contextcollectie, met als doel informatie
toe te voegen aan objecten uit de
collectie en collectiegebonden onderzoek te faciliteren.
glaspreparaten gescand en ingevoerd (foto’s
Naturalis).
herbariumbladen over de lopende band gegaan.
en internationale onderzoeksprogramma’s.
Zo loopt er binnen Naturalis een onderzoeksprogramma naar de achteruitgang
van bestuivers in Europa en de gevolgen
hiervan voor de bestuiving en voedselvoorziening. Bij dit onderzoek worden
de gedigitaliseerde bijen gebruikt om
veranderingen te analyseren in het
voorkomen van de bestuivers over de
afgelopen 60 jaar. Daarnaast worden de
hoge resolutie foto’s van de bijen
momenteel gebruikt om algoritmen
voor automatische identificatie van
soorten op basis van de vleugelpatronen
te ontwikkelen. Zo zijn er nog meer
voorbeelden waarbij de gedigitaliseerde
natuurhistorische collecties bijdragen
aan onderzoeken op het gebied van
bijvoorbeeld klimaatverandering,
voedselvoorziening en gezondheid.
150.000 bewaareenheden
7 van de 37 miljoen objecten worden
in de digistraten gedigitaliseerd op
objectniveau. De overige collectieonderdelen worden geregistreerd in het
project ‘30 miljoen objecten op
bewaareenheidniveau’. Dit resulteert in
naar schatting 150.000 bewaareenheden op het niveau van lade, plank of
doos. Gedurende het project wordt per
bewaareenheid de taxonomische en
geografische informatie vastgelegd in
het collectieregistratiesysteem. Dankzij
de digistraten en dit project zijn medio
2015 alle objecten uit de collectie van
Naturalis digitaal te vinden.
Toepassing
In de glasstraat worden microscopische
In 10 maanden tijd zijn er bijna 4 miljoen
Alle gedigitaliseerde objecten worden
toegankelijk gemaakt via de eigen
website(s) van Naturalis en internationale websites zoals GBIF (Global
Biodiversity Information Facility), BHL
(Biodiversity Heritage Library) en
Europeana. De gedigitaliseerde data
speelt een belangrijke rol in nationale
Huidige status
Met nog een jaar te gaan, staat de teller
op ruim 4 miljoen gedigitaliseerde
objecten. Alle geplande digistraten zijn
operationeel – of zelfs al afgerond – en
de productie ligt op schema. Dit najaar
lanceert Naturalis het ‘Bioportaal’ – een
centrale online zoekingang voor een
breed corpus aan informatie over biodiversiteit in Nederland en de wereld –
waarop de gehele digitale collectie van
Naturalis doorzoekbaar is.
Door de toegankelijkheid van de collecties
van Naturalis te vergroten voor collectiebeheer, wetenschap en maatschappij,
sluit dit grootschalige digitaliseringsproject aan bij de missie van Naturalis:
de biodiversiteit beschrijven, begrijpen
en verklaren voor het welzijn van de
mens en voortbestaan van de aardse
natuur.
Kirsten van Hulsen programmamanager
FCD, Naturalis Biodiversity Center.
n u mm er 6 2014
23