21 juli 2015

TMLO en de digitale erfenis

image for TMLO en de digitale erfenis image

De bedoeling is dat het TMLO zo snel mogelijk wordt ingevoerd. De invoering van nieuwe applicaties, zaaksystemen en dergelijke kan een goed moment zijn om ermee te starten.

De bedoeling is dat het TMLO zo snel mogelijk wordt ingevoerd. De invoering van nieuwe applicaties, zaaksystemen en dergelijke kan een goed moment zijn om ermee te starten.
Maar daarmee zijn we er nog niet. Sinds overheden zijn begonnen met digitaal werken, alweer zo’n vijftien tot twintig jaar geleden, is er een enorme hoeveelheid digitale informatie geproduceerd. Archieven uit die periode zijn vaak hybride bewaard gebleven: deels papier, deels digitaal. De dragers variëren. Diskettes, maar ook zipdrives en CD-ROM’s komen nog voor, maar het gros bevindt zich op externe harde schijven, op netwerkschijven, in de werkbestanden van (vroegere) medewerkers of in de omgeving van bepaalde afdelingen of diensten.

Legacy-probleem
Voor grote gemeenten kan het al gauw gaan om vele terabytes aan digitale informatie, waarvan lang niet zeker is of het om te bewaren of te vernietigen informatie gaat, of dat het digitale kopieën of originelen betreft. Om een voorbeeld te noemen: uit onderzoek van de gemeente Utrecht met Het Utrechts Archief bleek dat de dienst Culturele Zaken zo’n 4200 mappen met daarin 54.000 bestanden onder zijn hoede had. De hele gemeente Utrecht telt in totaal zo’n tien miljoen digitale bestanden.1
Hoe ga je hiermee om met het oog op de metadatering? Het is ondoenlijk om met terugwerkende kracht het TMLO te implementeren op al die bestanden, als die al voor blijvende bewaring in aanmerking komen. Alleen de gedachte aan zo’n exercitie doet je al de moed in de schoenen zakken. Hoe moet je daaraan beginnen en hoe krijg je het ooit af? Aan de andere kant, het e-depot van het Nationaal Archief vereist dat het TMLO is toegepast. Bestanden met metadata die niet aan de minimale verplichtingen uit het TMLO voldoen, kunnen niet in het e-depot, is de regel.
Het zal duidelijk zijn dat we er zo niet komen. Als we willen dat ook het archiefwaardige materiaal van de afgelopen tien à twintig jaar duurzaam wordt beheerd en ontsloten, zullen we een oplossing moeten vinden voor het probleem van de legacy. Die oplossing moet erop gericht zijn om met zo min mogelijk inspanning tot een zo hoog mogelijke niveau van metadatering volgens het TMLO te komen.

Vier stappen
Het is daarom zaak om de erfenis goed te verdelen, de waardevolle spullen te selecteren, en wat weg kan te verwijderen. Met die waardevolle spullen gaan we dan aan de slag om er een goede bestemming voor te vinden en ze daar duurzaam onder te brengen. Daarvoor moeten we zoveel mogelijk van het TMLO toepassen.
Er moeten de volgende stappen worden doorlopen:

1 In kaart brengen van digitale bestanden in diverse applicaties
Een handig hulpmiddel hiervoor is DROID (Digital Record Object IDentification).2 Deze gratis tool is ontwikkeld door de Britse National Archives om analyses uit te voeren op grote hoeveelheden bestanden. Hij geeft informatie over versies, omvang, ouderdom, laatste wijziging en het voorkomen van duplicaten.

2 Vaststellen of het om originelen of duplicaten gaat
In principe hoeven dubbelen niet bewaard te worden, maar dit is niet altijd eenvoudig na te gaan. Als er meerdere digitale exemplaren bestaan, gaat het nog. Veelal is er een hybride situatie, waarbij delen van een archief of een dossier analoog (op papier) en andere delen digitaal bewaard worden, zonder dat beide groepen documenten volledig zijn. In dat geval is het raadzaam om een digitaal exemplaar te bewaren als je niet zeker weet of er ook een analoog exemplaar is, en andersom. Het zou anders te veel tijd kosten om dat allemaal uit te zoeken.

3 Selecteren wat voor bewaring in aanmerking komt
Dit kan gebeuren door toepassing van de selectielijst. In principe hoeven alleen permanent te bewaren bestanden duurzaam te worden bewaard, maar wellicht zijn ook andere bestanden het bewaren waard, zoals dat in het acquisitieprofiel van de ontvangende archieforganisatie is vastgelegd. Uiteraard is het niet doenlijk om een dergelijke selectie op documentniveau uit te voeren en blijft die beperkt tot het dossier- of zelfs bestandsniveau. In het Utrechtse geval bleek bij de bestanden van Culture Zaken eenvoudig te kunnen worden geselecteerd op basis van naamgeving van hoofd- en submappen. Aldus kon 35 procent van alle bestanden voor vernietiging worden geselecteerd.3 Selectie op bestandsniveau is gedeeltelijk geautomatiseerd uit te voeren. Het aantal te vernietigen bestanden, zoals conceptversies en dubbelen, kon op deze wijze met nog eens 10 procent worden vergroot. Verdere selectie op bestandsniveau is tijdrovend en kostbaar handwerk.

4 Quickscan welke metadata aanwezig zijn en welke ontbreken
Van de bestanden die permanent bewaard gaan worden en dus aan het e-depot overgedragen kunnen worden, moet nagegaan worden welke metadata uit het TMLO wel en niet aanwezig zijn. Om het ons niet te moeilijk te maken, beperken we ons in eerste instantie tot de verplichte velden uit het TMLO. Dat zijn in eerste instantie de vier die te allen tijde verplicht zijn: identificatiekenmerk, aggregatieniveau, naam en vorm. Aangezien dat TMLO tijdens het ontstaan van de bestanden nog niet bestond zal een deel van die verplichte velden ontbreken. Voor zover ze ontbreken, zullen ze dus toegevoegd moeten worden, maar dat moet dan wel in bulk kunnen. Een verzameling documenten uit één map moet dan vrij simpel van de goede metadata kunnen worden voorzien.

Tot besluit
Het is duidelijk dat het TMLO een belangrijk onderdeel is van het digitale informatiebeheer van lokale overheden en zou zo snel mogelijk geïmplementeerd moeten worden in de lopende informatieprocessen. Maar hoe gaan we om met de digitale erfenis van de afgelopen vijftien jaar? Daarvoor geldt: waar niets is, verliest de keizer zijn recht. Het is weinig zinvol om enorm veel tijd en energie te steken in het TMLOproof maken van een digitale erfenis. Maar dat betekent niet dat we die erfenis ongezien in het e-depot kunnen kieperen. Er zal het nodige werk moeten worden gestoken in het structureren en selecteren ervan. Vervolgens zal het te bewaren deel zo goed mogelijk worden voorzien van de metadata uit het TMLO. Die taak moet zeker niet worden onderschat, maar is met een goede voorbereiding en structurering absoluut geen onbegonnen werk.

v.sleebe@historischcentrumoverijssel.nl, Vincent Sleebe werkt bij het Historisch Centrum Overijssel (e-depot/verwerving).
t.roerdink@historischcentrumoverijssel.nl, Thomas Roerdink is trainee bij het Historisch Centrum Overijssel (e-depot/metadata).


1 Eindverslag Werkpakket Digitale erfenis in kaart: Pilot e-depot Gemeente Utrecht & Het Utrechts Archief 2014, 20.
2 http://www.nationalarchives.gov.uk/information-management/manage-information/preserving-digital-records/droid/
3 Eindverslag Werkpakket Digitale erfenis in kaart: Pilot e-depot Gemeente Utrecht & Het Utrechts Archief 2014, 12.