, 24 maart 2021

Regionaal Archief Tilburg deelt eerste ervaringen

image for Regionaal Archief Tilburg deelt eerste ervaringen image Praktijk

Tekst Mathé van der Velden

Bij het aanleveren van metadata aan een eDepot komt flink wat kijken. Van belang is uiteraard om de metadata goed op orde te hebben. Dat begint al bij de veldeninrichting van de gemeentelijke informatiesystemen. Belangrijk is welke velden beschreven worden, hoe deze beschreven worden en hoeveel er van nodig is voor duurzame toegankelijkheid.

Het veilig en duurzaam opslaan van bestanden, opgeslagen in een eDepot, dient één belangrijk doel: het beschikbaar stellen van de opgeslagen informatie aan burgers en ambtenaren. Om dat mogelijk te maken levert de archiefvormer een SIP (Submission Information Package) aan voor plaatsing in het eDepot (het ingest-proces; een ingest is het opnemen van een digitaal object in een archief dat zich richt op het duurzaam opslaan, beheren en toegankelijk houden van het geselecteerde materiaal, red.). De SIP bestaat uit de data zelf en een bijbehorende set metadata, gestructureerd tot een ToPX-bestand. Zo’n ToPX-bestand is een XML-bestand dat de hiërarchische opbouw en context van de aan te leveren data bevat, op basis van de volgende beschrijven[1]de structuur: Archief, Dossier, Record en Bestand.

Richtlijn
Het doel van die set metadata is het bieden van toegang tot de bestanden en het duiden van hun samenhang. Metadata zijn de aanvullende informatie, waarmee bestanden uniek beschreven worden. Het toevoegen van metadata aan opgeslagen informatie is niet alleen van belang voor het beheer, maar het fungeert ook als flinke hefboom voor de snelheid waarmee die informatie in data is terug te vinden. In 2009 is voor de Nederlandse overheid een Richtlijn metagegevens overheid gepubliceerd. In 2013 werd het Toepassingsprofiel Metadatering Lokale Overheden (TMLO) vastgesteld als een praktische set metadata voor onder andere overbrenging vanuit gemeen[1]ten naar eDepots. Door TMLO toe te passen bij overbrenging naar een eDepot verwerken gemeenten hun data uniform om die zodoende nadien goed doorzoekbaar te laten zijn en in combinatie met andere datasets beter bruikbaar te maken. Met behulp van meegegeven duurzaam toegankelijke metadata wordt vastgelegd door welk proces en/of zaak een informatieobject wordt gebruikt, zodat bekend is tot welk virtueel dossier dat informatieobject behoort.

Verplicht
Regionaal Archief Tilburg (RA Tilburg) heeft sinds 4 jaar een eDepot in productie. Op dit moment heeft RA Tilburg met acht gemeenten in haar werkgebied aansluitovereenkomsten op het eDepot Archivematica. Dit aansluitproces wordt projectmatig uitgevoerd en kent thans twee fasen: handmatige overdracht en een automatische aansluiting. Alle huidige projecten zijn van die eerste soort. Dat betekent in de praktijk dat gemeenten gescand materiaal bezitten die zij als pdf-bestanden aanbieden en dat de gemeenten de bij[1]behorende metadatasets daarbij dienen aan te leveren. Voor dat laatste gaat RA Tilburg praktisch met TMLO om. Alle daarin benoemde verplichte elementen dienen aangeleverd te worden. Het is immers ontwikkeld als een minimale set metagegevens. Uit de meegegeven TMLO-gebruikersinstructie blijkt bijvoorbeeld dat een element en de subelementen minimaal op een aggregatieniveau beschreven dienen te worden, indien TMLO een element beoordeelt als “verplicht indien van toepassing”. Concreet betekent dit dat een gegeven als “classificatie” wel verplicht is, maar enkel op dossierniveau wordt vermeld en dus op recordniveau niet ook nog eens terugkomt. Door dit uit te leggen aan archiefvormers, bleek dat velen het genoemde begrip “verplicht indien van toepassing” niet zo vrijblijvend konden gebruiken als zij aanvankelijk meenden.

Bekend terrein
Andere ervaringen van de aangesloten gemeenten in het project van informatie-overbrenging naar het eDepot waren dat vanuit de archiefvormer uiteindelijk (slechts) één medewerker het daadwerkelijke werk leverde. Dat werk bestaat uit het ordenen van de benodigde metadata, hiaten opvullen op basis van de beschikbare gegevens ten opzichte van de noodzakelijke set metadata en het omvormen van de totale set tot CSV-bestanden, welke uiteindelijk tot een ToPX-bestand worden gevormd voor de aanlevering van de SIP aan de archiefinstelling. Dit bewerken van metadata en het omvormen van het resultaat naar CSV-formaat is niet voor iedere medewerker bekend terrein. De verantwoordelijk medewerker van de gemeente sprak dan ook vaak terecht over de grote geleverde inspanning van zijn/haar kant, daar waar wij als regionaal archief aanvankelijk (slechts) adviseerden en na ontvangst van de data ermee aan de slag gingen (beoordelen en “ingesten”).

Online koppeling
Om de archiefvormers te helpen bij de vorming van zo’n ToPX-bestand van de twee metadatasets dossier- en bestandsniveau heeft RA Tilburg samen met een aantal collega-instellingen de ToPX Creator laten ontwikkelen. Met deze open source tool kunnen tamelijk eenvoudig online spreadsheets met metagegevens omgezet worden naar CSV-bestanden. Vervolgens maakt de tool daar een ToPX-bestand van. Dit ToPX-bestand bevat inhoudelijke metadata in combinatie met geautomatiseerd opgehaalde technische metadata van de bestanden. Voor dit laatste wordt, naast genoemde CSV-bestanden, ook een online koppeling gelegd naar de feitelijke data, waardoor via ToPX Creator middels online bestandsonderzoek via het programma DROID ook de omvang, type pdf van de scan en ontstaansdatum opgehaald en aan het ToPX-bestand toegevoegd worden.

Tot zover het hierboven kort beschreven “type aansluiting fase 1”. Inmiddels bespreekt RA Tilburg met de “fase 1 ervaren archiefvormers” in het werkgebied de ontwikkeling van een “permanente fase 2 aansluiting” voor die gemeenten op het eDepot. Dan gaat het voortaan om continue overbrenging van vele documentvormen, een rechtstreekse verbinding vanuit het gemeentelijk zaaksysteem naar Archivematica en de mogelijkheid vanuit datzelfde zaaksysteem te zoeken in het eDepot. Hiervoor zal per nieuw (toe te voegen) type dossier/zaaktype steeds opnieuw afstemming plaatsvinden over de noodzakelijke metadataset voor de toegang tot dat type informatie. Ook de beoordeling van de overbrenging door de gemeentearchivaris gebeurt dan periodiek in plaats van per “ingest”, zoals op dit moment in fase 1.

MDTO
Naar verwachting wordt TMLO in de loop van het jaar 2021 gewijzigd tot Metagegevens Duurzaam Toegankelijke Overheidsinformatie (MDTO), die van toepassing is op zowel decentrale als centrale overheden. Met de metadatastandaard MDTO wordt nog beter voorzien in de mogelijkheid tot (her) gebruik van overheidsinformatie tussen de niveaus gemeentelijk, provinciaal en het rijk. Het is belangrijk dat deze metadatastandaarden al worden meegenomen in de design van (zaak)systemen, want de toenemende waarde van metadata voor records valt niet te onderschatten.

Mathé van der Velden heeft dit artikel op persoonlijke titel geschreven.