21 november 2012

Het Rotterdamse metadatamodel

image for Het Rotterdamse metadatamodel image

Het Rotterdamse e-depotproject

Het Rotterdamse e-depotproject
In 2004 is het Stadsarchief Rotterdam gestart met het e-depotproject. Het elektronisch depot is bedoeld om digitale informatieobjecten veilig en duurzaam op te slaan en de informatie actief te beheren. Het Rotterdamse e-depot bevat niet alleen digital born-documenten, maar ook de scans van gedigitaliseerd analoog materiaal. Het project is eind 2006 verdeeld in een project E-depot Stadsarchief en E-depot Concern. Dit betekent dat het e-depot niet alleen aan het stadsarchief overgedragen archieven zal herbergen, maar ook afgesloten dossiers waar gemeentelijke diensten en deelgemeenten nog zelf verantwoordelijk voor zijn.

Het hart van het e-depotsysteem bestaat uit de metadata, de ‘etiketten’ met basisinformatie en beschrijvingen die helpen om de opgeslagen gegevens te karakteriseren en op te zoeken. Zonder metadata is informatie niet vindbaar, onleesbaar en nauwelijks meer te begrijpen of te interpreteren. Al vroeg in het project was duidelijk dat het ontwikkelen van een metadatamodel van groot belang was. De vraag lag op tafel of er een apart metadatamodel moest komen voor enerzijds de digitale documenten en anderzijds de analoge documenten, of dat er één metadatamodel moest komen voor zowel digitaal als analoog materiaal. In Rotterdam werd gekozen voor het laatste. De gedachte hierachter is dat de gebruiker die informatie zoekt, op één plaats alle informatie moet kunnen vinden die er over zijn zoekvraag beschikbaar is, of die informatie nu bestaat uit enen en nullen of gedrukt is op papier. Een tweede reden voor deze keuze is dat niet alleen de informatieobjecten duurzaam moeten worden opgeslagen, maar dat zeker zo belangrijk is dat de vele vaak complexe relaties tussen de objecten behouden blijven. De neerslag van een werkproces kan tegelijk zowel analoge als digitale documenten bevatten. Om het verband tussen deze documenten in de juiste context te bewaren is het noodzakelijk om één metadatamodel te hanteren.

Totstandkoming van het metadatamodel
Al met al was het modelontwerp redelijk ambitieus, want het moest toepasbaar zijn op analoge en digitale documenten (digital born en scans) en tot slot moest het model de metadata kunnen herbergen van niet alleen de overgedragen archiefdocumenten, maar ook de nog niet overgedragen archiefdocumenten. Of dit nog niet genoeg was speelde ook mee dat de backoffice van het Stadsarchief Rotterdam, zoals zoveel archiefinstellingen, opgedeeld was in drie afdelingen, namelijk de afdeling Archieven, de afdeling Historisch Topografische Atlas (voor beeld en geluid) en de afdeling Bibliotheek. De verschillende afdelingen gingen nogal verschillend met metadatering om en soms werden voor dezelfde soort informatie verschillende velden gebruikten. Soms had dit te maken met de beperkingen/dwang van de gebruikte applicatie, maar er waren ook verschillende tradities van waaruit informatieobjecten werden beschreven, beheerd en beschikbaar gesteld. Het ontwikkelen van één metadatamodel waarmee ‘iedereen’ uit de voeten kon, was een lastige, maar gelukkig geen onmogelijke opgave. In maart 2010 werd de eerste versie van het datamodel opgeleverd.* Dit model, dat hierna op hoofdlijnen wordt beschreven, is zeker niet statisch en zal worden aangepast. Nu al wordt steeds meer nationaal en internationaal samengewerkt en we willen graag dat ons datamodel afgestemd blijft op de belangrijkste initiatieven. Naar verwachting zal eind dit jaar een nieuwe versie van het Rotterdams metadadatamodel verschijnen.

Bij het ontwerpen van het model is al zoveel mogelijk gebruik gemaakt van internationale standaarden. Als eerste is gekeken naar beschrijvingsstandaarden als ISAD(G) (General International Standard Archival Description), ISBD (International Standard Bibliographic Description) en Dublin core), maar er is ook gebruik gemaakt van de NENISO 23081, een standaard voor de benodigde metagegevens van archiefdocumenten van de archiefvormer. Door het naast elkaar leggen van de verschillende standaarden zijn de gegevens die vastgelegd moeten worden, verdeeld in drie groepen. Op de eerste plaats zijn er nodig ‘beschrijvende metadata’ voor de identificatie, interpretatie en terugvindbaarheid van een document. Daarnaast zijn er de ‘administratieve of beherende metadata’ voor het vastleggen van informatie over de herkomst, juridische status en vindplaats. Tot slot zijn er de ‘technische metadata’ nodig voor het preserveren en bepalen van de benodigde software en hardware.

De hoofdentiteiten van het model
De basis van het metadatamodel bestaat uit de volgende drie hoofdentiteiten: het ‘logisch object’, het ‘fysiek object’ en de ‘actor’. Een logisch object is de representatie van een als logische eenheid te onderscheiden hoeveelheid informatie. Een logisch object kan enkelvoudig zijn of samengesteld zijn uit meerdere enkelvoudige logische objecten. Het fysiek object is de representatie van het tastbare object, het papieren dossier, de foto, de ‘nullen en enen’ van een digitaal document. De reden waarom het handig is om zowel een entiteit logisch object als een entiteit fysiek object te hebben kan het best worden geïllustreerd met een voorbeeld. Het stadsarchief besluit een foto te digitaliseren in een duurzaam TIFF-formaat en een handig JPEG-raadpleegformaat. Door deze digitalisering zijn er nu drie fysieke objecten van de foto (papier en twee soorten digitale bestanden) die alle drie op verschillende manieren moeten worden beheerd. Er is echter maar één logisch object, de afbeelding, die inhoudelijk moet worden beschreven.
De hoofdentiteit actor is nodig om een representatie te kunnen maken van personen, families en organisaties die een rol spelen bij de creatie en/of het beheer van objecten. Dat er actoren moesten worden vastgelegd bij het beschrijven van documenten was niet nieuw. Wel nieuw was het feit dat deze actoren worden vastgelegd in zogenaamde authority files. Hierdoor hoeft een actor maar één keer te worden vastgelegd in het systeem. De authority files zorgen ervoor dat verschillende zoekopdrachten (Bram Peper, Abraham Peper, Burgemeester Peper) een optimaal resultaat geven.
De actor kan echter op verschillende wijzen in relatie staan tot de opgeslagen informatie. Bijvoorbeeld oud-burgemeester Bram Peper van Rotterdam kan als rol hebben archiefvormer, maar ook auteur of geportretteerde. De actoren vormen de schakels tussen de informatieobjecten en worden archief- en collectieoverstijgend gebruikt. Ze zijn gemodelleerd volgens de ISAAR(CPF)-standaard (International Standard Archival Authority Record For Corporate Bodies, Persons and Families).

Naast de drie genoemde hoofdentiteiten is een belangrijke entiteit de ‘aanwinst’. De aanwinst vereist dat er van tevoren wordt bepaald wat er wordt toegelaten tot onze depots, waaronder het e-depot. De aanwinst vereist controle van de kwaliteit en vereist het vastleggen van minimale noodzakelijke metadata. Ook hierbij gold overigens dat de drie verschillende afdelingen bij de beschrijving van een aanwinst andere regels hanteerden. Bij bijvoorbeeld de afdeling Atlas was het gebruikelijk om zoveel mogelijk op stuksniveau een aanwinst te beschrijven en bij de afdeling Archieven ging het veel vaker over hele archiefblokken. Deze verschillende methoden werden overbrugd en er is nu een uniforme procedure.

Implementatie van het metadatamodel
Om het metadatamodel te implementeren en zo uniformiteit in beheer, enkelvoudige opslag van metadata en efficiencywinst te realiseren, is besloten om naar één beherend systeem over te gaan en zijn de verschillende afdelingsapplicaties verlaten. Gekozen is voor het systeem Atlantis, geleverd door de firma Deventit. Samen met het systeem waarin de digitale bestanden worden opgeslagen en beheerd, de Safety Deposity Box (SDB) van de firma Tessella, vormt het gezamenlijk het Rotterdamse e-depot.
De implementatie van het metadatamodel zal ook zeker doorwerken voor de gebruikers van onze informatie. Gebruikers zullen minder worden lastiggevallen met specialistische terminologie en zullen gemakkelijker door alle informatie kunnen zoeken op een uniforme manier. De gebruiker wordt uiteraard niet lastig gevallen met termen als logisch of fysiek object.
Een keerzijde van het metadatamodel is de grote hoeveelheid retrowerk om de data naar eenzelfde standaardniveau te brengen. Bestaande metadata moeten worden geconverteerd naar het nieuwe systeem en waar nodig worden aangepast en dat kost tijd. Overigens heeft het retrowerk wel gezorgd voor een kwaliteitsimpuls voor de al bestaande metadata. In een aantal gevallen worden er nu zelfs gegevens vastgelegd die vroeger niet of deels werden vastgelegd.

Samenwerking met de archiefvormers
Tot voor kort werden archiefbescheiden die waren overgedragen door een archiefvormer nogal eens opnieuw beschreven door de archivaris. De metadata, toegevoegd door de archiefvormer zelf, voldeden in zijn ogen niet voor de gebruiker die op zoek was naar cultuurhistorische informatie. Goede samenwerking met archiefvormende instanties kan ervoor zorgen dat dit soort herbeschrijvingen van archiefdocumenten niet meer nodig is. Er kan immers gebruik worden gemaakt van een bestaand metadatamodel. Het is beslist niet nodig om alle metadata uit het metadatamodel aan te leveren. Het Stadsarchief Rotterdam heeft in het zogenaamde overdrachtsprotocol* een overzicht gemaakt van de minimaal aan te leveren metadata. Het is van belang om als organisatie die op het e-depot aangesloten wil worden, zo snel mogelijk een mapping te maken tussen de informatie die zal worden aangeleverd vanuit de eigen applicaties met het metadatamodel.
Het kan ook voorkomen dat in de systemen van de archiefvormer metadata worden vastgelegd die volgens de lijst van het stadsarchief niet aan het e-depot hoeven te worden aangeleverd. Toch kunnen die metadata van groot belang zijn voor de organisatie. Procesmetadata, bijvoorbeeld wanneer en door wie een besluit is goedgekeurd, zijn niet verplicht aan te leveren, maar kunnen voor de proceseigenaar van belang zijn. Deze informatie, de zogenaamde agency specific-metadata, kunnen in overleg ook worden overgedragen. De bedoeling van deze methode is dat de informatieobjecten zowel door de primaire gebruiker, de archiefvormer, als later door de secundaire gebruikers makkelijk kunnen worden gevonden en in de juiste context kunnen worden geïnterpreteerd.

rja.rommelse@Rotterdam.nl, Drs. R.J.A. Rommelse is expert Informatiebeheer van het Stadsarchief Rotterdam.


* Het Rotterdamse metadatamodel en het overdrachtprotocol voor digitale informatie zijn te vinden op de website ‘Informatiebeheer Rotterdam’ van het stadsarchief: