1 juli 2019

Kennisbijeenkomst voorkeursformaten en (pre)ingest tooling

image for Kennisbijeenkomst voorkeursformaten en (pre)ingest tooling image

De ochtend stond vooral in het teken van bestandsformaten. Na de aftrap door dagvoorzitter Wouter Brunner (Haags Gemeentearchief, aanjager van het Kennisplatform E-Depot) nam Remco van Veenendaal, preservation officer van het Nationaal Archief (NA), ons met zevenmijlslaarzen mee langs diverse aspecten van duurzaamheidsbeleid. Wat is duurzaamheidsbeleid eigenlijk, hoe maak je het en welke hulpmiddelen zijn er beschikbaar?

De ochtend stond vooral in het teken van bestandsformaten. Na de aftrap door dagvoorzitter Wouter Brunner (Haags Gemeentearchief, aanjager van het Kennisplatform E-Depot) nam Remco van Veenendaal, preservation officer van het Nationaal Archief (NA), ons met zevenmijlslaarzen mee langs diverse aspecten van duurzaamheidsbeleid. Wat is duurzaamheidsbeleid eigenlijk, hoe maak je het en welke hulpmiddelen zijn er beschikbaar?

Heel wat, zo bleek. Van de Wegwijzer Duurzaamheidsbeleid1 van het Netwerk Digitaal Erfgoed tot Europese initiatieven om in EU-verband digitale archivering (e-archiving) tot een bouwblok te maken van een gemeenschappelijke digitale markt.2 Maar ook de legio voorbeelden van andere organisaties, in Nederland en daarbuiten. En vergeet niet, de meeste organisaties hebben al heel wat ongeschreven beleid dat alleen moet worden verzameld en vastgelegd.

Voorkeursformaten
Na deze inleiding gingen Pepijn Lucker (NA), Annelies Cordes en Erwin Verbruggen (Nederlands Instituut voor Beeld en Geluid, NIBG) en Robert Gillesse (Internationaal Instituut voor Sociale Geschiedenis, IISG) meer de diepte in. Ze legden uit hoe hun organisaties met het thema ‘voorkeursformaten’ omgaan.

NA-voorkeursformaten en acceptabele formaten in het kort

Informatiesoort  Voorkeursformaat Acceptabel formaat
Audio  WAV, WAVE, BWF MP3, AAC
Database SQL, SIARD, ODB ACDB, MDB
Document PDF/A-1, PDF/A-2, ODT PDF 1.7, DOC, DOCX
E-mail EML MSG, PST, MBOX
Image TIFF, PNG JPEG, JPG, JP2, JPX
Presentation ODP, PDF/A PPT, PPTX
Spreadsheet ODS, CSV, PDF/A XLS, XLSX
Vector Image SVG In overleg
Video MXF MPEG-4, MKV

Het Nationaal Archief heeft zijn duurzaamheidsbeleid – de preservation policy – in 2015 vastgesteld. Deze policy is vervolgens nader uitgewerkt in onder andere de handreiking Voorkeursformaten Nationaal Archief.3 Voor diverse informatiesoorten, bijvoorbeeld spreadsheets of audiovisueel materiaal, is bepaald in welk bestandsformaat deze bij voorkeur moeten worden aangeleverd.

Veel deelnemers in de zaal bleken de handreiking Voorkeursformaten niet alleen te kennen maar deze ook te gebruiken. De handreiking voorziet dus in een behoefte.

Maar digitale ontwikkelingen gaan snel en de handreiking is toe aan een update. Een redactiegroep, met experts vanuit het NA en daarbuiten, werkt daarom dit jaar aan een nieuwe versie. De redactiegroep actualiseert de informatie, brengt meer detaillering aan, en breidt het aantal informatiesoorten uit met bijvoorbeeld web-archieven en geo-informatie. En er komt bijvoorbeeld meer informatie in over de te gebruiken bitrates en codecs van beeldmateriaal.

Vervolgens is er op het kennisplatform Preservation op KIA een reviewronde. Hieraan kan iedereen die geïnteresseerd is deelnemen (zie kader). Na verwerking van de input wordt eind dit jaar de nieuwe versie vastgesteld. Het NIBG beheert circa 70% van het Nederlandse audiovisuele erfgoed. De collectie omvat nu meer dan 900.000 uur aan geluids- en beeldmateriaal en elk jaar komen daar duizenden uren bij. Ook het NIBG heeft in zijn duurzaamheidsbeleid (2016) een beperkt aantal formaten aangewezen voor duurzame preservering. Voor deze formaten kan het NIBG duurzaamheidsgaranties afgeven.4

Beeld en Geluid slaat van elk bestand drie kopieën op in diverse ‘standaardformaten’: een zichtkopie (proxy), een uitleverkopie (mezzanine) en een archiefmaster (preserveringsmaster). Alles wat bij aanlevering niet aan de richtlijnen voldoet wordt naar deze standaardformaten genormaliseerd.

De voorgeschreven standaard AV-formaten als MXF of MPEG-4 (zogenoemde wrappers of containerformaten) zeggen op zichzelf echter niet zoveel. Belangrijker is wat er in de container zit en wat de kwaliteit daarvan is. Het belangrijkste daarbij is de mate van compressie: ongecomprimeerd, zonder verlies (lossless), of met verlies (lossy).

Maar wat te doen met nieuwe vormen als games of webvideo? In plaats van alles om te zetten naar standaardformaten (normaliseren) kijkt het NIBG daarom ook naar andere strategieën zoals ‘just-in-time’ (alleen omzetten als het moet). Of naar emulatie van de oorspronkelijke software, waarin het originele bestand afspeelbaar is. De komende tijd doet het NIBG onderzoek naar welke formaten in aanmerking komen voor deze nieuwe scenario’s.

Het IISG heeft een heel andere insteek als het om voorkeursformaten gaat. Het IISG beheert particuliere archieven en kan zich dus niet beroepen op de Archiefwet. Met de archiefdonor kunnen geen dwingende afspraken worden gemaakt over zaken als ordening van het archief, metadata en bestandsformaten. Een voorkeursformatenrichtlijn is voor het IISG dus niet zinvol.

Als gevolg hiervan krijgt het IISG een veelheid aan verschillende bestandsformaten binnen, in meer of mindere mate geordend en vaak zonder beschrijvende metadata. Het IISG hanteert als uitgangspunt dat de archieven waar mogelijk in het originele formaat worden opgeslagen en bewaard. Obscure of verouderde formaten worden daarnaast naar een vastgestelde set standaardformaten genormaliseerd. De omgezette bestanden zijn de zogenoemde preservation copies. Het origineel blijft daarbij altijd bewaard. Videobestanden zijn voor het IISG een hoofdpijndossier: deze worden nu allemaal omgezet naar een bepaald type bestandsformaat (MKV FFV1) met ‘lossless compressie’. Omdat er van deze bestanden met een grote omvang ook nog diverse back-up-kopieën worden gemaakt, betekent dat in de praktijk hoge opslagkosten. Het is mogelijk realistischer om volgens het just in time-principe de videobestanden alleen te migreren wanneer het echt nodig is.

Kennis delen via de preservation watch
De meeste organisaties hebben niet alle specialistische kennis over bestandsformaten in huis. Daarom is het goed om kennis met elkaar te delen. Zo zijn er in Nederland nu diverse instituten die een zogenoemde preservation watch5 hebben ingesteld. Hiermee worden bijvoorbeeld de veranderende behoeftes van de gebruikers van archieven in de gaten gehouden. Of de ontwikkelingen op technologisch gebied die invloed hebben op de wijze van vorming, aanlevering en aanbod van digitaal archief. Om deze ontwikkelingen goed bij te kunnen benen is bundeling van krachten noodzakelijk. Het Netwerk Digitaal Erfgoed (NDE) zet daarom de eerste stappen op weg naar een gezamenlijke preservation watch.

Daarbij geldt overigens wel een kanttekening: wat goed is voor de ene organisatie, hoeft niet goed te zijn voor andere organisaties. Een voorbeeld: de eisen die het NIBG stelt aan de aanleverende omroepen, kunnen niet een-op-een worden overgenomen door het IISG of het NA. De context – zoals wel of geen Archiefwet – is steeds anders. Het vaststellen van voorkeursformaten en het formuleren van preserveringsbeleid blijft daarmee toch ook afhankelijk van de eigen keuzes en organisatiedoelen.

Tooling en onderzoek
Het vervolg van de kennisbijeenkomst ging vooral over tooling voor de (pre-)ingest-fase (de voorbereiding op of het moment van opname in het e-depot): welke tools zijn er, hoe kun je ze gebruiken, wat missen we nog? Dit thema sloot aan op de vorige bijeenkomst van het Kennisplatform E-depot. Toen stonden de leveranciers van de grotere zogenoemde end to end-systemen in de schijnwerpers. Zij bieden functionaliteiten voor de hele keten, van opname in het e-depot tot toegang. Deze keer kregen aanbieders van functie-specifieke softwaretools de gelegenheid hun waren te presenteren. Denk daarbij aan tools voor identificatie (welk bestandsformaat is het?) of validatie (is het bestand correct opgemaakt?). Of specifiek voor een bepaald type archief, zoals audiovisueel materiaal.

Sinds enkele jaren is het Kennisnetwerk Informatie en Archief (KIA) dé ontmoetingsplaats voor professionals in de informatie-, archiefen erfgoedwereld. Je kunt lid worden van kennisplatforms, deelnemen aan vakinhoudelijke discussies, online samenwerken en kennis uitwisselen. Maar KIA is niet alleen een online platform. Regelmatig organiseren de kennisplatforms bijeenkomsten en evenementen waar collega-professionals in de archief- en informatiewereld elkaar in levenden lijve ontmoeten en kennis uitwisselen. Je vindt KIA op kia.pleio.nl

Programmamanager Marcel Ras schetste hoe het NDE meer zicht wil krijgen op het gebruik van pre-ingest tools. Welke tools gebruiken we in Nederland binnen welke sectoren? Wat kunnen deze tools wel en wat niet? Voor welke functies en/of materiaaltypen worden ze gebruikt? En hoe volwassen zijn ze? Dit wordt uitgezocht in het project Preserveringstools van het werkprogramma Digitaal Erfgoed Houdbaar. Projectleider Ania Molenda presenteerde de eerste resultaten van het onderzoek. Deze laten zien dat er per sector en per type materiaal een grote verscheidenheid aan tools gebruikt wordt door Nederlandse erfgoedinstellingen. Deels gaat het om tools die ontwikkeld zijn door bekende leveranciers van digitale duurzaamheidsoplossingen of binnen internationale samenwerkingsverbanden. Maar voor een groot deel zijn het door instellingen zelf ontwikkelde scripts en software. Hoewel ze vaak cruciale processen uitvoeren, is het beheer van de tools zelf vaak niet of nauwelijks geregeld.

Vervolgonderzoek
De onderzoeksgegevens worden opgenomen in een uitgebreide matrix van tools en processen. Daarmee ontstaat een overzicht van de door Nederlandse erfgoedinstellingen gebruikte tools per functie en materiaaltype. Maar ook van wat er nog ontbreekt. Zo blijkt er grote behoefte te zijn aan tools voor verwerking en analyse van social media, video, databases, Microsoft Office-bestanden en software-based Art. Daarnaast is het projectteam bezig met een overzicht van tools die door verschillende type instellingen gebruikt worden. Hierdoor worden samenwerking, het delen van kennis en de uitwisseling van praktijkervaringen met de tools mogelijk. En aan dat laatste, zo bleek tijdens de kennisbijeenkomst, heeft de sector de meeste behoefte.

De resultaten van dit onderzoek voegt het NDE toe aan de landkaart van voorzieningen voor duurzame toegang.6 Deze landkaart maakt deel uit van de zogenoemde gereedschapskist van generieke voorzieningen die het NDE in 2019-2020 ontwikkelt. Deze gereedschapskist wordt gevuld met tools, diensten en andere instrumenten die erfgoedinstellingen helpen om hun digitale collecties beter zichtbaar, bruikbaar en houdbaar te maken. Het project preserveringstools zal zich richten op goed beheer voor de meest cruciale tools en het stimuleren van de ontwikkeling van nieuwe tools.

Meer weten?
De bijeenkomst was een mooie gelegenheid voor informatieprofessionals om kennis op te doen over preserveringsbeleid, voorkeursformaten en preserveringstools. Maar ook om elkaar te ontmoeten en ervaringen uit te wisselen. De presentaties en een foto-impressie staan inmiddels op KIA bij het Kennisplatform Preservation. Op KIA vind je ook informatie over alle aankomende evenementen en nog veel meer. Houd dus de Kennisplatforms E-depot en Preservation in de gaten. Of beter nog: word lid van de community en discussieer mee, stel je vragen, doe inspiratie op en deel je eigen successen!


Pepijn Lucker
Adviseur preservation bij het Nationaal Archief, aanjager van het KIA kennisplatform Preservation 


Noten

1 Zie https://wegwijzerduurzaamheidsbeleid.nl.
2 Zie https://ec.europa.eu/cefdigital/wiki/display/CEFDIGITAL/eArchiving+Standards.
3 Zie https://www.nationaalarchief.nl/archiveren/kennisbank/handreiking-voorkeursformaten-nationaal-archief.
4 Zie de Preservation policy van Beeld en Geluid: http://publications.beeldengeluid.nl/pub/388.
5 Zie https://www.nationaalarchief.nl/archiveren/nieuws/preservationwatch-bij-het-nationaal-archief voor informatie over de Preservation Watch bij het Nationaal Archief.
6 Zie https://www.netwerkdigitaalerfgoed.nl/news/nieuwe-landkaartvan-digitale-duurzaamheidsvoorzieningen/.

Geef een reactie

Het e-mailadres wordt niet gepubliceerd. Vereiste velden zijn gemarkeerd met *