, 14 februari 2019

Draai de kraan van digitale achterstanden dicht en begin met website-archivering

image for Draai de kraan van digitale achterstanden dicht en begin met website-archivering image Actueel

Websites zijn lange tijd beschouwd als moderne plaatjesboeken. Niet verwonderlijk, aangezien ze dat lange tijd ook waren. Websites waren een nieuwe manier om informatie, verluchtigd met plaatjes, te zenden, als eenrichtingsverkeer. Veel organisaties gebruikten hun website alleen als een aanvullend middel om dezelfde informatie die primair op andere plekken stond nog eens extra onder de aandacht te brengen. Oftewel als een brochure, of een plaatjesboek.

Websites zijn lange tijd beschouwd als moderne plaatjesboeken. Niet verwonderlijk, aangezien ze dat lange tijd ook waren. Websites waren een nieuwe manier om informatie, verluchtigd met plaatjes, te zenden, als eenrichtingsverkeer. Veel organisaties gebruikten hun website alleen als een aanvullend middel om dezelfde informatie die primair op andere plekken stond nog eens extra onder de aandacht te brengen. Oftewel als een brochure, of een plaatjesboek.

Inmiddels is dat wel anders. Je komt vast wel eens op de website van je gemeente. En bent er allang aan gewend dat je daar je paspoort kunt aanvragen, of een kapvergunning, of een subsidie. We gaan er automatisch vanuit dat we deze diensten meteen via de site kunnen regelen. De overheid biedt diensten immers sinds 2017 in de eerste plaats digitaal aan. We zijn het dus gewend en vertrouwen erop dat de informatie op websites altijd actueel is en klopt. Want als burger kun je daar rechten aan ontlenen, net als verantwoordelijkheden.

Je leest er bijvoorbeeld welke regels gelden voor het aanvragen van die kapvergunning, of onder welke voorwaarden je in aanmerking komt voor een subsidie. Je vertrouwt erop dat de informatie op die website vindbaar en volledig is, en bovenal betrouwbaar en authentiek. Maar de informatie op de site kan elk moment geüpdatet worden. Bij een bezwaar of beroep kunnen burgers, bedrijven, maar ook de betreffende overheidsinstantie zélf, een eerdere versie nodig hebben.

De authenticiteit en volledigheid van informatie op websites is niet alleen voor ons op dit moment van belang. Stel je voor: over vijftig jaar wordt onderzoek gedaan naar de MH17-ramp. Dan zal er veel waarde gehecht worden aan de website van de Rijksoverheid waarop de Nederlandse overheid haar officiële standpunt ten aanzien van Rusland benoemt, zie afbeelding hieronder. Bij zo’n onderzoek wil men erop vertrouwen dat die informatie niet per ongeluk of moedwillig gewijzigd is en dat men precies hetzelfde bericht ziet zoals wij vandaag kunnen zien.

Pagina met info over MH17

 

Belangrijke informatie
We kunnen dus concluderen dat websites geen plaatjesboeken of hulpmiddelen zijn. Vandaag de dag gebruiken overheden hun websites als hét primaire communicatiemiddel met burgers. En bovendien als officieel publicatiekanaal voor belangrijke informatie. Dat betekent dat websites net zo goed de output van overheidshandelen zijn als alle andere vormen van informatie die de overheid produceert, zoals documenten en e-mails. Het is van belang websites met dezelfde zorg te behandelen als die aangewend wordt voor andere informatie van de overheid, vanwege de grote waarde ervan. Om later overheidshandelen te kunnen reconstrueren, maar ook om daarover verantwoording af te leggen aan burgers, bedrijven en de politiek. De informatie op websites is daarnaast van belang voor huidig en toekomstig onderzoek. Bovendien vormen websites een bron van erfgoed omdat ze een uiting van onze cultuur zijn en laten zien hoe de overheid zich presenteert aan de maatschappij. 

Het garanderen van duurzame toegankelijkheid van websites gaat niet vanzelf. Websites veranderen vaak: de gemiddelde levensduur wordt geschat op zo’n drie jaar en voor individuele webpagina’s is dat nog korter. En we kennen allemaal de ‘404 Page not found’-melding als de link van een webpagina niet meer bestaat of werkt. Bovendien, wat betekenen begrippen als authenticiteit, volledigheid, en toegang, in de wereld van websites eigenlijk  precies? Daarvoor is een vertaalslag en concretisering nodig.

Daarom een richtlijn met handvatten
De noodzaak voor het goed archiveren van overheidswebsites werd breed onder de aandacht gebracht door een rapport van de Erfgoedinspectie (EGI). Die constateerde dat slechts 5% van de overheidswebsites gearchiveerd wordt. De EGI wees op de juridische en financiële risico’s hiervan. In antwoord hierop gaf de minister van Onderwijs, Cultuur, en Wetenschap het Nationaal Archief de opdracht voor het maken van een handreiking.

Dat is de Richtlijn archiveren overheidswebsites geworden, product van het Nationaal Archief die 21 januari 2019 gepubliceerd is op KIA en is vastgesteld door de Standaardisatieraad van het Nationaal Archief. De Standaardisatieraad bestaat uit vertegenwoordigers op bestuurlijk niveau van centrale en decentrale overheden en archiefinstellingen.

In de richtlijn hebben wij (het Nationaal Archief samen met verschillende experts van andere organisaties) de vereisten voor duurzame toegankelijkheid van websites vastgelegd. Zodat overheden meteen kunnen beginnen met het archiveren van hun websites. 

Samen ontwikkeld

De richtlijn is een product van het Nationaal Archief. Maar het is samen met een brede groep kritische experts van verschillende overheidsorganisaties en archiefinstellingen ontwikkeld. Er is veel kennis aangedragen in de grote openbare review op de conceptversie van de richtlijn. Daaraan namen een kleine dertig organisaties deel, die gezamenlijk zeshonderd commentaren instuurden. Die commentaren zijn vervolgens verwerkt door een redactiegroep waaraan verschillende experts deelnamen. Zo is de richtlijn ontstaan.

 Bestaande webarchieven
Sommige overheden doen dit natuurlijk al, en daarnaast zijn veel overheidswebsites terug te vinden in de Wayback Machine. Dat is een enorm webarchief van het bedrijf Internet Archive dat alle websites van de hele wereld archiveert. Je zou denken dat we er daarmee allang zijn. 

Maar helaas: Internet Archive archiveert niet álle pagina’s en links binnen een site, en ook niet alle wijzigingen van die site. Zie de toegang tot het webarchief op de afbeelding van de gemeente Amsterdam in de Wayback Machine hieronder. Alleen op de dagen die op de kalender groen en blauw zijn gemarkeerd is de site gearchiveerd. Maar de live-website is veel vaker gewijzigd dan alleen op die dagen, zoals onderaan de webpagina van Internet Archive is te lezen.

Wayback Machine Amsterdam

Ook de Koninklijke Bibliotheek en het Nederlands Instituut voor Beeld en Geluid archiveren Nederlandse overheidswebsites. Maar dat doen ze (evenals Internet Archive) voor hun eigen doelstellingen. Daarom kiezen ze zelf welke websites ze hoe vaak archiveren, hoe lang ze de informatie bewaren en welke kwaliteitseisen ze daarbij stellen. Die keuzes komen zelden overeen met keuzes die voortvloeien uit de archiefwetgeving.

Ondanks dat veel overheidswebsites (gedeeltelijk) meegenomen worden bij de archivering door anderen, kun je – als informatie producerende overheidsorganisatie – daar dus niet op vertrouwen. Je bent er zelf van. De richtlijn biedt hulp door duurzame toegankelijkheid te vertalen naar toepassing op websites.

Moet dat van de Archiefwet?
Staat het in de Archiefwet dat websites gearchiveerd moeten worden? Die vraag kregen we vaak tijdens het schrijven van de richtlijn. Het antwoord is nee. Maar de noodzaak om websites duurzaam toegankelijk te maken volgt wel degelijk uit de Archiefwet. De Archiefwet 19951 verplicht overheidsorganisaties zorg te dragen voor de ‘goede, geordende en toegankelijke staat’ van ‘de onder hen berustende archiefbescheiden’. De wet noemt daarbij niet expliciet websites. Maar onder archiefbescheiden wordt verstaan álle informatie die een overheidsorganisatie ontvangt of maakt bij het uitvoeren van haar taken. Het maakt niet uit of die informatie op papier of op websites staat. 

Voor informatie die blijvend bewaard moet worden (dus ook openbare websites) verplicht de Archiefregeling2 overheidsorganisaties daarbij te voldoen aan toetsbare eisen.

De richtlijn is bedoeld als invulling van die toetsbare eisen. Overheidsorganisaties hoeven deze eisen niet te volgen, maar dan zullen ze hun eigen eisen moeten opstellen. De richtlijn is dan ook niet verplicht. Het is een norm: een soort standaard die met consensus van experts tot stand komt en gemakkelijk overgenomen kan worden. De keuze om openbare overheidswebsites blijvend te bewaren volgt ook niet uit de Archiefwet. Dat bepalen overheidsorganisaties zelf, in samenspraak met de algemeen rijksarchivaris. Maar het advies is om openbare overheidswebsites wel blijvend te bewaren. Vanwege het grote belang van de informatie voor later, en in aansluiting op bestaande selectiekeuzes zoals de gemeentelijke selectielijst en het Generiek Waarderingsmodel Rijk.

Scope van de richtlijn: openbare overheidswebsites inclusief hun verschijningsvorm
De richtlijn is alleen gericht op openbare overheidswebsites. Social media, websites die niet openbaar zijn, of waarvan de inhoud afhankelijk is van persoonlijke gegevens (bijvoorbeeld omdat je moet inloggen) vallen allemaal niet onder de scope van de richtlijn. De reden daarvoor is dat voor die vormen van websites nog geen gangbare, generieke oplossingen bekend zijn. Maar ook omdat hiervoor nieuwe vraagstukken rond de privacy opdoemen.

Tijdens het schrijven van de richtlijn kregen we de vraag waarom eigenlijk de websites, oftewel de webpagina’s zelf, gearchiveerd moet worden? Waarom niet alleen de onderliggende content die in andere systemen zit? Het antwoord daarop volgt uit de Archiefregeling: ‘De zorgdrager zorgt ervoor dat van elk van de archiefbescheiden te allen tijde kan worden vastgesteld: […] de inhoud, structuur en verschijningsvorm bij het ontvangen of opmaken ervan door het overheidsorgaan.’

De verschijningsvorm van de informatie doet er dus ook toe. Een onderzoeker die over vijftig jaar de pagina van de Rijksoverheid met het MH17-standpunt wil zien, zal die willen zien zoals wij hem vandaag zien. En een burger die de voorwaarden voor zijn subsidieaanvraag op de dag van zijn aanvraag wil terughalen, wil ook de webpagina bekijken zoals die toen op de website stond.

Inhoud van de richtlijn
De richtlijn bevat dus eisen aan de archivering van openbare overheidswebsites. Die eisen gaan enerzijds over de vorming en het beheer van een duurzaam toegankelijk webarchief. Zoals het dagelijks archiveren van wijzigingen aan websites en het toevoegen van de juiste metadata. Denk ook aan de omgang met dynamische elementen op webpagina’s die niet goed geharvest kunnen worden. Harvesting is de techniek waarmee websites binnengehaald worden. Dit wordt veelal uitbesteed aan een commerciële leverancier. 

Kwaliteitscontrole en beveiliging zijn, zeker in het geval sprake is van een commerciële leverancier, belangrijke zaken. Anderzijds gaan de eisen over de toegang en ontsluiting van het webarchief. Gebruikers van een webarchief moeten alle versies gemakkelijk kunnen raadplegen. Ze moeten bijvoorbeeld full text kunnen zoeken en het webarchief moet online openbaar beschikbaar zijn. Met de mogelijke uitzondering van webpagina’s waarvoor om juridische of technische redenen de toegang beperkt wordt.

Nú ingrijpen om niet straks te dweilen
Het archiveren van websites is geen innovatie, en niet iets van later. Als we willen voorkomen dat websites de nieuwe papieren achterstanden worden, of zelfs onherroepelijk verloren gaan, moeten we nú die kraan dichtdraaien. 


 Suzi Szabo

is adviseur kennisontwikkeling digitale archivering bij het Nationaal Archief. Zij werkte mee aan de ontwikkeling van deze richtlijn. 


Noten 

1 Zie artikel 3 uit de Archiefwet 1995: https://wetten.overheid.nl/BWBR0007376/2018-07-28.
2 Zie artikel 16 van de Archiefregeling: https://wetten.overheid.nl/BWBR0027041/2014-01-01.