Een reeks van vijf artikelen schetst een beeld van webarchivering in Nederland in zijn verschillende facetten.
Om te beginnen: wat is nu het Nederlandse nationale domein op het wereldwijde web? Omdat het world wide web in principe geen grenzen heeft, kunnen we het Nederlandse web omschrijven als alles dat op het web wordt gepubliceerd van of over Nederland. Hierbij kunnen we nog op de geografi sche locatie inzoomen (wat wordt gepubliceerd binnen onze landsgrenzen), op taal (wat wordt op het web gepubliceerd in het Nederlands) of op nationaliteit (welke Nederlanders publiceren wat op het web). Vrijwel iedereen in Nederland is bekend met de .nl-domein uitgang, het tweede nationale domein in de wereld dat in april 1986 werd geregistreerd. De eerste Nederlandse website van het Nationaal Instituut voor Sub atomaire Fysica kwam in februari 1992 online als de derde website in de wereld. Na deze ‘oerknal’” explodeerde het Nederlandse web in 23 jaar tot de 5,7 miljoen Nederlandse domeinnamen die het .nl-domein anno 2017 telt en een onbekend aantal Nederlandse sites of sites over Nederland met een andere extensie. Het Nederlandse .nl-webdomein is gezien het aantal geregistreerde websites per inwoner nog steeds het grootste nationale webdomein van de wereld na het .uk-domein. Desondanks (of misschien wel vanwege dit) wordt nog weinig onderzoek gedaan naar wat het Nederlandse nationale webdomein nu precies omvat. Webcollectie Het is belangrijk om verschil te maken tussen een webarchief en een webcollectie, omdat het proces van webarchivering kan plaatsvinden vanuit een archief- en een collectieperspectief, wat gevolgen heeft voor het proces van selectie, opslag en presentatie.1 NA, KB en overheidsinstellingen Webarchivering vanuit archiefperspectief wordt uitgevoerd door het Nationaal Archief of door de overheidsinstellingen zelf. Dit gebeurt in de praktijk nog niet voldoende, zoals blijkt uit een rapport van de Erfgoedinspectie.4 Het Nationaal Archief heeft in april 2016 een aantal websites opgenomen in het e-depot.5 In tegenstelling tot het Nationaal Archief bouwt de KB haar verzameling gearchiveerde websites op vanuit een collectieperspectief.6 Het belangrijkste criterium is de waarde van een site als Nederlands cultureel erfgoed: het belang van de verzamelde digitale objecten voor de bestudering van de Nederlandse cultuur nu en in de toekomst.7 Lagen in het webdomein
Daarbij komen nog twee extra lagen die Brügger niet noemt: die van het deep web, dat deel dat niet door webcrawlers kan worden bezocht, zoals de delen van websites die worden afgeschermd door het bestand robots.txt en databases, en daarbuiten nog het dark web, dat deel van het web dat alleen met een speciale browser kan worden bezocht. De laatste laag valt voor zover bekend buiten de webarchivering zoals die in Nederland door erfgoedinstellingen wordt uitgevoerd. Al deze lagen worden met elkaar verbonden door middel van koppelingen of hyperlinks: zowel op het niveau van de webpagina als die op het wereldwijde web. Deze link structuur kan zichtbaar en aanklikbaar zijn. De linkstructuur kan ook onzichtbaar voor de gebruiker zijn verwerkt in de broncode of juist worden gegenereerd door de website of door de webserver. De linkstructuur is een kenmerkend onderdeel van het wereldwijde web en bovendien een belangrijke bron om de historische context van een website goed te kunnen begrijpen. Fasen en contexten Op grond van een model over de wijze waarop informatie via het web van de producent naar de gebruiker gaat, dan valt op dat we drie fasen kunnen onderscheiden: zender, medium en ontvanger; en al deze fasen hebben een eigen context waarin een bron tot stand komt.9 De boodschap in de productiefase is de ongepubliceerde website, de website wordt in de consumerfase opgeslagen door de webarchiverende instelling. Webarchivering vindt daarom plaats in het derde hokje van onderstaaande figuur.
Wie in Nederland doen niet aan web archivering? Wie in Nederland doen aan webarchiving? Breed spectrum In het tweede artikel van deze serie zullen we nader ingaan op de verschillende webarchiveringsinitiatieven in Nederland en het overzicht dat daarvan gecreëerd wordt door het Netwerk Digitaal Erfgoed en de Nationale Coalitie Digitale Duurzaamheid. Constructie van een nieuwe bron Het resultaat van de oogst In cultuur gebracht Tot slot: het is belangrijk dat Nederlandse erfgoedinstellingen op nationaal en lokaal niveau webarchiveren en samenwerken in nationaal verband om het resultaat zo bruikbaar mogelijk te maken voor toekomstige onderzoekers. Kees.Teszelszky@kb.nl, Dr. Kees Teszelszky is onderzoeker Webarchivering bij de afdeling Digitale Duurzame Toegang van de Koninklijke Bibliotheek Noten: 1 Zie: http://ingmarbladertenschrijft.blogspot.nl/2011/04/websitesarchiveren-of-websites.html en de opmerking van Ton de Looijeronder dit blog. Voor de discussie over webarchivering als archiefactiviteit, zie: Aïda Chebbi, Archivage du Web organisationnel dans une perspective archivistique. PhD dissertatie, Université de Montréal. December 2012 (https://papyrus.bib.umontreal.ca/xmlui/bitstream/handle/1866/9203/Chebbi_Aida_2013_these.pdf?sequence=4&isAllowed=y). 2 Lexicon van Nederlandse Archieftermen. Den Haag, 1983, 1991. 13. 3 http://wetten.overheid.nl/BWBR0007376/2015-07-18. Zie ook: http://digitaalduurzaam.blogspot.nl/2011/04/webarchivering-innederland-de-status.html 4 https://www.erfgoedinspectie.nl/actueel/nieuws/2016/12/7/webarchivering-bij-de-centrale-overheid-gebeurt-nauwelijks; Webarchivering bij de centrale overheid. Het archiveren van websites en uitingen op sociale media. Rapport Erfgoedinspectie. 5 Jeroen van Luin, Ervaringen met website-archivering in het Nationaal Archief. Rapport, 8 april 2016. 6 Webarchivering bij de centrale overheid. Het archiveren van websites en uitingen op sociale media. Rapport Erfgoedinspectie. De kracht van het netwerk. KB Beleidsplan 2015-2018. Den Haag, 2014, 21. 7 De kracht van het netwerk. KB Beleidsplan 2015-2018. Den Haag, 2014. 5 8 Niels Brügger, Web History, an Emerging Field of Study. In: Niels Brügger ed., Web history. New York, 2010. 3. 9 Niels Brügger, Website Analysis: Elements of a Conceptual Architecture. Papers from The Centre for Internet Research. Aarhus, 2010, 9. 10 https://socialhistory.org/sites/default/files/docs/archiving-electronic_messages.pdf 11 https://archive.org/; http://commoncrawl.org/ 14 https://www.groningerarchieven.nl/onderzoek/webarchief-groningen 15 https://www.kb.nl/organisatie/onderzoek-expertise/e-depot-duurzame-opslag/webarchivering |
14 juli 2017