20 januari 2022

Van documenten en de dingen die voorbijgaan

image for Van documenten en de dingen die voorbijgaan image

Het informatielandschap van de overheid bevindt zich in een overgangsfase van overwegend documentair naarmeer gegevensgericht. Terwijl digitale documenten nog beheerd konden worden op een min of meer traditionele manier – zoals in het papieren tijdperk, maar dan met een digitaal sausje er over – geldt dat voor gegevens veel minder. Volgens Rens Ouwerkerk is het daarom tijd om rigoureuzer over de hervorming van “ons vak” na te denken.

Laat ik eerst uiteenzetten waarom gegevensbeheer zo anders is dan documentbeheer. Een document bevat verschillende gegevens: bijvoorbeeld een straatnaam. Diezelfde straatnaam komt ook voor in andere documenten. Toch knipte niemand in de papieren tijd de straatnaam uit om dat knipseltje te hergebruiken, bijvoorbeeld door het met een zuurvrije Pritt-stift op een andere brief te plakken.

In een digitale wereld is dat niet zo ridicuul als het klinkt. Daar hebben we namelijk één centrale database met daarin gegevens, bijvoorbeeld straatnamen, en gebruiken die voor verschillende doeleinden in verschillende processen. In een dossier wordt gelogd dat element X uit bron Y op tijdstip Z is gebruikt. Een gebruiker van een applicatie ziet op zijn scherm de straatnaam, maar dat gebeurt met technische verwijzingen en de straatnaam wordt op zichzelf niet in het lokale dossier opgeslagen. Dat hoeft ook niet, want we kunnen door logging voortdurend herleiden welke gegevens wanneer zijn gebruikt. Dus de straatnaam komt virtueel in meerdere dossiers en in meerdere applicaties voor, maar bestaat technisch maar één keer. En doordat we wijzigingen aan een element in de bron als tijdgebonden event vastleggen in de database, kunnen we tijdreizen en zien hoe een waarde er op een bepaald moment in de tijd uit zag.

Even terug naar het papier. Gegevens en informatiedrager zijn onlosmakelijk met elkaar verbonden. Vernietig je de informatiedrager, dan vernietig je ook de gegevens die daarop staan. Bij het digitale dossier is die onlosmakelijke verbondenheid er niet. Het gaat dan vaak om gegevens die alleen maar getoond worden op basis van logische verbanden. Dus hoe vul je dan de vernietigingsplicht in? Je kunt wel een lijntje doorknippen, maar als je gegevens echt gaat verwijderen uit een centrale database dan hebben alle afnemende processen daar last van. Alsof een straat ineens niet meer bestaat. Dat kan natuurlijk niet.

Common Ground
Natuurlijk werkt het in de praktijk vaak anders. Die praktijk is meestal dat er enkele centrale registers zijn en dat hier kopieën van worden gemaakt, zodat de straatnaam uit het voorbeeld hierboven wel degelijk op meerdere plekken tegelijkertijd bestaat. Dat mechanisme is echter aan het verdwijnen. Vanuit de gemeentelijke wereld zijn de principes van Common Ground ontstaan, waarbij de gedachte is dat gegevens niet meer worden gedupliceerd, maar meervoudig worden gebruikt vanuit één authentieke bron. Op zich geen nieuw idee, maar wel nieuw is dat het idee nu op grote schaal wordt omarmd door zowel bestuurders en ambtenaren als door softwareleveranciers. Ook nieuw is, ten opzichte zo’n tien jaar terug, dat de huidige staat van de techniek en het gebruik van standaarden ons in staat stellen om deze conceptuele ideeën ook daadwerkelijk in de praktijk te brengen.

De principes van Common Ground impliceren dat het beheer wordt uitgevoerd waar gegevens ontstaan. Gegevens blijven dus bij voorkeur in de bron en we richten die bron op een dusdanige manier in dat de duurzame toegankelijkheid is geborgd. Dus niet na verloop van tijd verplaatsen naar een e-depot omdat in de Archiefwet is bepaald dat een archivaris het beheer moet overnemen, maar een duurzame bron creëren die in theorie ook een archiefbewaarplaats zou kunnen zijn.

Losse registraties
Op dit moment zijn de bekendste landelijke bronnen de basisregistraties. Daarnaast hebben organisaties hun eigen kernregistraties. Bijvoorbeeld een kernregistratie met medewerkersgegevens. In theorie kunnen er kernregistraties voor van alles worden gemaakt. Uitwisselbaarheid van informatie vraagt om uniformiteit in datasemantiek en vanuit die gedachte is het niet onlogisch om meer kernregistraties te maken met bedrijfsgegevens die voor meerdere processen relevant zijn.

In potentie wordt het informatielandschap dus opgeknipt in losse registraties met waarden die geen enkele onderlinge samenhang hebben. Een “dossier” is dan niets meer dan een bundeling verwijzingen en logbestanden die rechtstreeks vanuit de bron op een scherm worden getoond als een gebruiker op een specifiek moment die specifieke gegevens in die specifieke combinatie nodig heeft.

Data- en archiefbescheiden
De transformatie van een documentair landschap naar een gegevensgericht landschap, maakt dat ons vertrouwde archiefjargon ons in de problemen brengt. De huidige Archiefwet hanteert bijvoorbeeld het begrip “archiefbescheiden” en regelt vervolgens het beheer van deze archiefbescheiden. Het is evident dat een document als archiefbescheiden gezien kan worden: een informatiedrager met gegevens, waarvan duidelijk is bij welk proces het hoort. De Archiefwet heeft als uitgangspunt dat archiefbescheiden altijd gekoppeld zijn aan de taakuitvoering. Ook is opgenomen dat de vorm er niet toe doet: archiefbescheiden kunnen tekstdocumenten of filmpjes zijn, maar in een strafzaak kunnen het ook een pluk haar of een pistool zijn. Allemaal voorbeelden van min of meer tastbare, concrete informatieobjecten die alleen maar bestaan in de context van een bepaalde zaak.

Data zitten anders in elkaar. Je hebt ruwe data, dit zijn bijvoorbeeld: 1984; 12; Yes. Dit zijn willekeurige waarden waarvan we zonder datamodel niet weten: is 1984 een jaartal of een postcode? Hebben we het over 12 auto’s of 12 bananen? Gaat het over de band Yes of hebben we een bevestiging vastgelegd? Ruwe data zijn op zichzelf niets, ze krijgen pas waarde als ze worden geduid. Dus als in het datamodel wordt vastgelegd dat 1984, om in bovenstaand voorbeeld te blijven, de titel van een boek is. Zo kunnen we ineens de link leggen met de auteur George Orwell. Dan weten we echter nog steeds niet wat de waarde van dit gegeven binnen een bepaald proces is.

Autorisatiebeheer
Dit brengt de vraag met zich mee op welk niveau we het label “archiefbescheiden” kunnen hanteren. Zijn ruwe data archiefbescheiden? In de meest ruwe vorm hebben deze geen informatiewaarde. Ook als de gegevens geduid zijn met een datamodel, is de informatiewaarde nog beperkt omdat er nog niet per se een link met een zaak of proces is. Tegelijkertijd zijn er, naast de traditionele beweegredenen, ook nieuwe argumenten te bedenken om toch bewaartermijnen te hanteren voor (ruwe) data, want minder dataopslag betekent minder pruttelende servers en minder pruttelende servers betekent minder energieverbruik en dat betekent dan weer dat we met z’n allen nog wat langer op deze planeet kunnen blijven rondhuppelen. En alleen al dat aspect zou een reden kunnen zijn om hier met elkaar spelregels voor op te stellen. Het simpele feit dat deze gegevens bestaan, maakt in elk geval dat in de praktijk een keuze moet worden gemaakt hoe lang ze bewaard moeten blijven. Ongeacht of ze binnen de scope van de Archiefwet vallen.

Vernietiging van procesinformatie, zoals we dat in een selectielijst regelen, gaat in de toekomst misschien alleen nog maar over het doorknippen van lijntjes naar gegevens in allerlei bronnen. Zodat niet meer te herleiden is dat specifieke gegevens in een specifieke combinatie op een specifiek moment in de tijd gebruikt zijn binnen een bepaald proces. Dan zijn we dus feitelijk niet meer aan het vernietigen, maar doen we aan autorisatiebeheer.

Anachronisme
De concepttekst van de nieuwe Archiefwet gaat uit van de term “documenten” in plaats van “archiefbescheiden”. Een term die veel te weinig recht doet aan de implicaties die digitalisering voor ons vak met zich meebrengen. Een groot deel van de gegevens die we als overheid beheren, valt namelijk niet onder de definitie die in de concept-wet wordt gegeven voor ‘document’. Ook het verkorten van de overbrengingstermijn naar 10 jaar gaat ons echt niet helpen bij de grote vraagstukken van de digitalisering voor de huidige informatiesector. Er wordt geen enkele poging gedaan om de brug vanuit de archiefwereld naar de datawereld te slaan.

Wordt het zo langzamerhand geen tijd om eens wat rigoureuzer over hervorming van ons vak na te denken? Laten we eindelijk eens ophouden om met louter cosmetische ingrepen te proberen het paradigma uit de vorige eeuw toepasbaar te houden voor de toekomst.

*Dit artikel verscheen oorspronkelijk op 24 januari 2020 in Od1.