, 9 november 2018

Database-informatie van overheidsorganisaties duurzaam toegankelijk

image for Database-informatie van overheidsorganisaties duurzaam toegankelijk image Case

Dit artikel verkent de mogelijke technische, juridische en organisatorische veranderingen die nodig zijn om informatie die in verschillende vormen beschikbaar is en wordt gebruikt duurzaam toegankelijk te maken met toepassing van principes van archiveren by design. Dit wordt gedaan aan de hand van de in het onderzoek gebruikte casus milieuhygiënische bodeminformatie.

Informatiebehoefte milieuhygiënische bodeminformatie

Dit artikel verkent de mogelijke technische, juridische en organisatorische veranderingen die nodig zijn om informatie die in verschillende vormen beschikbaar is en wordt gebruikt duurzaam toegankelijk te maken met toepassing van principes van archiveren by design. Dit wordt gedaan aan de hand van de in het onderzoek gebruikte casus milieuhygiënische bodeminformatie.

Informatiebehoefte milieuhygiënische bodeminformatie

Milieuhygiënische bodeminformatie is informatie die aangeeft of er sprake is van bodemverontreiniging. Deze informatie bestaat in essentie uit het vastleggen van de chemische samenstelling van grondmonsters die genomen zijn op verschillende locaties en verschillende bodemdiepte. Deze informatie wordt op verschillende manier gebruikt. De casus heeft betrekking op het gebruik van deze informatie in drie gemeentelijke processen:

  • het afgeven van een omgevingsvergunning;
  • het vervaardigen van een beleidsmatige bodemkwaliteitskaart;
  • rekenkundige en geografische analyse en presentatie van verschillende grondmonsters.

 Onderstaande tabel geeft een samenvatting van het type gebruik, de vorm van de informatie die wordt gebruikt en het systeem waar deze informatie is opgeslagen:

Tabel 1

Er zijn grofweg twee vormen van milieuhygiënische bodeminformatie te onderscheiden: 

  • informatie in documentvorm die wordt gekenmerkt door uitgebreide tekstuele informatie; deze vorm van informatie is lastig te gebruiken voor berekeningen, analyses en het visueel presenteren van de (ruimtelijke) informatie;
  • informatie in datavorm die wordt gekenmerkt door beknopte en gestandaardiseerde tekstuele en numerieke informatie; deze vorm van informatie is makkelijker te gebruiken voor berekeningen, analyses en het visueel presenteren van de (ruimtelijke) informatie.

Organisaties hebben zowel de informatie in documentvorm als de informatie in datavorm nodig voor toekomstig gebruik. Daarom is duurzame toegankelijkheid van beide vormen van belang. Duurzame toegankelijkheid van milieuhygiënische bodeminformatie Voor de casus is gekeken naar hoe de duurzame toegankelijkheid op dit moment is geregeld. Duurzame toegankelijkheid kan worden getoetst aan landelijke richtlijnen hiervoor, de DUTO-richtlijnen. DUTO staat voor Duurzame Toegankelijkheid van Overheidsinformatie. DUTO geeft overheidsorganisaties richtlijnen om hun digitale informatie duurzaam toegankelijk te maken. Er is in deze casus specifiek gekeken naar drie DUTO-richtlijnen, namelijk:

  • Richtlijn 5: Van elk informatieobject is een weergave beschikbaar, binnen redelijke tijd en inspanning: dit vereist toegang tot individuele records van databases, inclusief de verschillende versies van de individuele records.
  • Richtlijn 7: Een informatieobject is toegankelijk voor iedereen die op basis van regelgeving en beleid inzagerecht heeft: dit vereist standaardservices en protocollen voor het opvragen van informatie om te kunnen spreken van laagdrempelige toegankelijkheid (laagdrempelig betekent hier even gemakkelijk als voor de overbrenging van de informatie).
  • Richtlijn 10: De export van een informatieobject voldoet aan een open standaard formaat: dit vereist naast het gebruik van technische standaarden ook standaarden voor semantiek.

 De informatie in documentvorm zal worden overgebracht van het DMS bij de gemeente Haarlem naar het e-Depot bij het Noord-Hollands Archief. Bij het overbrengen van de informatie gaat er echter flink wat metadata verloren.

Dit zorgt voor verminderde vindbaarheid en beperkingen in het hergebruik van de informatie. De oorzaak hiervan is het niet goed aansluiten van het standaard metadataschema voor lokale overheden, het Toepassingsprofiel Metadatering Lokale Overheden (TMLO), de daarbij horende technische uitwisselingsstandaard en de mogelijkheden voor de opname van metadata in het collectiebeheersysteem van het Noord-Hollands Archief. Daarnaast zijn er voor archiefvormers geen directe toegangsservices beschikbaar op het e-Depot voor het laagdrempelig gebruik van deze informatie. Hiermee wordt niet voldaan aan DUTO-richtlijn 7.

De informatie in datavorm zal vooralsnog niet worden overgebracht naar het e-Depot. Dit komt omdat de huidige e-Depot-omgeving niet de mogelijkheden biedt die nodig zijn om de informatie in datavorm op dezelfde laagdrempelige manier als in het BIS te kunnen blijven gebruiken. Het gaat dan om het kunnen gebruiken van individuele records voor raadpleging, analyse en visualisatie. Bij overbrenging van databases naar het e-Depot worden databases als één geheel gearchiveerd. Records kunnen niet individueel worden benaderd voor direct gebruik en voldoet daarmee niet aan de informatiebehoefte. Hiermee wordt dan ook niet voldaan aan DUTO-richtlijn 5. Hoe kunnen deze actuele beperkingen van duurzame toegankelijkheid worden opgelost? Hiervoor zijn verschillende oplossingsrichtingen denkbaar die hieronder kort worden beschreven. 

Oplossingsrichtingen duurzame toegankelijkheid milieuhygiënische bodeminformatie

Het is van belang dat informatie in documentvorm die is overgebracht naar een e-Depot op dezelfde manier gebruikt kan blijven worden als voor de overbrenging. Dit is nu niet het geval, maar het is relatief eenvoudig te realiseren: zorg voor het beschikbaar stellen van services met directe toegang, gebaseerd op technische en semantische standaarden.

Zo kan de overgebrachte informatie in werkprocessen gebruikt blijven worden. Wat lastiger kan worden opgelost is het verlies aan waardevolle metadata. Hiervoor zullen in de keten de diverse standaarden en systemen moeten worden aangepast. Voor de informatie in datavorm zijn twee oplossingsrichtingen mogelijk.

De eerste oplossingsrichting is gebaseerd op het gebruik van bestaande standaarden voor database-archivering, zoals de Software Independent Archival of Relational Databases. Hierbij wordt de database als één geheel opgeslagen. De standaard wordt dan gebruikt om de database-inhoud leesbaar en interpreteerbaar te houden. De functionaliteit gaat echter verloren. Deze oplossing is dus alleen bruikbaar om de informatie als geheel weer in te lezen in een database-omgeving om die daarna op basis van die omgeving met de bijbehorende functionaliteit weer te kunnen gebruiken. Er is dus geen sprake van directe bruikbaarheid van de database en van individuele records.

De tweede oplossingsrichting is gebaseerd op in-database archivering. Dit principe maakt het mogelijk om in databases zelf archieffunctionaliteit toe te voegen om hiermee in staat te zijn deze vorm van informatie duurzaam toegankelijk te maken en te houden op de plek waar de informatie ook is gecreëerd en/of wordt beheerd (dit wordt ook wel in situ archivering of archivering bij de bron genoemd, de informatie wordt dan niet fysiek overgebracht). Voor database-informatie die op landelijk niveau beschikbaar moet zijn, is uitbreiding van het huidige stelsel van basisregistraties1 gecombineerd met het voorzien van deze basisregistraties met archieffunctionaliteit een optie om te komen tot duurzame toegankelijkheid van die informatie.

In-database archivering milieuhygiënische bodeminformatie

Voor in-database archivering moet bij het ontwerp van databases, processen en applicaties rekening gehouden worden met specifieke archieffunctionaliteit. Onder archieffunctionaliteit wordt hier verstaan dat de informatie duurzaam toegankelijk blijft in de database en voldoet aan wetgeving voor (her)gebruik. Denk hierbij bijvoorbeeld aan de beperking op openbaarheid, op gebruik in relatie tot doelbinding en/of om privacy redenen, maar ook verplichtingen op basis van de Wet Hergebruik Overheidsinformatie en de toekomstige Wet Open Overheid. Bij het database-ontwerp zou rekening gehouden moeten worden met de implementatie van de volgende concepten:

  • Definiëren van een specifieke set aan metadata relevant voor het vinden en gebruiken van die informatie binnen een domein (in dit geval de milieuhygiënische bodeminformatie); deze metadata wordt aangevuld met generieke metadata voor duurzame toegankelijkheid (denk hierbij o.a. aan bewaringstermijn, beperking openbaarheid etc.); de metadata worden hierbij gekoppeld aan ieder individueel informatieobject, niet aan de database/dataset als geheel;
  • Implementatie van mechanismes voor het registreren van historie en/of transacties (hiermee wordt het mogelijk om te tijdreizen);
  • Implementatie van technieken om authenticiteit en integriteit van informatieobjecten te waarborgen.

 Naast het database-ontwerp zullen ook applicaties aangepast moeten worden. Denk hierbij aan de weergave van de databasegegevens. Interfaces zullen de mogelijkheid voor tijdreizen moeten bieden, waarbij de gebruiker gegevens uit het verleden kan inzien.

Het implementeren van deze concepten lijkt goed mogelijk te zijn op basis van bestaande en nieuwe technologie. Dit vraagt om technische en semantische standaarden. Maar dit is niet genoeg. Wetgeving zal moeten worden aangepast en verantwoordelijkheden van organisaties zullen moeten veranderen. Denk hierbij aan specifiekere, meer domeingerichte versies van de Archiefwet en een andere, meer adviserende en toezichthoudende rol van onder andere het NA en de RHC’s.

Landelijke ontwikkelingen richting archiveren by design

Landelijk zijn verschillende overheidspartijen bezig om gezamenlijk te komen tot gestandaardiseerde, leverancieronafhankelijke ontwerpen van datamodellen, processen en functionaliteiten die voor robuuste omgevingen voor het managen van informatie zorgen. Deze ontwikkeling wordt de common ground-beweging genoemd. Hierbij wordt gebruik gemaakt van landelijke standaarden en eventueel open source-ontwikkelomgevingen en van het architectuurprincipe om data en functionaliteit van elkaar te scheiden. Dit laatste betekent dat data niet meer in applicaties zelf wordt opgeslagen, maar op basis van services en/of events door applicaties kunnen worden gebruikt en bewerkt (zie figuur 1).

Figuur 1: De principes van scheiding van data en functionaliteit

De registratie van relaties tussen informatie, processen en applicaties (IPA)

Figuur 1: De principes van scheiding van data en functionaliteit en de registratie van relaties tussen informatie, processen en applicaties (IPA)

 De gemeente Haarlem heeft het voortouw genomen in de ontwikkeling van een omgeving voor zaakgericht werken waarin data en functionaliteit zijn gescheiden. Daarbij wordt gebruik gemaakt van landelijke standaarden. In deze omgeving wordt stapsgewijs functionaliteit toegevoegd die het mogelijk maakt om op termijn op basis van by design-principes te kunnen komen tot zoveel mogelijk geautomatiseerd beheer van digitale informatie. Denk hierbij onder andere aan functionaliteit voor het geautomatiseerd uitvoeren van de vernietiging, het geautomatiseerd publiceren van informatie als open data en geautomatiseerd overbrengen van informatie.

Tabel2_JanKoers_Od_2018-7

Om de informatiebeheerprocessen zoveel mogelijk geautomatiseerd te kunnen uitvoeren is het nodig om de relaties tussen data, processen en applicaties vast te leggen met de daarbij relevante metadata. Deze registratie kan dan worden gebruikt als sturingsmechanisme voor het geautomatiseerd creëren, bijwerken en gebruiken van metadata in processen en services.

Strategie voor duurzame toegankelijkheid van milieuhygiënische bodeminformatie

Op basis van de informatiebehoefte, de beperkingen van de huidige duurzame toegankelijkheid van databasegegevens en de landelijke ontwikkelingen kan een strategie voor duurzame toegankelijkheid van milieuhygiënische bodeminformatie worden bepaald. In de tabel hierboven wordt een overzicht gegeven van de mogelijke scenario’s.

In het kader van het onderzoek is door de auteur geadviseerd aan het NHA en de gemeente Haarlem om toe te werken naar het laatste scenario waarbij op landelijk niveau zowel een governance-structuur als een technische infrastructuur wordt ontwikkeld die toekomstbestendig is. Dit kan worden gedaan op basis van de concepten van het stelsel van basisregistraties en de common ground-beweging.

Conclusies

De principes van het ontwerpen van databases waarbij al rekening wordt gehouden met functionaliteit voor duurzame toegankelijkheid, een vorm van archivering by design, gecombineerd met gedistribueerde thematisch beheer en archivering, kunnen een efficiënte en effectieve manier zijn om duurzame toegankelijkheid mogelijk te maken voor database-informatie van overheidsorganisaties.

Voor informatie die op nationaal niveau beschikbaar moet zijn is het van belang om te zorgen voor semantische en technische standaarden en bij voorkeur voor centrale voorzieningen voor het beheer en de beschikbaarstelling van deze informatie. De uitbreiding van het huidige stelsel van basisregistraties gecombineerd met het voorzien van deze basisregistraties met archieffunctionaliteit kan zorgen voor een robuuste informatievoorziening voor de toekomst. Voor de casus bodeminformatie zou dit neerkomen op een basisregistratie milieuhygiënische bodeminformatie, logischerwijs als onderdeel van het Digitaal Stelsel Omgevingswet.

Het komen tot definitieve oplossingen zal tijd in beslag nemen. In de tussentijd kunnen en moeten we gezamenlijk blijven zoeken en werken aan de oplossingsrichtingen. Het ondersteunen van en meedoen aan de common ground-beweging is daarin een van de belangrijke pijlers.

 

Jan Koers werkt als strategisch adviseur bij de gemeente Haarlem. In de rol van CDO en Hoofd Informatiebeheer is Jan verantwoordelijk voor strategisch gegevensmanagement. Zijn focus ligt daarbij op informatiearchitectuur en by design-principes, data governance, informatiegestuurd werken, duurzame toegankelijkheid van informatie en onderzoek en innovatie op het gebied van open data, big data en data science. 


Noot

 

1 Een basisregistratie is een door de overheid officieel aangewezen registratie met gegevens die door alle overheidsinstellingen verplicht worden gebruikt bij de uitvoering van publiekrechtelijke taken.