1 mei 2010

Het metagegevensmodel

image for Het metagegevensmodel image

Digitalisering van de werkprocessen is geen doel op zich, maar een uitvloeisel van de nieuwe inrichting van de bedrijfsprocessen van de overheid en van de dienstverlening naar burgers en instellingen. Het is een nieuwe manier van werken om de externe omgeving efficiënter van dienst te zijn en om intern en in de keten flexibeler samen te kunnen werken. Als uitvloeisel van dit streven worden de papieren documentstromen zoveel mogelijk gedigitaliseerd.

Digitalisering van de werkprocessen is geen doel op zich, maar een uitvloeisel van de nieuwe inrichting van de bedrijfsprocessen van de overheid en van de dienstverlening naar burgers en instellingen. Het is een nieuwe manier van werken om de externe omgeving efficiënter van dienst te zijn en om intern en in de keten flexibeler samen te kunnen werken. Als uitvloeisel van dit streven worden de papieren documentstromen zoveel mogelijk gedigitaliseerd.
En bij een goede inrichting van het informatiebeheer kunnen de papieren archiefstukken worden vernietigd, zodat het primaire archief uitsluitend in digitale vorm blijft voortbestaan.

Wat is het probleem?
De overheid kan, door de grote hoeveelheid digitale informatie en de daarbij betrokken verschillende en soms complexe systemen voor opslag, er onvoldoende op vertrouwen dat gevonden informatie door medewerkers voldoet aan eisen van volledigheid, juistheid en actualiteit. Daaruit vloeien mogelijk risico’s voort, waaronder onjuiste beleidsontwikkeling, onvolledige verantwoording, bestuurlijke en of politieke imagoschade.

Het probleem waar we mee worstelen, is dat we meerdere systemen hebben waarin informatie wordt vastgelegd en beheerd. In sommige van deze systemen wordt informatie op gegevensniveau beheerd (databases), in andere systemen op document- en/of dossierniveau (fysiek archief, DM/RM, Outlook, dataschijven). Binnen elk systeem wordt informatie in verschillende depots bewaard en via verschillende applicaties en/of afdelingen beschikbaar gesteld en bewerkt.
Het informatiebeheer in al die systemen is niet of onvoldoende op elkaar afgestemd met als gevolg dat de samenhang ontbreekt en dat dezelfde informatie meervoudig en op verschillende manieren beheerd wordt.

Dit is niet nieuw voor de digitale wereld. Essentiële papieren documenten worden ook vaak in bureauladen van medewerkers teruggevonden en niet in het formele ‘fysieke’ archief. Maar in de traditionele documentaire informatiehuishouding is de fysieke documentenstroom nog redelijk op orde te houden en te beheren.
In de digitale werkomgeving is dit probleem echter vele malen complexer; het is niet zichtbaar. De hoeveelheid digitale documenten neemt explosief toe en moet actief en in samenhang onderhouden worden om duurzaam vindbaar, uitwisselbaar, bruikbaar en interpreteerbaar te blijven. Gebeurt dit niet, dan zullen dezelfde risico’s blijven bestaan als we in de praktijk nu tegenkomen:

  • Informatie raakt voortijdig verloren door misverstanden of door bewuste en onbewuste schoonacties.
  • Informatie is niet terug te vinden, omdat iedereen deze naar eigen inzicht opslaat en ordent.
  • Gegevens en documenten zijn niet goed meer te interpreteren, doordat de juiste contextinformatie ontbreekt.
  • Informatie wordt langer bewaard dan op grond van de privacy- en archiefwetgeving is toegestaan.
  • Informatie raakt onbedoeld in de openbaarheid.

Het is daarom van het grootste belang dat we deze informatie op zorgvuldige wijze opslaan en beheren, zodat de bedrijfsprocessen optimaal ondersteund worden.

Centrale vraag is: hoe kunnen we de informatie zo ontsluiten en beheren dat we die vanaf de oorsprong kunnen vinden, kunnen begrijpen en erop kunnen vertrouwen dat er zorgvuldig wordt omgegaan met gevoelige informatie en dat informatie tijdig vernietigd wordt of juist bewaard blijft.

Metagegevens als oplossingsrichting
Digitale informatie is vluchtiger en veranderlijker dan papieren informatie. Om te zorgen dat de waarde ervan niet vervliegt, moet die waarde worden ‘vastgelegd’. Dat kan door er expliciet ‘gegevens over de gegevens’ aan toe te voegen: metagegevens. Een bekende toepassingsvorm van metagegevens is die voor het beschrijven van documenten zoals ‘auteur’, ‘datum document’ en ‘onderwerp’.
Metagegevens zijn nodig om van inhoud (gegevens) betekenisvolle inhoud (informatie) te maken, die vertelt waar de documenten of gegevens staan en wanneer, waarom en door wie ze gemaakt zijn. Ze zorgen ervoor dat gebruikers hun eigen en elkaars informatie kunnen vinden en begrijpen. En ze zorgen ervoor dat zorgvuldig wordt omgegaan met gevoelige informatie en dat informatie tijdig vernietigd wordt of juist bewaard blijft.

In een omgeving waar verandering de norm is, is structuur nodig om flexibel te kunnen zijn. Dit besef is bepalend voor inrichting van een duurzame informatiehuishouding. Maar die moet ook praktisch werkbaar zijn en in de tijd flexibel blijven aansluiten op de voortschrijdende ontwikkelingen in de techniek én de dynamiek van de veranderende omgeving.

Het metagegevensmodel
Het metagegevensmodel is een verzameling (minimale set) uitgangspunten, richtlijnen, metagegevens en relaties op basis waarvan de informatiehuishouding kan worden ingericht. Het geeft een nadere invulling aan de eisen op gebied van duurzaamheid, interoperabiliteit, bruikbaarheid, vindbaarheid en interpreteerbaarheid.

  • Duurzaamheid
    Leidend principe voor de inrichting van het model is de taak- en inhoudsgerichtheid. Vanuit dit principe kunnen de contextuele, semantische en organisatorische veranderingen binnen het werkterrein van de organisatie (kerntaak, domein/sector, taak/functie, (sub) dossierniveau) met metagegevens worden gedocumenteerd. De oorspronkelijke context van de dossiers blijft hiermee reconstrueerbaar. De technische infrastructuur (DM/RM) en de technische metagegevens van de documenten borgen de duurzaamheid van de informatie.
  • Interoperabiliteit
    Het metagegevensmodel en de basisset metagegevens is afgeleid van het ‘Toepassingsprofiel metagegevens Rijk’. Aan deze richtlijn ligt wetgeving ten grondslag: de Archiefregeling 2009. Deze laatste voorziet in de verplichting voor zorgdragers om een metagegevensschema vast te leggen zoals bedoeld in de daarvoor geldende internationale standaard NEN-ISO 23081. De richtlijn is voorschrift in zoverre dat deze een uitputtende lijst van elementen bevat en de betekenis (semantiek) vastlegt die aan de verschillende (sub) elementen wordt toegekend. Dat is een basale voorwaarde voor de uitwisselbaarheid van informatie tussen overheidsorganisaties onderling.
  • Bruikbaarheid, vindbaarheid en interpreteerbaarheid
    De hiërarchische indeling van het model en de aanvullende sets metagegevens die op de verschillende lagen van het model worden vastgelegd, bieden de mogelijkheid om
    • de informatie op basis van onderscheidende kenmerken (metagegevens) te traceren (vindbaarheid) en te (her)ordenen (bruikbaarheid);
    • de ontstaansgeschiedenis en context van informatieobjecten te begrijpen (interpreteerbaarheid);
    • meerdere, al dan niet hiërarchische (sub)ordeningsstructuren te definiëren en beschikbaar te stellen en de afhankelijkheid van één vaste hiërarchische ordeningsstructuur te verminderen (bruikbaarheid);
    • geautomatiseerde overerving van metagegevens te optimaliseren en handmatige registratiehandelingen te beperken (gebruiksvriendelijkheid).

Uitgangspunten
Het metagegevensmodel bestaat uit zes hiërarchische lagen met een parent-child-relatie op basis van de volgende uitgangspunten:

  • De onderliggende laag (child) heeft een logisch inhoudelijke of procesmatige relatie met de bovenliggende laag (parent). Een laag kan één of meerdere sublagen bevatten (child).
  • Per laag worden in overleg met de organisatieonderdelen – binnen het generieke metagegevensmodel – specifieke metagegevens toegevoegd.
  • De metagegevens zijn overerfbaar en raadpleegbaar tot op de laagste laag: het document.
  • De inrichting en het onderhoud van de lagen één tot en met vijf en relevante sets metagegevens worden in overleg met de organisatieonderdelen geregeld; zij worden gedocumenteerd door en onder centrale regie van de informatiebeheerders.

Primaire ordening
Het basisprincipe van het model wordt gevormd door de context van het handelen hiërarchisch op te bouwen en deze te ontsluiten met relevante metagegevens uit de volgende bronnen:

  • jaarlijkse begroting, managementafspraak & bestedingsplan beleids-/themadirecties,
  • producten en dienstencatalogus, managementafspraak & bestedingsplan ondersteunende organisatieonderdelen,
  • relevante wet- en regelgeving,
  • (inter)departementale kaders,
  • aanvullende specifieke informatie van de betreffende organisatieonderdelen.
Od mei 2010, blz. 5
Hiërarchie metagegevensmodel

De lagen 1 (kerntaak) en 2 (domein/sector)
De basis voor de hoofdindeling op deze lagen is gebaseerd op:

  • kerntaken van het departement,
  • artikelgewijze indeling in beleidsvelden en prioritaire thema’s zoals deze gehanteerd worden voor de begroting,
  • organisatiestructuur voor planning- en controlprocessen,
  • kernprocessen van de ondersteunende organisatieonderdelen voor de secundaire processen (producten en dienstencatalogus).

Laag 3: taak/functie
Deze laag beschrijft globaal de inhoud van de opdracht om activiteiten te verrichten binnen het aandachtsgebied (laag 2). Invulling van de metagegevens in deze laag vindt plaats in overleg met de organisatieonderdelen. De formele beschrijvingen van de taken en functies – de beleidsmatige en bedrijfsmatige doelstellingen – zoals beschreven in de eerder genoemde brondocumenten, worden door de informatiebeheerders vastgelegd en ontsloten.

Laag 4 en 5 (dossier/subdossier)
Deze lagen beschrijven de inhoud van de (beleids)resultaten en/of producten gericht op het bereiken van de doelstellingen (laag 3). De inhoudsomschrijvingen van de dossiers en subdossiers (werkmappen) worden in overleg met de organisatieonderdelen door de informatiebeheerders vastgelegd en ontsloten.

Laag 6
De laagste laag in het model bestaat uit:

  1. zaakdossiers in de vorm van (BPM1)-procesmappen met daarin de documenten die in het desbetreffende proces zijn ontvangen en/of gemaakt;
  2. individuele documenten die zijn ontvangen en/of gemaakt.

Voor de ontsluiting van de processen en documenten worden in overleg met de proceseigenaren/dossierhouders nadere richtlijnen opgesteld ter bevordering van de toegankelijkheid en beheersbaarheid.

Deze manier van ordenen van bedrijfsactiviteiten is een krachtig hulpmiddel bij het ondersteunen van de bedrijfsprocessen van de organisatie én het beheer van informatiehuishouding, omdat het dient

  • als basis voor de definitie, het beheer en gebruik van de set concernbrede metagegevens;
  • als basis voor de formele ontsluiting van de informatiehuishouding op taak, proces, (sub)dossier en documentniveau;
  • als eenduidig referentiekader voor de verschillende gebruiksgroepen en gebruiksperspectieven in de tijd;
  • als basis voor het bruikbaar en vindbaar houden van elk (digitaal) informatieobject voor zolang als dat voor de dienstverlening aan burger en instelling, de bedrijfsvoering, de verantwoording, het bewijs en het maatschappelijk geheugen nodig is (institutioneel geheugen).

Voor- en nadelen
Het model heeft de volgende voordelen:

  • Het beperkt redundantie in opslag van documenten (en titels van dossiers).
  • Het bevordert de interpreteerbaarheid van documenten en dossiers door deze in hun context te presenteren (referentiekader).
  • Het faciliteert de ‘top-down’-zoekstrategie van dossiers en documenten.
  • Het faciliteert (geautomatiseerde) vastlegging van metagegevens ten behoeve van de verschillende gebruiksperspectieven en minimaliseert hiermee de hoeveelheid registratiehandelingen op dossier-, subdossier- en documentniveau.
  • Het faciliteert het vastleggen van relaties tussen dossiers en documenten en de ontstaansgeschiedenis ervan.
  • Het vergemakkelijkt het beheer door regels en opdrachten op het gebied van vernietiging, overdracht aan taakopvolgers et cetera op taak- en dossierniveau toe te passen en vast te leggen.
  • Het faciliteert het kunnen toepassen van beveiliging en toegang geven aan gebruikers voor het uitvoeren van activiteiten2 op groepen documenten en/of dossiers.

Maar er zijn ook nadelen aan verbonden:

  • Het model suggereert dat van elk bestand de hele bovenliggende structuur van toepassing wordt geacht c.q. relevant is. Dit hoeft niet het geval te zijn. Bestanden moeten in de structuur worden gezet, ongeacht of zij meer of minder passen; oftewel in voorkomende gevallen fungeren zij dwangmatig ten opzichte van een bepaald gebruiksperspectief voor een ‘logische’ plaats van dossiers/ documenten.
  • Sommige informatiebestanden kunnen (deels) tot een andere dimensie behoren. Een gegeven bestand kan op meerdere plekken even goed passen. Er moet een keuze worden gemaakt omdat een bestand maar op één plek kan staan.
  • Voor de definitie, het onderhoud en beheer van de relevante metagegevens is centrale regie/ondersteuning nodig om de kwaliteit van de metagegevens te borgen.
  • Het model stelt hoge eisen aan de competenties van de centrale informatiebeheerders (kennis van de organisatie, haar taken, processen en werkwijzen).

Hart van de informatiehuishouding
Het metagegevensmodel is het hart van de informatiehuishouding en de basis voor een duurzaam informatiebeheer en informatiegebruik. Hoe beter wij in staat zijn het variabele deel oftewel de nadelen van het metagegevensmodel (en de primaire ordening) te organiseren, te structureren en te standaardiseren, hoe hoger de winst zal zijn in termen van bruikbaarheid, toegankelijkheid en interoperabiliteit. Met als resultaat dat de effectiviteit van de informatiehuishouding toeneemt. Dit is niet van de één op de andere dag geregeld. Het is een proces van de lange adem, waar in fasen naartoe moet worden gewerkt.

w.a.rombout@minocw.nl


1 Business Proces Management: geautomatiseerde werkstroom.
2 Activiteiten zijn: creëren, bewerken, raadplegen, overdragen en vernietigen.