1 oktober 2010

Effectief zoeken en vinden

image for Effectief zoeken en vinden image

In organisaties wordt veel informatie opgeslagen, zowel in gestructureerde vorm (in systemen, databases, etc.) als in ongestructureerde vorm. Tot deze laatste categorie worden documenten in de ruimste zin van de betekenis gerekend, waaronder ook internet/intranetpagina’s, foto’s, filmpjes, geluidsbestanden, et cetera.

In organisaties wordt veel informatie opgeslagen, zowel in gestructureerde vorm (in systemen, databases, etc.) als in ongestructureerde vorm. Tot deze laatste categorie worden documenten in de ruimste zin van de betekenis gerekend, waaronder ook internet/intranetpagina’s, foto’s, filmpjes, geluidsbestanden, et cetera.

Opslagplaatsen
Ongestructureerde informatie beslaat doorgaans circa zeventig procent van de beschikbare hoeveelheid informatie en wordt op verschillende plaatsen in de organisatie opgeslagen. Naast het DMS, het intranet en de internetpagina’s van de organisatie, wordt er ook veel informatie op netwerkschijven opgeslagen, om nog maar te zwijgen van de vele documenten die in e-mailpostbussen en persoonlijke mappen worden opgeslagen. Voor deze laatstgenoemde opslagplaatsen geldt dat de opgeslagen informatie alleen toegankelijk is voor de eigenaar.
Elk van de genoemde opslagplaatsen heeft een eigen manier van zoeken van informatie en het is daarbij niet mogelijk met één zoekvraag in meerdere opslagplaatsen tegelijkertijd te zoeken.

Uit onderzoek is gebleken dat in organisaties, waarin ongestructureerde informatie op de hierboven beschreven manier is opgeslagen, medewerkers tussen de dertig en vijftig procent van hun werktijd besteden aan het opbergen en opzoeken van informatie. Naarmate de hoeveelheid digitaal beschikbare informatie groeit, neemt de benodigde tijd om informatie op te slaan/terug te vinden navenant toe. Dit wordt voor een deel veroorzaakt doordat in ongestructureerde informatie niet op basis van identificerende kenmerken (sleutels) kan worden gezocht, zoals dit in de gestructureerde wereld wel het geval is. In ongestructureerde informatie wordt gezocht op basis van taal en dat heeft een aantal vervelende consequenties:

  • Taal wordt niet consequent gebruikt; voor hetzelfde object kennen we meerdere termen (synoniemen), bijvoorbeeld: theater/ schouwburg en voetpad/trottoir; zoekvragen leveren daarmee in veel gevallen geen volledige resultaten.
  • Content verschijnt in meerdere talen; in meertalige omgevingen (bijvoorbeeld internationale organisaties) resulteert ook dit in onvolledige zoekresultaten.
  • Een taal ontwikkelt zich en is daardoor in tijd gezien niet constant; zo zal het gebruik van hedendaagse woorden bij een zoekactie in Middeleeuwse teksten weinig resultaat opleveren.

Effectieve strategie
Een effectieve zoek- en vindstrategie in organisaties kent dan ook een aantal invalshoeken.

  1. Discipline en uniformiteit in het toekennen van metadata
    Metadata vormen een belangrijke basis voor volledige en betrouwbare zoekresultaten. De achilleshiel wordt echter gevormd door de discipline om metadata toe te kennen en daar waar wel metadata toe worden gekend, dit op een uniforme wijze te laten gebeuren. Het is daarom erg belangrijk dat er (vooraf) afspraken worden gemaakt over welke documenten worden vastgelegd, door wie en met welke metadata. Minstens even belangrijk is dat gecontroleerd wordt of deze afspraken ook worden nageleefd en dat degenen die zich niet aan de afspraken houden, hier ook op worden aangesproken.
  2. Het terugdringen van het afschermen van informatie
    Het aloude adagium ‘kennis is macht’ maakt dat er een natuurlijke neiging is om informatie af te schermen. Een effectieve zoekstrategie gaat daarom uit van het principe ‘alles is intern openbaar, tenzij …’, bedoeld om afscherming van informatie (bijv. documenten in een afdelingsmap) tot een minimum te beperken. In principe zullen alleen personeelsgerelateerde gegevens (personeelsdossiers, klachten over medewerkers, etc.) of gegevens die onder ‘medisch geheim’ zijn verstrekt, voor afscherming in aanmerking komen. Alle andere gegevens, waaronder cliëntendossiers van de sociale dienst van een gemeente en de als onderdeel van een vergunningsaanvraag verstrekte financiële gegevens van een bedrijf, vallen onder het geheimhoudingsbeding in de arbeidsovereenkomst. Wel kunnen gegevens tijdelijk als vertrouwelijk worden aangemerkt, bijvoorbeeld in het geval van Europese aanbestedingen of Koninklijke onderscheidingen. Het stimuleren van het opslaan van documenten in gedeelde omgevingen en niet in e-mailpostbussen of persoonlijke netwerkschijven, maakt ook onderdeel uit van het terugdringen van het afschermen van informatie. Alleen zo kunnen investeringen in bijvoorbeeld organisatiebrede zoekmachines optimaal worden benut. In dit verband moet ook het effect van bijvangsten in zoekresultaten niet worden onderschat.
  3. Het gebruik maken van organisatiebrede zoekmachines, gekoppeld aan woordsystemen
    Door gebruik te maken van zoekhulpmiddelen die over meerdere opslagplaatsen kunnen zoeken en deze te koppelen aan bijvoorbeeld een thesaurus, wordt tegemoet gekomen aan een aantal van de hierboven geschetst problemen. In een thesaurus wordt de relatie tussen woorden of termen vastgelegd, bijvoorbeeld een synonieme relatie. Door deze te koppelen aan zoekmachines wordt bereikt dat een zoekvraag met de term ‘fotocamera’ een resultaatlijst oplevert, waarin ook treffers op basis van de synonieme term ‘fototoestel’ voorkomen.

Een kenmerkend voorbeeld hiervan is het gebruik van de thesaurus door de BBC op haar website www.bbcnews.com: ten tijde van de tsunami zagen medewerkers van de BBC dat bezoekers van de website zochten naar informatie over deze ramp, maar dat deden door te zoeken op de namen van plaatsen in het rampgebied. De resultaatlijst bestond uit toeristische informatie en informatie over hotels die er waarschijnlijk al niet meer stonden, maar niet uit de gevraagde informatie over de ramp. Door het (tijdelijk) opnemen van de term ‘tsunami’ als synoniem van elk van de plaatsen in het rampgebied, zorgde de BBC ervoor dat bezoekers van de website vonden wat ze zochten.
Een effectieve zoekstrategie is gericht op het vinden van relevante informatie door medewerkers die daar op dat moment naar op zoek zijn, tegen een minimum aan inspanning. Dit vereist een aantal technische voorzieningen, maar vooral flankerend beleid op het gebied van informatiemanagement (bijv. ten aanzien van het gebruik van een thesaurus) en afspraken over en discipline in het toekennen van metadata.

vandijk@prover.nl

Tjerk van Dijk is zelfstandig adviseur op het gebied van zaakgericht werken/archiveren en het ontsluiten van informatie en is als docent verbonden aan SOD/HMDI en de IDM-opleiding in Groningen