1 oktober 2010

Op zoek naar de juiste hooiberg

image for Op zoek naar de juiste hooiberg image

Bijna alle auteurs waren aanwezig: Peter Becker en Jos van Helvoort (Haagse Hogeschool), Tjerk van Dijk (docent SOD), Jaap Kamps (Universiteit van Amsterdam), Anja van der Lans VLC (Enterprise Information Management), Jeroen Litjens (LitjensConsultancy), Kees van Noortwijk (Kenniscentrum Rechtsorde C-CONTENT bv), Hans Overbeek (ICTU), Will Roestenburg (TU Delft Library), Paul Ruijgrok (InforU), Ton van der Stap (Think Legal BV) en Michiel Voors (KnowledgePlaza). De discussie was gebaseerd op het beantwoorden van een drietal vragen.

Bijna alle auteurs waren aanwezig: Peter Becker en Jos van Helvoort (Haagse Hogeschool), Tjerk van Dijk (docent SOD), Jaap Kamps (Universiteit van Amsterdam), Anja van der Lans VLC (Enterprise Information Management), Jeroen Litjens (LitjensConsultancy), Kees van Noortwijk (Kenniscentrum Rechtsorde C-CONTENT bv), Hans Overbeek (ICTU), Will Roestenburg (TU Delft Library), Paul Ruijgrok (InforU), Ton van der Stap (Think Legal BV) en Michiel Voors (KnowledgePlaza). De discussie was gebaseerd op het beantwoorden van een drietal vragen. In dit verslag is per vraag een korte samenvatting te lezen van de interessante en enthousiaste discussie tussen de deelnemers.

Od oktober 2010 Special, blz. 4
Dat het onderwerp Zoekstrategieën leeft, bleek wel uit het grote
aantal deelnemers aan de roundtable.

 

Vinden de zoekers naar informatie dat zij goed bediend worden door de aanbieders van de middelen voor het zoeken?
De deelnemers beslissen al snel dat ‘de zoeker’ niet bestaat.
Het gaat om een zeer gevarieerde doelgroep van gebruikers die allemaal verschillende zoekopdrachten hebben. Het is dan ook bijna onmogelijk om voor allemaal een snelle en simpele zoekmethode te hebben.
Zoekt de één iets algemeens (kamerstukken), de ander weet misschien nog niet wat hij/zij wil vinden (onderwerp voor een scriptie). Twee voorbeelden van verschillende doelgroepen die op een verschillende manier moeten kunnen zoeken, maar nu wel bediend worden met hetzelfde instrumentarium.
Verder beperkt de gemiddelde zoektocht zich meestal tot één of twee zoekacties, waarna de zoeker het opgeeft en bij een collega te rade gaat. De collega weet dan vaak te vertellen dat het stuk in een hele andere categorie is ingedeeld. En dan kan ineens blijken dat een offerte voor fietsen onder de categorie rijwielen is ingedeeld of dat het stuk alleen in het Engels te vinden is.

Kan de techniek ons hierbij helpen? De deelnemers denken van wel, maar het zijn toch uiteindelijk de zoekers die de techniek moeten gebruiken. Opleiding hierin is noodzakelijk. Zo weet iedereen precies wat er wel en niet kan en hoe het beste voor welk resultaat (algemeen of specifiek) gezocht kan worden. Maar ja, hoe leid je alle burgers van Nederland op?
Mogelijk kunnen degene die de ordening en de techniek beheren helpen. De eerste door misschien wel de ordening gedeeltelijk los te laten. Dit zou kunnen door niet tegen Google te werken (door een eigen, nieuwe ordening te beheren), maar door samen te werken met Google (aanvullende informatie toevoegen, waardoor gebruikers sneller informatie vinden). Dus additionele zoekmachines van Google aanvullen met gespecialiseerde zoektermen. In een ideale wereld heeft iedereen zijn eigen gepersonaliseerde zoekmachine. De techneuten kunnen een dynamisch, lerend systeem ontwerpen dat zich aanpast aan de persoonlijke zoekwensen van de gebruikers. Of kan de informatie in hapklare brokken voor verschillende doelgroepen worden aangeboden, zodat elke doelgroep zijn eigen gedeelte in het systeem krijgt?
Dit is een discussie waar niet direct een antwoord op te krijgen is, maar door deze op regelmatige basis te voeren komt men wel weer tot nieuwe inzichten.

Vanwege contextverschil bij de zoeker treedt validatieverschil op (als gevolg van keuzen in zoekmethodiek) tussen verschillende zoekers. Hoe kan tóch het beste resultaat behaald worden, zonder al te veel ‘ruis’ (irrelevante informatie voor de zoeker)?
Het verschil in validatie zit ’m vooral in de manier waarop zoekers de informatie benaderen. De één zoekt naar ‘fiets’ om er een te kopen, de ander typt dezelfde zoekvraag in om een dynamo te repareren. Het moge duidelijk zijn dat de zoekresultaten niet altijd het juiste antwoord leveren of in ieder geval vaak te veel richtingen opgaan.

Je zou dus eigenlijk een soort van ‘relevant ranking’ moeten kunnen toekennen, maar het verschil in contextverschil tussen de verschillende doelgroepen maakt dit lastig. Hierbij kom je ook weer terug op de vorige discussie over de personalisering van zoekmachines, zoals hiervoor beschreven.

Ook zou je kunnen denken aan het toekennen van favorieten door bijvoorbeeld collega’s. Maar ook hier schuilt gevaar.

Waarom is dit favoriet? In welke context? En kom je dan nog wel tot onverwachte vernieuwende inzichten? Als men alleen maar leest wat anderen lezen, waar beleg je dan je persoonlijke meerwaarde in de organisatie? Maar als aanvulling op andere zoekmethodes kan dit zeker iets extra’s zijn.

Eveneens kan gedacht worden aan personalisatie van de techniek in plaats van de informatie. De informatie blijft hierbij gelijk in waarde, maar door de techniek aan te passen aan de zoeker vindt deze snel en gemakkelijk de juiste informatie. Ook hier schuilt natuurlijk weer gevaar: hoe personaliseer je techniek zonder dat er informatie niet meer gevonden wordt?

Kan de enorme hoeveelheid informatie terug worden gebracht tot een kleine hoeveelheid relevante informatie door de kwaliteit van validatie te vergroten?
Op dit moment zijn er al veel verschillende mogelijkheden, denk aan de gele doos van Google, maar in hoeverre valideren die? Bovenop deze doos moeten vaak nog aparte systemen worden gebouwd om de doelgroep te bedienen. Men kan hierbij bijvoorbeeld denken aan het toepassen van taaltechnieken en gecontroleerde woordenlijsten.

Tijdens de discussie kwam in dit kader ook een nieuwe rol van de DIV’er naar voren. DIV is de gespecialiseerde zoeker en moet ervoor blijven zorgen dat alles terugvindbaar is. Dit gaat verder dan het implementeren van een systeem, maar betreft ook het onderhoud en het opleiden van de gebruikers. Ook dient de DIV’er ervoor te waken dat documenten verkeerd worden ingedeeld. Een gebruiker is vaak op zoek naar een speld in de hooiberg, maar hij weet vaak niet eens in welke hooiberg hij moet zoeken. Er zijn zoveel verschillende systemen met daarin verschillende informatie opgeslagen en ook weer verschillende zoeksystemen. De DIV’er moet kunnen helpen met het zoeken van de juiste hooiberg.

Conclusie
Zoeksystemen zijn er vooral voor de zoekers; zodat zij informatie kunnen vinden. Liefst zo snel en relevant mogelijk. Door de toenemende stroom aan informatie en de wens om steeds meer samen te werken, lijkt het bijna onmogelijk om de zoeker van de juiste informatie te voorzien.
Toch denken de deelnemers aan deze roundtable dat het beter kan. Globaal waren de oplossingsrichtingen te verdelen in drie groepen met hun eigen specifieke oplossing:

  • de gebruikers/documentalisten, die de ordening van de gezochte informatie willen perfectioneren;
  • de techneuten, die de zoektechniek willen verbeteren;
  • de taalvirtuozen, die in de vertaalslag tussen verschillende talen en in de semantiek een oplossing vinden.

Verder is iedereen het erover eens dat het zonder de hulp van de eindgebruiker, de zoeker, niet gaat lukken. Dat deze dat niet zomaar kan en dus opleiding nodig heeft, is ook duidelijk.

Hoe nu verder?
Wordt het nu een mix of gaan we focussen op ordening, techniek of semantiek? Wordt het een zelflerend systeem, worden het kleinere informatiebronnen of zelfordenende gebruikers?
De roundtable leverde in ieder geval veel stof tot nadenken.
De redactie van Od bedankt daarom hierbij nogmaals alle deelnemers en auteurs en hoopt dat deze discussie vervolg gaat krijgen, misschien wel door plaatsing van dit artikel.
Heeft u als lezer ideeën hierover? Stuur uw reactie naar onderstaand e-mailadres.

e.a.m.maes@tudelft.nl

Geef een reactie

Het e-mailadres wordt niet gepubliceerd. Vereiste velden zijn gemarkeerd met *