1 oktober 2010

In vogelvlucht en vooruit

image for In vogelvlucht en vooruit image

Zoekstrategieën zijn al zo oud als de weg naar Rome. In de bijbel staat al ‘Zoekt en gij zult vinden!’ (Matheus 7: 8). Maar hoe te zoeken en vooral ook hoe te zorgen dat anderen kunnen vinden, is ons vakgebied en daarover zijn we nog lang niet uitgesproken.
Het resultaat van een zoekactie kan waardevolle informatie opleveren, maar je kunt erdoor ook met ‘lege handen komen te staan’.

Zoekstrategieën zijn al zo oud als de weg naar Rome. In de bijbel staat al ‘Zoekt en gij zult vinden!’ (Matheus 7: 8). Maar hoe te zoeken en vooral ook hoe te zorgen dat anderen kunnen vinden, is ons vakgebied en daarover zijn we nog lang niet uitgesproken.
Het resultaat van een zoekactie kan waardevolle informatie opleveren, maar je kunt erdoor ook met ‘lege handen komen te staan’.
Dit wordt bepaald door een drietal factoren in het proces: input, throughput (techniek) en output. In het wankele evenwicht tussen de input (ontsluitingsmethoden), de techniek (zoekmachine) en de output (zoekmethoden) kiezen de deelnemers aan de Roundtable elk een eigen invalshoek.

Invalshoeken

Input
Aan de inputkant richten Van Heijst, Overbeek en Litjens zich op respectievelijk ontsluitingmethodieken, metadata toekennen, standaarden en uniformering van termen. Het is verrassend om te zien dat in dit deel van het vakgebied sinds mensenheugenis eigenlijk niet zoveel veranderd is. Van Heijst haalt een methode uit 1923 aan en ook beide andere heren pleiten niet voor vernieuwing. Terecht wordt geconstateerd dat de aloude behoefte aan degelijke precoördinatie nog steeds van groot belang is.

Techniek
De techniek komt in een drietal artikelen naar voren: Van Noortwijk beschrijft de integrale zoekmachine voor ongestructureerde informatie (techniek), Van der Stap benadrukt de mogelijkheden met semantische zoekmachines (in de nabije toekomst) en Voors geeft een introductie op de technische mogelijkheden van enterprise search-applicaties. Interessante verhandelingen over zoekmachines, die elk op zich een bijdrage leveren aan de kennis over zoekmogelijkheden.

Output
De meeste deelnemers hebben de invalshoek gekozen van de output. Hoe komt het dat de gebruiker toch nog steeds niet in staat is de juiste antwoorden te vinden op veel van zijn vragen.
Ondanks de techniek die alsmaar vooruitgaat en de zorg die wij in ons vakgebied besteden aan het toekennen van ontsluitingstermen. Becker en Van Helvoort wijten dat aan het gebrek aan kennis over zoekstrategieën en beschrijven welke methoden daarvoor van toepassing kunnen zijn. Roestenburg, Kamps en Ruijgrok geven de gebruiker zelf de schuld. Zoeken is een vak en als je niet weet hoe je moet zoeken, wees dan niet eigenwijs en laat je helpen door een deskundige. Van Dijk en De Winter hebben het voornamelijk over het beleid en het beheer van documenten, dat de toegankelijkheid voor een groot deel bepaald. Ook dat is een wezenlijk onderdeel om succesvolle zoekresultaten te kunnen genereren.

De zwakke schakel
Alle deelnemers geven uiteraard hun eigen interpretatie aan hetgeen er gebeurt in het vakgebied. Als ik kijk naar het geheel zie ik een paar lijnen naar de toekomst die mijns inziens niet onbesproken mogen blijven.

Dicht in de buurt van ‘Zoekt en gij zult vinden’ staat in de bijbel ‘Zalig de armen van geest’. Dat zou je van toepassing kunnen verklaren op de gemiddelde zoeker anno 2010. In de vorige eeuw tot
ongeveer 1990 hadden de information brokers, informatiebalies van bibliotheken en ander informatiecentra veel werk aan allerhande vragen. De gebruiker was ‘bewust onbekwaam’. De meeste gebruikers zijn nu tevreden met de gevonden trivialiteiten van het internet dankzij Google. Hiermee hebben zij een omgekeerde opleidingscurve afgelegd richting ‘onbewust onbekwaam’.
Dat is een ernstige ontwikkeling die zich alleen laat keren als de gebruiker dit zelf inziet. De techniek dendert voort in de richting van ongelimiteerde ontsluiting van alle soorten informatiebronnen (zowel ongestructureerd als gestructureerd en sinds kort ook tegelijkertijd). De manager in organisaties ontdekt langzamerhand dat hij vaak toch te weinig informatie heeft om een besluit te kunnen nemen (neemt vaak alleen de twintig procent gestructureerde informatie mee uit rapportages). Wij als vakgenoten zijn steeds beter in staat over de grenzen van onze beperkte ontsluitingsmethoden heen te kijken, de thesaurus, taxonomie en andere metadatastructuren te verrijken met termen die de gebruiker zelf toepast (tags, folksonomies, etc.) en creatieve oplossingen te verzinnen om de techniek optimaal te benutten.

Kortom, de techniek kan al heel veel en er wordt volop gewerkt aan ondersteuning van conceptueel zoeken, sentimentanalyse en judgement retrieval, maar of de gebruiker daarop zit te wachten zal de praktijk moeten uitwijzen. De zoekende mens is de zwakke schakel in het geheel. Mijn ervaring is dat slechts 1 à 2 % van de gebruikers van enterprise search-oplossingen echt verder kijkt dan de gemiddelde Google-achtige zoekactie met ongeveer 1,6 ingebrachte termen. Het is te hopen dat die 1 à 2 % op belangrijke posities terechtkomen, de juiste beslissingen kunnen nemen of laten nemen en daarmee de concurrentie het nakijken geven. Tot die tijd zijn veel aangeschafte zoekmachines hele dure speeltjes en moeten wij als vakgebied roeien met de riemen die we hebben.
En vooral maar doorgaan!!

anja.vanderlans@vlc.nl

Anja van der Lans MKM is consultant enterprise search bij VLC.

Literatuur

  • ‘Enterprise Information Management; de fusie tussen Business Intelligence, Content Management en Enterprise Search’ – Lulu, 2010 door Peter van Til, Anja van der Lans en Paul Baan.
  • ‘Enterprise search als brug tussen BI en ECM; is het al (bijna) zover of is het nog een brug te ver?’ (Computable, 19-2-2010) door Anja van der Lans en Peter van Til.
  • ‘Zoek de juiste zoekmachine; niet verdwalen bij de pakketselectie’ (IT service magazine, nr. 8, december 2009) door Anja van der Lans.
  • ‘Enterprise search; het einde van gestructureerde opslag?’ (DBM, nr.4, 2008) door Anja van der Lans.
  • ‘Enterprise search; kans of bedreiging voor DIV?’ (Od (62), okt. 2008) door Adriaan Hondelink en Anja van der Lans.
  • ‘Ontsluiten bedrijfsdata via zoekmachine is zo makkelijk nog niet’ (TIEM, 25 mei 2008) door Anja van der Lans, Victor van der Lelij en Adriaan Hondelink.