1 oktober 2010

De semantische zoekmachine

image for De semantische zoekmachine image

Bij zoekmachines op een website of intranet, bijvoorbeeld binnen een juridisch domein, is de kans veel kleiner dat de gewenste informatie wordt gevonden dan bij een algemene zoekopdracht aan Google.
Dit komt door het feit dat er minder documenten doorzoekbaar zijn, waardoor de kans kleiner wordt dat een bepaald trefwoord in een bestaand document aanwezig is. Ook het gebruik van een bepaald jargon belemmert het vinden van de juiste informatie.

Bij zoekmachines op een website of intranet, bijvoorbeeld binnen een juridisch domein, is de kans veel kleiner dat de gewenste informatie wordt gevonden dan bij een algemene zoekopdracht aan Google.
Dit komt door het feit dat er minder documenten doorzoekbaar zijn, waardoor de kans kleiner wordt dat een bepaald trefwoord in een bestaand document aanwezig is. Ook het gebruik van een bepaald jargon belemmert het vinden van de juiste informatie.

Carp Technologies, ontstaan uit de Universiteit van Twente, heeft een zoektechnologie ontwikkeld die juist deze problemen oplost. In plaats van rechtstreeks naar trefwoorden te zoeken in documenten worden associaties gelegd tussen de zoektermen en de beschikbare documenten. Deze associaties zijn gebaseerd op geavanceerde kennistechnologie die betekenisverbanden kan leggen tussen verschillende termen. Hiermee kan bijvoorbeeld de term ‘bootverzekering’ geassocieerd worden met de term ‘pleziervaartuigenverzekering’.
Met dezelfde technologie kunnen naast termen ook omschrijvingen zoals ‘subsidie voor het huren van een woning’ met termen worden geassocieerd (in dit geval ‘huursubsidie’).*

Zoektermen bedenken
Als gebruikers ergens naar op zoek zijn hebben ze vaak een redelijk gedetailleerd beeld in hun hoofd van datgene waarnaar ze op zoek zijn. Veel gebruikers echter hebben moeite met het vertalen van dit beeld naar een of meerdere trefwoorden. Vaak is het veel eenvoudiger dit beeld te vertalen naar een zoekvraag gesteld in gewoon Nederlands. De technologie maakt het mogelijk een zoekvraag grammaticaal te ontleden en de betekenis ervan te achterhalen. Hierdoor wordt de zoekvraag automatisch omgezet naar trefwoorden.

Voordelen van een semantische zoekmachine

  1. Documenten worden ook gevonden als een andere zoekterm wordt gebruikt.
    Gebruikers gebruiken vaak hun eigen zoektermen en omschrijvingen en weten niet welke formuleringen worden gebruikt in het documentaanbod. Met een semantische zoekmachine worden toch de juiste documenten gevonden, zelfs als de zoektermen van de gebruiker niet letterlijk in de documenten voorkomen.
  2. Gebruikers kunnen vragen stellen in gewoon Nederlands.
    Een website wordt veel toegankelijker voor gebruikers wanneer deze hun zoekvragen in gewoon Nederlands (of eventueel een ander taal) kunnen stellen. Veel gebruikers vinden het namelijk lastig om een zoekvraag zelf om te zetten in trefwoorden.
    Bovendien biedt het stellen van vragen in gewoon Nederlands nog een administratief voordeel: door alle zoekvragen op te slaan in een log-bestand dat later kan worden geraadpleegd, kan de beheerder van een website trends en wensen van de gebruikers in kaart brengen. Als deze zoekvragen bestaan uit losse trefwoorden is het lastig om achteraf te bepalen wat de gebruiker hier nu precies mee bedoelde. Echter, wanneer complete zinnen als zoekvragen worden opgeslagen, is in één oogopslag duidelijk naar welke informatie de gebruiker op zoek was.
    Op basis van deze informatie kan in kaart worden gebracht wat ‘populair’ is bij de gebruikers en welke informatie op de website ontbreekt. Voorbeeld: van de zoekvraag “Mag ik oud papier in de groenbak gooien?” is direct duidelijk wat de gebruiker hiermee heeft bedoeld. De zoektermen ‘oud papier’ en ‘groenbak’ geven daarentegen niet duidelijk aan waar het om gaat.
  3. Spelfouten worden afgevangen.
    Voordat de zoekmachine de vraag verwerkt, wordt de zoekvraag of zoekterm op spelfouten gecontroleerd en gecorrigeerd. Dit om het gebruiksgemak te vergroten en frustratie te vermijden.
  4. Trefwoorden in enkel- of meervoud invoeren is niet meer van belang.
    De semantische zoekmachine zoekt niet alleen op het trefwoord, maar ook op enkel- en meervoudsvormen en vervoegingen van trefwoorden. Dit in tegenstelling tot reguliere eenvoudige zoekmachines waarbij alleen exacte overeenkomsten worden gevonden.
  5. Semantische zoekmachines geven websites een innovatief karakter.
    Veel websites bevatten geen enkele zoekmachine of een eenvoudige die zoekt op trefwoorden. De aanwezigheid van een geavanceerde zoekmachine die vragen in gewoon Nederlands kan verwerken, maakt een goede indruk bij de gebruiker en geeft de website meteen een innovatief karakter en kan zich hierdoor van de concurrentie onderscheiden.

Conclusie
De integratie van een semantische zoekmachine in website of intranet geeft dus dubbel voordeel. Aan de ene kant wordt klanten, prospects en werknemers op een eenvoudige en natuurlijke manier informatie verstrekt en worden vragen beantwoord. Aan de andere kant wordt inzicht verkregen in de vragen en behoeften van de gebruikers, zodat de informatievoorziening hierop afgestemd kan worden.

ton@thinklegal.nl

Ton van der Stap is directeur van Think Legal BV (www.thinklegal.nl). Het artikel is in samenspraak met Carp Technologies geschreven (www.carp-technologies.nl).


* De genoemde voorbeelden zijn ontleend aan de toepassing van semantische zoektechnologie voor het Digitaal Loket van de gemeente Enschede. Deze stelt de burger in staat zijn of haar vraag in gewoon Nederlands in te typen en begrijpt vervolgens wat wordt gevraagd.