De hoeveelheid informatie die in digitale vorm te raadplegen is, is het afgelopen decennium exponentieel gegroeid. Er is tegenwoordig bijna geen tijdschrift of naslagwerk meer dat niet ook digitaal beschikbaar is. Ging het daarbij tien jaar geleden vaak nog om publicaties op cd-rom, tegenwoordig zijn de meeste digitale bronnen online via de webbrowser beschikbaar.
De hoeveelheid informatie die in digitale vorm te raadplegen is, is het afgelopen decennium exponentieel gegroeid. Er is tegenwoordig bijna geen tijdschrift of naslagwerk meer dat niet ook digitaal beschikbaar is. Ging het daarbij tien jaar geleden vaak nog om publicaties op cd-rom, tegenwoordig zijn de meeste digitale bronnen online via de webbrowser beschikbaar.
Zoals veel organisaties en afdelingen die zich met informatiebeheer en -ontsluiting bezighouden, weten, is een groter aantal beschikbare bronnen niet per definitie een voordeel. Deze bronnen hebben namelijk vaak hun eigen specifieke zoek-interface en iedere bron bevat maar een deel van de benodigde gegevens. Het is daarom geen uitzondering wanneer medewerkers van een organisatie moeten leren werken met meer dan tien verschillende databanken en veel tijd kwijt zijn met het combineren van de daarin gevonden informatie.
Twee typen
Contentintegratie biedt een oplossing voor bovengenoemd probleem.
Het gaat hierbij om het combineren van de gegevens uit alle relevante databanken binnen een bepaald segment en het ontsluiten hiervan via één zoeksysteem. De gevonden documenten, uit welke databank ze ook afkomstig zijn, worden door het systeem getoond in één geïntegreerde trefferlijst. Een door experts opgezet systeem zorgt bovendien dat het meest relevante document bovenaan de lijst verschijnt. De documenten in de trefferlijst zijn bovendien (voor zover mogelijk) voorzien van links naar gerelateerde informatie, niet alleen uit de bron waaruit het document zelf afkomstig is, maar ook uit totaal andere bronnen. Zo wordt ervoor gezorgd dat informatie die bij elkaar hoort, ook allemaal wordt gevonden.
In de praktijk bestaan er twee typen contentintegratiesystemen die de bovengenoemde doelstellingen bewerkstelligen. Het eerste type legt, op basis van de aangegeven zoekvraag, links naar een serie bronnen en presenteert de resultaten in één trefferlijst. Het nadeel hiervan is dat de gebruiker afhankelijk blijft van de zoeksnelheid en functionaliteit van de verschillende bronnen. In de afgelopen jaren is echter gewerkt aan een nieuwe generatie contentintegratiesystemen die alle content van de relevante bronnen daadwerkelijk vergaren en indexeren (doorzoekbaar maken), alsof het om één databestand gaat. Het voordeel voor de gebruikers van deze laatste benadering is eenduidige toegang tot alle bronnen. Daarnaast biedt een dergelijk systeem een serie additionele voordelen. Een voorbeeld is de mogelijkheid om relevante tekstfragmenten uit verschillende gevonden documenten te selecteren en te bewaren in een ‘eigen dossier’. Via deze ‘mijn dossier’-functie kan dan op een handige en eenvoudige wijze knowhow worden opgebouwd en waar nodig gedeeld. Een andere mogelijkheid is het aangeven van een eigen profiel ten behoeve van attendering. Hiermee wordt de gebruiker geattendeerd wanneer er nieuwe documenten of tijdschriftartikelen verschijnen die voldoen aan het profiel. Een handige functie is verder bijvoorbeeld het bladeren in de verschillende publicaties, of in de laatste edities van tijdschriften.
Daarnaast is de zoekfunctie bij contentintegratiesystemen dikwijls zeer uitgebreid. De reden ligt voor de hand: de gecombineerde collectie documenten waarin wordt gezocht is zeer uitgebreid en divers.
Een belangrijk onderdeel van de zoekfunctie vormt de ‘ranking’- module, die de rangorde van zoekresultaten bepaalt. Deze module heeft de taak om een enorm aantal treffers (een gemiddelde, niet te specifieke zoekactie kan in dit soort systemen al snel duizenden documenten opleveren) zo te rangschikken dat de voor de gebruiker meest relevante documenten bovenaan verschijnen. Daarbij kan, naast het aantal malen dat en de plaats waar een zoekterm in elk van deze documenten voorkomt, ook het type bron waartoe het document behoort en de actualiteit (publicatiedatum) een rol spelen.
Toepassing
De nieuwe generatie contentintegratiesystemen wordt momenteel toegepast in twee segmenten, te weten de juridische markt in Nederland en de Europese Normen industrie. In beide gevallen doet zich de situatie voor dat de beschikbaarheid van alle relevante informatie van cruciaal belang is voor de gebruiker. Daarnaast is er sprake van een zeer divers aanbod van informatiebronnen. Hiervan bestaat een deel uit openbaar toegankelijke bronnen en wordt een ander deel geproduceerd door vele grotere en kleinere uitgevers en overheidsinstanties. Het is dan ook niet verbazingwekkend dat vrijwel alle grotere advocatenkantoren in Nederland intussen beschikken over contentintegratiesystemen, waarmee al deze bronnen kunnen worden ontsloten. Dit geldt eveneens voor de honderden internationaal opererende fabrikanten en bouwondernemingen die dagelijks via een dergelijk contentintegratiesysteem de geldende nationale, internationale en interne normen raadplegen.1
Op basis van het bovengenoemde kan worden geconcludeerd dat contentintegratie een antwoord kan bieden op informatieontsluitingsproblemen die – ten gevolge van het toenemende aanbod van digitale informatie – tegenwoordig steeds vaker optreden. Binnen bepaalde segmenten heeft dit al geleid tot de introductie van kanten- klare systemen die intussen breed worden toegepast. De verwachting is dat deze systemen ook daarbuiten snel aan populariteit zullen winnen.
Deze verwachting komt mede voort uit het feit dat contentintegratie voldoet aan de ultieme wens van de professionele gebruiker: ‘Toegang tot alle relevante informatie via één overzichtelijk zoeksysteem’.
Kees van Noortwijk is voorzitter van het Kenniscentrum Rechtsorde C-CONTENT BV/ Rechtsorde BV in ’s-Hertogenbosch.
1 Voorbeelden zijn Rechtsorde.nl voor de juridische markt en Perinorm voor de Europese Normen industrie.