6 juni 2017

AutoMeta: Data Morgana? Jobs mag het weten!

image for AutoMeta: Data Morgana? Jobs mag het weten! image

Ik weet niet hoe jij jezelf ziet: als een diehard scepticus of als naïeve technologie-optimist of als iets ertussenin? Ikzelf kom er net achter dat ik allebei ben. Heel verwarrend…

Ik weet niet hoe jij jezelf ziet: als een diehard scepticus of als naïeve technologie-optimist of als iets ertussenin? Ikzelf kom er net achter dat ik allebei ben. Heel verwarrend…

Neem nou het mensloze archief: alle documenten en data in een groot dataquarium gooien en erin vissen met een soort Google-hengel: Quatsch. Maar als je alles dan eerst – terwijl je het in die grote glazen bak gooit – automatisch metadateert? Zo naïef! Hoevelen zijn wel niet roemloos verdronken in de oceaan van de techno-overmoed? Hoe zou dat nou komen? Weet je nog die tijd waarin zelfs de hoogste bazen bang waren voor de IT-afdeling? IT was de machtige efficiencybrenger. Onder dat mom begon een schrikbewind van soms wel twee decennia. (Hier en daar zie je nog naweeën. Geen idee waarom ik spontaan aan SharePoint denk.) De grootste slachtoffers toen? Organisaties met genoeg geld om IT helemaal los te laten gaan. Golf na golf van goedbedoelde, maar onbruikbare zelfgeknutselde technologische hoogstandjes overspoelde de arme werkbijen. (Geloof me, ik heb heel wat ontgoochelde archivarissen bijgestaan.) Het is een wonder dat sommige ministeries bijvoorbeeld die golven overleefd hebben! Nee, wie zijn ziel verkoopt aan verstokte IT’ers en gelooft in de fata morgana’s van hun begerige leveranciers en adviseurs, eindigt in het datavuur. Ik IT-sceptisch? Absoluut.

Er is maar één reden dat die terreur doorbroken werd en dat is Steve Jobs. Al met de eerste Apple Macintoshes ontstond een vijfde colonne binnen veel organisaties, eerst in de creatieve hoek. IT vervolgde deze vrijheidsstrijders – inclusief ondergetekende – met alle middelen, maar moest schuimbekkend toezien hoe zelfs topmanagers met schitterende laptops rondliepen die op hun rode lijst stonden. De iPhone was de genadeklap. Wie koos er nou nog vrijwillig voor een Windows-telefoon? IT verloor zijn kroon. Nu stromen ook de Macs en iPads de organisaties binnen, nota bene gepusht door bekeerlingen als IBM, SAP en Deloitte. Waarom? Omdat Jobs’ bedrijf niet sec de IT, maar nadrukkelijk ook de mens centraal stelt. Al die nieuwe hoogstandjes waar ITknutselaars publiekelijk mee paraderen, blijken niets anders dan onhandige experimenten (mobieltjes, tablets, horloges, koptelefoons, brillen…) totdat Mister Eenvoud zich ermee bemoeit. Wacht maar tot de iCompany zich stort op deling en beheer van documenten en op automatische metadata! Er schijnen daar al talrijke machine-learning-projecten te lopen! Ik weet zeker dat Apple…

Oeps… sorry! Zit ik zomaar op mijn stokpaardje. Je voelde het al aankomen, hè? Oké, ook mijn naïeve technologieoptimist- persona en daarmee mijn gespleten persoonlijkheid zijn nu wel bewezen. Of is er een middenweg? Onlangs hoorde ik op een Heterdaadsessie Theo van Veen van de Koninklijke Bibliotheek over hun vorderingen op het gebied van machine learning en automatische tekstinterpretatie. Fascinerend, dat deep learning, en ook veelbelovend, maar nog wel zeer rekenintensief! Vorige maand bij de Gemeente Doetinchem, op een andere Heterdaadsessie, bleek dat automatische metadatering helemaal geen utopie of data morgana is. Daar doen ze het gewoon: na de OCR worden elementen als NAW, datum, kenmerk en onderwerp van de brief automatisch herkend. In de volgende fase wordt de herkenning uitgebreid met de standaardwoorden in de belangrijkste documentsoorten.

Wow! Dus toch? Maar… Kan mijn Mac dat al? Nee? En alles moet toch nog gevalideerd worden…? Zie je wel: weer zo’n onvolwassen ITexperiment. Trap er niet in!

simon@simonpeterbeen.nl, Simon P. Been is oprichter van Papierentijger.net, kennisdelingsplatform voor informatieprofessionals.