, 1 november 2019

De voordelen van de cloud, Artificial Intelligence en Digital Automation

image for De voordelen van de cloud, Artificial Intelligence en Digital Automation image Achtergrond

De cloud en Artificial Intelligence (AI, kunstmatige intelligentie) doen hun intrede in de digitale platforms waarop medewerkers de dagelijkse werkprocessen afhandelen. De voordelen van deze ontwikkelingen spreken eigenlijk voor zich. De cloud zorgt voor een snellere uitrol van applicaties, software-updates, nieuwe functies en overzichtelijke (maandelijkse) kosten voor de diensten die worden afgenomen.

De cloud en Artificial Intelligence (AI, kunstmatige intelligentie) doen hun intrede in de digitale platforms waarop medewerkers de dagelijkse werkprocessen afhandelen. De voordelen van deze ontwikkelingen spreken eigenlijk voor zich. De cloud zorgt voor een snellere uitrol van applicaties, software-updates, nieuwe functies en overzichtelijke (maandelijkse) kosten voor de diensten die worden afgenomen. AI kan delen van de processen voor haar rekening nemen en ondersteunt de gebruikers, zodat deze betere en snellere beslissingen kunnen nemen en taken en processen sneller kunnen afhandelen.

Ook het Digital Business Automation (DBA)-platform van IBM (zie kader) maakt gebruik van de cloud en AI. Er is veel meer over te zeggen dan we in dit artikel kwijt kunnen, dus pakken we er de meest essentiële onderdelen uit.

Cloud en de overheid
De overheid is over het algemeen nog erg terughoudend in het gebruik van cloud-diensten – zeker in de Public Cloud – maar werkt al wel aan de ontwikkeling van Private Cloud in haar eigen datacenters. Het IBM DBA-platform is, naast de standaard installeerbare software (ook wel on-prem software genoemd), ook al geruime tijd beschikbaar als Cloud Pak for Automation om in een Private Cloud te draaien en als DBA on Cloud, waarbij het platform of onderdelen daarvan als een dienst (SaaS) afgenomen kunnen worden.

Hybride Cloud
Combinaties van alle drie de uitrolmogelijkheden kunnen ook worden gemaakt. Men spreekt dan van een hybride cloud-situatie. Er kunnen on-prem diensten gecombineerd worden met Public of Private Clouddiensten als er bijvoorbeeld al installaties draaien die niet direct omgezet kunnen worden. Zo kunnen Private, maar ook Public Cloud AI-diensten toch onderdeel van het werkproces worden gemaakt. Bijvoorbeeld bij het classificeren en extraheren van ongestructureerde data, omdat er geen gegevens opgeslagen worden tijdens of na de verwerking van het document en de verbindingen versleuteld zijn.

Containers
Waar vroeger software ontwikkeld werd om op fysieke servers te installeren, wordt er tegenwoordig ontwikkeld met een cloud-dienst als uitgangspunt. De containertechnologie heeft hieraan een impuls gegeven. IBM zet daarbij in op Docker. Docker-containers zijn op zichzelf staande softwaremodules die, samen met andere containers, worden beheerd en georkestreerd binnen een Kubernetes-omgeving, zoals Redhat OpenShift, bovenop een besturingssysteem, zoals Redhat Linux. Dit in tegenstelling tot bijvoorbeeld VMware-images die ook altijd het besturingssysteem moeten bevatten om te kunnen draaien. Het voordeel van de containertechnologie is het verplaatsen en het opstarten ervan. De container en dus de software kunnen al binnen een halve seconde operationeel zijn. Als een omgeving tijdens een piekperiode meer capaciteit nodig heeft, kunnen er simpelweg meer containers worden gestart. Het op- en afschalen van een omgeving kan zelfs volledig automatisch plaatsvinden.

Een goed voorbeeld van een programma dat ‘born-on-cloud’ is, is DBA Content Analyzer (kortweg BACA genoemd). Dit is een document capture service die op dit moment alleen in de DBA on Cloud beschikbaar is, maar binnenkort ook als container als onderdeel van Cloud Pak for Automation. Andere softwareonderdelen, zoals Workflow en Datacap, worden juist omgebouwd naar containers zodat ze eenvoudig in een Docker-omgeving kunnen worden gebruikt.

AI en Automation
Digitaal werken in overheidsprocessen betreft veelal communicatie met collega’s, burgers of ketenpartners. Het gaat dus veelal om tekstgeoriënteerde informatie. Denk maar aan e-mails, brieven, rapportages, verslagen, telefoonnotities, beleidsnotities enzovoort. Dit levert een enorme hoeveelheid informatie op die veelal ongestructureerd is. Een door de industrie geaccepteerde waarde is dat 80% van alle informatie ongestructureerd is. In veel processen bij de overheid is dat zeker niet anders. Twee gebieden waar je AI onder andere terugvindt, zijn ‘Classificatie & Extractie’ en ‘Operational Intelligence’.

Documentclassificatie en -extractie op basis van AI
Ongestructureerde informatie bestaat in allerlei formaten, zoals e-mails, gescande documenten of elektronische documenten zoals PDF en Word. Er is soms wel wat metadatering beschikbaar, zoals de auteur of afzender, het onderwerp en een datum, maar uiteindelijk gaat het vooral om de inhoud van het document. Om daar data uit te extraheren is het eerst van belang te bepalen wat voor informatie het betreft (classificatie) om vervolgens data uit het document te halen (extractie) die kan worden gebruikt in een werkproces of voor opslag en archivering. Je kunt dit aan een gebruiker overlaten, maar mensen zijn van nature geen goede classificeerders. Ook vereisen de volumes en de 24/7-economie van tegenwoordig eigenlijk een automatisch systeem, bijvoorbeeld op basis van Natural Language Processing (taalherkenning). De componenten van het DBA platform die hier gebruik van maken zijn bijvoorbeeld Datacap Insight, Content Classifier en Content Analyzer. Content Classifier IBM Content Classifier kan tekstgeoriënteerde informatie classificeren met behulp van AI. Van elke klasse in de taxonomie worden voorbeelddocumenten aan het systeem voorgelegd dat daarmee volautomatisch een Knowledge Base opbouwt. Tegen de Knowledge Base kunnen vervolgens nieuwe documenten worden geclassificeerd. Content Classifier geeft met een bepaald zekerheidspercentage aan in welke klasse het document valt. Als dit percentage te laag is, kan een gebruiker die voldoende rechten heeft het document alsnog toekennen aan een bepaalde klasse, of een nieuwe klasse aanmaken. Deze informatie wordt automatisch aan de Knowledge Base toegevoegd, zodat deze steeds slimmer wordt. Content Classifier kan los worden ingezet, maar wordt ook gebruikt in combinatie met tools als IBM Datacap, IBM Content Collector en IBM StoredIQ.

Content Analyzer is een component die niet alleen Optical Character Recognition (OCR, het lees- en selecteerbaar maken van tekst op een beeld) toepast op gescande documenten en classificeert, maar ook standaard ingebouwde labelwaarde-extractiemechanismes heeft. Met een heel eenvoudig, grafisch in te stellen ontologie is BACA al in staat om waardes die voorzien zijn van een label (denk aan ‘Datum: 19 oktober 2019’) te extraheren, ongeacht waar deze informatie zich op het document bevindt. Voor data die geen labelwaarden zijn kan de IBM Watson Natural Language Understanding SaaS-dienst worden gebruikt. Deze is in staat om locaties, adressen, persoons- en bedrijfsnamen et cetera te lokaliseren in de tekst. Ook het on-prem Datacap Insight Edition component kan op deze manier gebruikmaken van IBM Watson services.

Verzamelen, visualiseren en gebruiken van operationele data
Het doel van Operational Intelligence en het product Business Automation Insight is om zicht te krijgen in de operationele werking van alle DBA-componenten en dit te visualiseren in dashboards. De data die daarbij verzameld wordt, kan vervolgens ook door data scientist gebruikt worden om analyses op te doen. Deze historische data kan ook door AI-tools en Machine Learning-modellen worden gebruikt om bijvoorbeeld aanbevelingen te doen aan gebruikers, zoals de beste volgende stap in het proces om het dossier of de zaak tot een goed einde te brengen.

Over IBM Digital Business Automation
Het Digitaal Business Automation-platform is ontstaan uit de samenvoeging van Enterprise Content Management en Digital Process Automation; het bevat alle elementen om digitaal zaken te doen. Verschillende departementen, zoals J&V, BZK & VWS, maar ook uitvoeringsorganisaties, zoals UWV, Belastingdienst en RIVM maken al gebruik van dit platform. Omdat het DBA-platform nog volop doorontwikkeld wordt, worden er regelmatig nieuwe componenten en functies aan het platform toegevoegd.



Marcel Osterwald
Solution Consultant bij IBM in Digital Business Automation