, 17 december 2019

Nationaal Archief en Kadaster brengen onteigening WOII in kaart

image for Nationaal Archief en Kadaster brengen onteigening WOII in kaart image Case

De koppeling is vorig jaar gerealiseerd tijdens de HackaLOD2018. En begin 2019 ontstond het plan om de Verkaufsbücher te linken aan kadastrale informatie uit de BAG (Basisregistratie Adressen en Gebouwen),2 de geografische en locatiecomponent van het Kadaster. Een projectteam bestaande uit LOD-specialisten van het Kadaster en het Nationaal Archief ging vier dagen lang aan de slag. We kozen ervoor om met datastories3 de gekoppelde data te tonen. En zo de gebruiker op een laagdrempelige wijze mee te nemen in soms complexe data(structuren).

De koppeling is vorig jaar gerealiseerd tijdens de HackaLOD2018. En begin 2019 ontstond het plan om de Verkaufsbücher te linken aan kadastrale informatie uit de BAG (Basisregistratie Adressen en Gebouwen),2 de geografische en locatiecomponent van het Kadaster. Een projectteam bestaande uit LOD-specialisten van het Kadaster en het Nationaal Archief ging vier dagen lang aan de slag. We kozen ervoor om met datastories3 de gekoppelde data te tonen. En zo de gebruiker op een laagdrempelige wijze mee te nemen in soms complexe data(structuren). Als oefenruimte gebruikten we de digitale lab-omgeving van het Kadaster: PDOK (Publieke Dienstverlening Op de Kaart).4 Hier brachten we letterlijk in kaart waar de woningen van door de nazi’s onteigende mensen zich bevonden. Het resultaat geeft een visueel zeer krachtig inzicht in de verbijsterende geschiedenis van onteigening tijdens de Tweede Wereldoorlog.

verkaufsbucher

Scan uit de Verkaufsbücher: 2.09.16 532.1 (Boek 2, Laufnummer 401 t/m 750).

Voorbereiding
Om deze visualisatie te realiseren en de koppeling met het kadaster mogelijk te maken, moest het Nationaal Archief de data van de Verkaufsbücher eerst verbeteren. De bewerking bestond uit:

1. straat- en plaatsnamen voluit schrijven (v.-van, Joh.-Johannes, enzovoort) en uniformeren per plaats;
2. de namen van kopers en bedrijven standaardiseren en uniformeren (zoals v.d. veranderen in Van de). Voor de eigenaren was dat onmogelijk vanwege de grote diversiteit;
3. alle Duitse woorden in de objectomschrijving (Wiese en dergelijke) vertalen naar het Nederlands;
4. duidelijke fouten verbeteren (Rembrandtlaan in plaats van Rembrandstraat).

Informatie verbinden met linked open data
Na de databewerking konden we de data omzetten naar linked open data.5 Om de gegevens aan elkaar te kunnen koppelen, zijn triples gemaakt; brokjes informatie die iets zeggen over een bepaald gegeven. Een triple bestaat uit een subject, predicaat en object. In de afbeelding hieronder zijn de bollen subject of object. De lijnen zijn de predicaten. Rechtsboven op de GraphDB zie je bijvoorbeeld dat persoon J.P. Everout (subject) als ‘country of Origin’ (predicaat) Nederland (object) heeft en als ‘has address’ Keijzer Karelweg 485. Ook wordt de triple getoond dat J.P. Everout de koper is (‘heeft rol’/‘Buying party role’).

grapphdb

GraphDB; tool voor het maken van triples.

Door deze eenvoudige structuur kan een informatienetwerk ontstaan. Dat is makkelijk uit te breiden door nieuwe triples toe te voegen of te linken, zoals de triples over de locaties uit de BAG. Met behulp van SPARQL – een zoektaal – kunnen relaties gezocht worden die in dit netwerk zijn opgebouwd. Dat was ook het doel van de samenwerking met het Kadaster.

Vierdaagse sessie: koppeling met de BAG
De eerste twee dagen van de werksessie stonden vooral in het teken van de initiële koppeling van de adresgegevens uit de Verkaufsbücher en de adressen uit de Basisregistratie Adressen en Gebouwen (BAG). Allereerst bevroegen we de locatieserver voor het verkrijgen van adressen uit de Verkaufsbücher.

De locatieserver is een tool van het Kadaster en bevat gegevens uit de BAG. Bij een opdracht in de locatieserver worden suggesties voor adressen teruggegeven. Je schrijft bijvoorbeeld Amstelstraat 111, maar bedoel je niet Amstel 111? Daarbij wordt ook de betrouwbaarheidsscore meegegeven. Bij een een-op-een-match is dat bijvoorbeeld 99% of 100%. Na een eerste actie werden 6923 adressen ‘gematcht’. Aan deze adressen werden gelijk de postcodes en de object-ID’s (de standaardbeschrijvingen van de objecten) uit de BAG gekoppeld.

Niet zo eenvoudig
Wat vooraf een eenvoudige koppeling leek, bracht onvoorzien veel werk met zich mee. Zeventig jaar geleden hadden adressen bijvoorbeeld nog geen postcodes, er waren diverse spellingsvarianten of ze maakten deel uit van plaatsen en gemeenten die nu niet meer bestaan. Transacties uit de Verkaufsbücher met een combinatie van panden (zoals Amstel 216-318) of straatnamen die uit twee delen bestaan (zoals de Nieuwe Keizersgracht 74) leverden geen betrouwbaar resultaat op. De locatieserver gaf bij de straatnaam Amstel als resultaat namelijk ook Amsteldijk. Dat resultaat kreeg bovendien een hogere score dan Amstel. Daarom is een tweede controle ingebouwd. Hierbij controleerden we of het resultaat daadwerkelijk de juiste straatnaam betrof: op hoeveel punten wijkt de suggestie af van de input; ligt de suggestie in dezelfde plaats als de ingegeven straatnaam en klopt de toevoeging? Bij een zoekactie op Amstel 318 werden zowel 318-2, 318 en 318 hs als suggesties gegeven, waarbij we alleen 318 als juist hebben beschouwd. Deze tweede controle achterhaalde uiteindelijk ruim twee derde van de adressen uit de Verkaufsbücher met een afwijkende schrijfwijze. Van de 13051 adressen hebben we er uiteindelijk 10581 gematcht.

Gegevens in beeld
Na de koppeling tussen de datasets volgde stap 2: het op verschillende wijzen visualiseren van de data. Dat liep langs een tweetal sporen. Enerzijds de koppeling zoeken met de kaart, en de gebeurtenissen hierop plotten via de gekoppelde adressen (BAG en Verkaufsbücher). Anderzijds statistische visualisaties genereren vanuit de Verkaufsbücher.

Bij de kaartkoppeling zie je afhankelijk van de gekozen schaal per stad en regio clusters van transacties samenkomen. Wanneer je inzoomt tot op een bepaald pand zie je een marker. De volgende stap op de kaart was het inzoomen op een stad, bijvoorbeeld Utrecht. Op de kaart van Utrecht hebben we markers geplot. Wanneer een marker wordt aangeklikt zie je zowel (financiële) details uit de Verkaufsbücher (Nationaal Archief), als de kadasterdetails rond dat adres: oppervlakte en gemiddelde WOZ-waarde.

De locatieserver van het Kadaster geeft ook de centroïde coördinaten, dat is het midden van het perceel of de oppervlakte van het BAG-pand. Met behulp van deze centroïde coördinaten is via Google Maps een koppeling gemaakt met Google Streetview. Hiermee kan snel een afbeelding opgevraagd worden van het betreffende pand.

Tot slot hebben we inzichtelijk gemaakt of onteigenden en kopers bij elkaar in de buurt woonden of niet. En hoe de onteigenden (groen), kopers (paars) en het verkochte pand (grijs) zich geografisch ten opzichte van elkaar verhouden. Het valt dan op dat veel van de panden en transacties in Utrecht binnen de stad plaatsvinden. Deze statistische weergaven geven inzicht in alle ruim 7.000 transacties uit de Verkaufsbücher: waar vooral panden zijn verkocht, of kopers uit dezelfde stad afkomstig waren en hoeveel de verkoop opleverde.

kaart met verkaufsbucher

Overzicht van de verschillende adressen en rollen uit de Verkaufsbücher in Utrecht, geplaatst op de kaart.

Berekening van schaderegelingen
De koppeling van de datasets kan ook gebruikt worden voor de berekening van schaderegelingen. Met de gegevens die we nu hebben, is het mogelijk om op basis van het aantal vierkante meters van de panden de hoogte van een vergoeding vast te stellen. Met een link tussen de adressen en eigenaren van geroofde panden uit de Verkaufsbücher en de oppervlakte uit de BAG is een inschatting te maken van het totaal (te reserveren) en uit te keren bedrag. Voorbeeld: in de gemeente Utrecht zijn 81 panden met een oppervlakte van 13.559 m2 verkocht. Bij € 100 per m2 is dat ruim € 1,3 miljoen, te verdelen over de eigenaren en nabestaanden.

De gemeente Den Haag heeft onlangs € 2,6 miljoen gereserveerd voor schadevergoedingen aan Joodse slachtoffers die na de oorlog een aanslag kregen om alsnog hun erfpacht te betalen. Ook in andere gemeenten, zoals Rotterdam en Utrecht lopen onderzoeken met het oog op een  schaderegeling.6

Tot slot
Door de koppeling van de dataset van de Verkaufsbücher met data uit de BAG, worden de destijds onteigende en geroofde objecten letterlijk op de kaart gezet. Dit maakt inzichtelijk waar en op welke schaal in Nederland sprake was van onteigening. En maakt eventuele relaties tussen eigenaren en kopers zichtbaar; kocht men bijvoorbeeld huizen van buurtgenoten? De visualisatie biedt een enorme meerwaarde. 

In één oogopslag geeft het inzicht in complexe, historische linked data. De datakwaliteit bij (historische) linked data mag niet onderschat worden. De Verkaufsbücher leken op voorhand gemakkelijk te koppelen aan de hedendaagse (Kadaster-)adressen gezien de rijkdom aan adresgegevens. De praktijk bleek weerbarstiger. Ondanks de ogenschijnlijk enorme overeenkomst die we zagen tussen de adressen uit bijvoorbeeld Amsterdam in 1943 en de hedendaagse plek, kostte het de nodige technische en handmatige acties om een definitieve koppeling tussen verleden en heden te leggen. Naarmate je verder met linked data het verleden induikt, nemen deze uitdagingen toe. Desalniettemin zijn we erin geslaagd ruim twee derde van de data van de Verkaufsbücher te matchen!

Finalist Stuiveling Open Data Award
Het Verkaufsbücher-project van het Nationaal Archief en Kadaster was genomineerd voor de SODA Award. Een prestigieuze prijs voor doorontwikkeling van de toepassing van linked open data of van nieuwe open-data-activiteiten. De jury omschreef het als “Een bijzondere en innovatieve combinatie tussen oude archiefstukken en open data. Het is een eerbetoon dat zorgt dat je op een andere manier naar de werkelijkheid kijkt.” Het streven naar rechtmatigheid door de inzenders verdiende volgens de jury een bijzondere vermelding. Kijk voor meer informatie op www.soda2019.nl.

 

Met speciale dank aan het Hackathon team bestaande uit Babette van Alphen, Pano Maria, Nathan van Dalen en Roel Stap van het Kadaster, en Fairoesh Nanhekhan en Vincent Sleebe van het Nationaal Archief. 


Ed de Heer
Projectleider-adviseur Linked Open Data

Tim de Haan
Medewerker Kennis en Advies / Strategische Openbaarheid


Noten 

1 Zie: https://www.nationaalarchief.nl/onderzoeken/open-data/opendata-indexen >> Verkaufsbücher.
2 Zie: https://www.geobasisregistraties.nl/basisregistraties/adressenen-gebouwen
3 Een datastory is een HTML-presentatie waarin de mogelijkheden van SPARQL (een linked data zoektaal), de kracht van datavisualisatie en de eenvoud van beschrijvende tekst worden gedemonstreerd via: https://data.labs.pdok.nl/stories
4 Zie: https://data.labs.pdok.nl/stories/verkaufsbucher/
5 Meer weten over linked open data: www.pilod.nl.
6 https://www.volkskrant.nl/a-b7e75c47.