12 mei 2023

Softwarearchief

image for Softwarearchief image

Op 10 december 2022 staat de teller op 13.301.978.706 ingecheckte en beheerde source files. Een onwaarschijnlijk getal, dat iedere dag weer groeit. We hebben het hier over de Software Heritage Organisation, een non-profitorganisatie die zich ten doel stelt om unieke software te archiveren. Wat zo mooi is aan hun opdracht, is dat iedereen zijn stukjes code kan delen, en je kunt er ook naar verwijzen voor hergebruik. Om met de Amerikaanse hoogleraar Computer Science en Engineering Harold Abelson te spreken: programma’s moeten worden geschreven zodat mensen ze kunnen lezen, en alleen incidenteel voor machines om uit te voeren. En ja, ook virussen zitten ertussen. Net als in een medisch lab of een willekeurige andere bibliotheek zit er van alles in. Er is alleen geen fysieke plek waarop je rustig tussen de rijen van code on the shelf kunt rondlopen.

Deze geschiedenis vastleggen is essentieel, zeker omdat omgevingen met een profit-karakter soms stoppen te bestaan. Denk aan Google Code en Gitorious.org en het verwijderen van codes door Bitbucket en GitLab. Al die codes bijeen: het brengt je op de vraag hoeveel codes er nog bij zullen komen, zeker nu machine learning en AI-routines zichzelf aanleren om codes te genereren en zichzelf kunnen reproduceren in betere versies van zichzelf.

Dat doet dan weer een beetje denken aan wat de Argentijnse schrijver Jorge Luis Borges beschrijft in The Library of Babel, een short story uit 1941 over een oneindig universum met daarin een oneindige bibliotheek met alle boeken die ooit geschreven zijn en ooit geschreven zullen worden, in alle talen die er zijn. Met 25 karakters (22 letters, een spatie, komma en punt) zou dat theoretisch mogelijk moeten zijn, hoewel heel veel boeken totaal onleesbaar zullen zijn.

Een werkende versie zien? Zoek de Amerikaanse auteur Jonathan Basile maar op, die het zowel voor teksten als voor foto’s heeft uitgewerkt. Toch wel interessant om te weten dat in theorie alles al bestaat, ook al is het er nog niet. Als we dat zouden omarmen, scheelt dat heel veel type- en klikwerk. En het zou ook veel tijd schelen voor mijn vrienden die nu via sociale media geinige mock-ups laten maken (door eenvoudige AI ondersteund) van hun gezicht. Voilà doet het in een handomdraai. De foto’s beloven ze na 48 uur weg te gooien. Je persoonlijk identificeerbare informatie, zoals telefoongegevens en activiteit online, om te delen met externe partners en adverteerders, natuurlijk niet. Hoe zou het zijn als je weet dat je dit allemaal niet meer hoeft te doen; de foto was er namelijk toch al in de Bibliotheek van Babel. Net als deze column overigens.

*Deze column is geschreven door Wouter Bronsgeest en verscheen oorspronkelijk in Od 25: Systemen in beeld.

Geef een reactie

Het e-mailadres wordt niet gepubliceerd. Vereiste velden zijn gemarkeerd met *