Voor beta’s ben je aan de Drift niet aan het juiste adres. Toch zijn het niet alleen geesteswetenschappers die bivakkeren in de historische gebouwen van de binnenstad. In twee kamers op de derde verdieping van Drift 10 zit een groep jonge wetenschappers die zich, onder leiding van dr. José de Kruif, bezighoudt met data, cijfers en informatica.

Door: Joram Appel

Met behulp van de dames en heren van het Digital Humanities Lab van de Universiteit Utrecht kunnen wetenschappers en bedrijven voor hun onderzoek op grote schaal gebruik maken van digitale data. “In eerste instantie gebruiken we bestaande software en leren we dat aan. Bestaat het niet? Dan bouwen wij het,” vertelt universitair docent, ICT-consultant en teamleider José de Kruif over haar afdeling.

Als historica is de Kruif al vroeg in aanraking gekomen met de digitale kant van de geschiedwetenschap. “Mijn studie deed ik tijdens de eerste digitaliseringsgolf. Dat houdt in dat er toegang kwam tot databanken en spreadsheets waarin data verwerkt kon worden.” Ook binnen geesteswetenschappen was de toenemende digitalisering aanzienlijk: “Het leverde de nieuwe discipline ‘alfa informatica’ op en de faculteit Geesteswetenschappen kreeg een eigen afdeling: ‘Computer en Letteren’.”

De Kruif ziet zichzelf als een alfa met een digitaal pootje. Het verschil met ‘hardcore geesteswetenschappers’ is dat ze historisch onderzoek doet met behulp van digitale methoden. “Dat is minder moeilijk dan het klinkt. Denk bijvoorbeeld aan het automatisch analyseren van nieuwsberichten uit het verleden.” De traditionele bestudering van een handvol bronnen geeft volgens de Kruif een beperkt beeld van de informatie die men in bepaalde periode tot zich nam: “Je krijgt door tegelijkertijd te kijken naar veel data een veel beter beeld van wat tijdgenoten hebben gezien. Die konden toen bijvoorbeeld kiezen uit een krant, spectator of pamflet. Ik kan nu zien wat voor informatie –mits gedigitaliseerd – die mensen kregen aangeboden.”

“Bestaat het niet? Dan bouwen wij het.”

 

Dat wil niet zeggen dat er niet naar individuele bronnen wordt gekeken. In haar proefschrift over achttiende-eeuws boekbezit keek de Kruif naar data van boekhandels en boedelinventarissen, maar las ze in dagboeken ook over mensen die over hun boeken schreven. Die dagboeken waren minder waardevol geweest zonder data: “Je moet een groot referentiekader kunnen gebruiken om artikelen en bronnen te kunnen interpreteren.”

In tegenstelling tot het huidige onderwijs was ‘alfa-informatica’ tijdens de studie van de Kruif een onderdeel van het curriculum. “Op mijn opleiding leerde ik al met data omgaan en programmeren.” Waarom dat nu niet zo is? “Het probleem is dat de staf, die zichzelf als ras-alfa ziet, er niks mee doet. Als ze daar niet uit gaan komen, raken ze achter. De wereld en de geesteswetenschappen gaan nu eenmaal de kant van het digitale op.” Wat dat betreft komen er spannende tijden aan: “Ik ben benieuwd wanneer wat we nu ontwikkelen gemeengoed gaat worden.”

Vanzelfsprekend zijn die ontwikkelingen niet. Er werken nu zes mensen bij het Digital Humanities Lab en dat zijn er niet genoeg om ook studenten te begeleiden bij het gebruiken van digitale hulpmiddelen. “Ik hoop dat er over tien jaar ook op deze faculteit statistiek wordt gegeven. Daarnaast zou ik graag zien dat studenten kennis hebben van technieken die je als kunsthistoricus bijvoorbeeld kan gebruiken om digitaal afbeeldingen te vergelijken.”

“Het is een slinger van afbraak en restauratie als het om Digital Humanities gaat.”

Je zou zeggen dat na zeker dertig jaar digitale programma’s bij de faculteit Geesteswetenschappen de digitale kant van historisch en cultureel onderzoek al lang en breed ingeburgerd zou zijn. Maar na een enthousiaste eerste introductie werden de voorzieningen voor Digital Humanities op bijna alle universiteiten weer afgebouwd. “Het is een slinger van afbraak en restauratie als het om Digital Humanities gaat. Er is in de loop van de tijd een duidelijke splitsing ontstaan tussen de historici die zich bezighouden met data, zoals sociaal economische historici en degenen die daar niks van willen weten.” Maar er is hoop: “Het komt wel weer,” vermoedt de Kruif. “De technieken verbeteren constant en er worden veel teksten gedigitaliseerd. In de literatuurwetenschap zie je bijvoorbeeld dat er een nieuwe beweging ontstaat die kijkt naar data over tekst en bijvoorbeeld het toeschrijven van auteurschap.”

Een probleem van Digital Humanities is dat het erg abstract is als je er over praat. Om het concreter te maken noemt de Kruif een voorbeeld. Er is onderzoek gedaan naar Hebreeuwse graven (die niet geruimd mogen worden, en daardoor een haast permanente historische bron zijn). Door alle teksten van Hebreeuwse graven te analyseren, kun je zien wanneer en waar tekst en symboolgebruik veranderen. “Dat zie je vaak pas als je lange reeksen vergelijkt. Ik ben dol op dat soort onderzoek. Het is elegant en je komt een heel eind met weinig tekst, die zonder breed referentiekader moeilijk te interpreteren is.”

Ter illustratie komt de Kruif met een tweede voorbeeld op de proppen. “Multatuli was gokverslaafd en had geld nodig. Hij werd correspondent in Pruisen voor een Nederlandse krant, maar in die tijd was het not done om in de krant een eigen mening te ventileren. Berichten mochten slechts worden overgenomen van andere media. Dus wat deed Multatuli? Hij verzon een krant, waarin hij stukken schreef die hij naar de krant stuurde waar hij correspondent voor was.“ Zoiets zou met geautomatiseerde tekstvergelijking niet lang geheim blijven. Software kan de schrijfstijl van Multatuli herkennen, waardoor zulke oplichterij gelijk aan het licht komt als je een hele berg kranten uit die tijd met elkaar zou vergelijken.

De Kruif loopt naar een computer om te laten zien hoe zulke data in de praktijk gebruikt kan worden. Ze herinnert zich enthousiast dat er een mooie datavisualisatie is gemaakt van oude romeinse wegen. Na een goede tien minuten zoeken in allerlei mappen vindt ze het: OmnesViae, een tomtom voor in de Romeinse oudheid. Vul twee plaatsen in, zoals Praetorium Agrippinae (Valkenburg) en Mediolanvm (Milaan), en je ziet in een oogopslag hoe de Romeinse handelaar daar naar toe had kunnen reizen. “Dat laat zien dat Digital Humanities niet alleen toepasbaar is op de moderne geschiedenis, maar ook op perioden waarvan we minder data hebben, zoals die van de Romeinse oudheid.”

“Hoeveel data je ook gebruikt, het wordt geen harde wetenschap.”

Terwijl de Kruif haar verhaal doet, druppelen een voor een twee personen de kamer binnen. Het zijn Gerson en Jelmer, lange jongens van een jaar of twintig die geen geschiedenis, maar informatica hebben gestudeerd. Ze werken bij het Digital Humanities Lab, waar ze software voor geesteswetenschappelijk onderzoek ontwikkelen en programmeren. “Daarbij kijken we in eerste instantie naar wat de wetenschappers die we helpen willen. We hebben zelf ook helemaal geen kennis van geschiedwetenschappelijke doelen,” vertelt Gerson.

Toch hebben ze een drastisch effect op de onderzoeksmethode. “Wij zien een ander soort problemen. Veel mensen die hier komen hebben weinig verstand van computers. Tijdens het ontwikkelen worden de mogelijkheden pas duidelijk,” voegt Jelmer toe. Andersom denken de programmeurs van het Digital Humanities Lab naar eigen zeggen te weinig na over ‘alfa-hobby’s’. “Taal is wat datawetenschappers niet goed doen. Dat taal tijd en plaatsgebonden is bijvoorbeeld, daar staan we weinig bij stil. Daarom is het fijn dat de onderzoekers zelf de baas blijven over hun eigen methode.”

Toch vinden Jelmer en Gerson de geesteswetenschappen nog steeds te soft. “Hoeveel data je ook gebruikt, het wordt geen harde wetenschap. Er zijn zo veel aannames nodig voor je tot conclusies kan komen,” concludeert Gerson. “Hoewel Digital Humanities bijdraagt aan de geloofwaardigheid van de geschiedwetenschap, het wordt nooit waarheid.”