Middeleeuwse mysteries vs. digitale taalanalyse

Gepubliceerd op 21-09-2020 , laatst bijgewerkt op 04-12-2020.
Type
Press
Taal
Nederlands

PhD Cup 2020

In november 2019 verdedigde Jeroen De Gussem aan de universiteiten van Gent en Antwerpen met veel succes zijn doctoraat, waarin hij methodes voor digitale taal- en stijlanalyse hanteerde waarbij een computer auteurs kan herkennen en vergelijken met elkaar. De software, die hij zelf programmeerde, bestaat uit taalalgoritmes die toelaten om het 'stilistisch DNA' van een auteur te achterhalen. Een beetje zoals CSI voor de taalkunde. Hij testte het systeem met succes op eeuwenoude middeleeuwse teksten en collecties in het Latijn. Dankzij dit onderzoek kunnen nu niet alleen betwiste toeschrijvingen van teksten aan bepaalde auteurs geverifieerd worden, in principe kunnen ook teksten die eeuwenlang anoniem bleven, geanalyseerd en vergeleken worden om zo de auteur(s) te vinden. Men kan zelfs in teksten met meerdere auteurs het relatieve aandeel van elke betrokken auteur gaan bepalen. Klinkt spectaculair? Dat is het ook! Het hoeft dan ook niet te verbazen dat het onderzoek van Jeroen is geselecteerd voor de PhD Cup 2020, de meest prestigieuze publiekscompetitie voor nieuw doctoraatsonderzoek in Vlaanderen. Uit 81 inzendingen werden slechts 16 onderzoekers geselecteerd. Zij kregen intense mediatraining bij de VRT. Uiteindelijk werden 8 kandidaten, waaronder Jeroen, geselecteerd voor de finale op 6 oktober in Het Depot (Leuven)! Jeroen verdedigde de eer van de middeleeuwse studies met verve.

De beker ging uiteindelijk naar Bert van den Bogerd (UAntwerpen) die werkt aan kunstmatige hoornvliezen om blindheid te genezen.

Coverfoto artikel (c) Kevin Faingaert

In de pers: gemanipuleerde liefdesbrieven

Kort na de selectie voor de PhD Cup, vroeg wetenschapsmagazine EOS Jeroen om een bijdrage. Hij vertelt over zijn analysesysteem aan de hand van een van zijn case studies, een van de bekendste en meest mysterieuze tekstcollecties van de middeleeuwen: de liefdesbrieven van Héloïse en Abélard. Die brieven zijn het product van een tragische romance. In Parijs in de 12de eeuw worden een jonge adellijke dame en de populaire (en veel oudere) schoolmeester die werd ingehuurd voor haar onderwijs verliefd. Héloïse wordt zwanger en haar oom, de machtige kanunnik Fulbert, laat Abélard overvallen en castreren. Geschokt en gescheiden van elkaar treden de twee geliefden daarop elk toe tot een klooster en starten ze een correspondentie. Die teksten zijn bewaard en vormen de basis van de roem van dit middeleeuwse koppel. Nog steeds trekt het grafmonument op Père Lachaise, waar Héloïse en Abélard in de 19de eeuw samen werden begraven, drommen romantische zielen.

Al een halve eeuw debatteren specialisten echter al over de authenticiteit en het auteurschap van de briefwisseling omdat die simpelweg te kunstmatig, te "af" en misschien te literair aanvoelt. Men wordt het maar niet eens. Wie schreef de brieven? Zijn ze geen latere vervalsing? Welke rol had Héloïse als auteur? Wat had de auteur van deze spraakmakende collectie, wie hij of zij dan ook was, eigenlijk voor ogen? Met zijn digitale taal- een stijlanalyse, heeft Jeroen De Gussem nu voor het eerst erg overtuigende antwoorden kunnen formuleren op al die vragen. Je vindt het volledige verhaal voor EOS hier. Op Medieval / Modern vind je ook Jeroens originele 3-minuten pitch voor de PhD Cup.

Ook VRT Taal, de taaldienst van de openbare omroep, heeft het stuk hernomen. Dit vind je hier! De krant De Standaard wijdde op 2 oktober een long read aan Jeroens razend spannende onderzoek.

Beetje CSI in de taaltechnologie

Wil je meer weten over de technologie en principes achter Jeroens onderzoek? In de EOS Wetenschap 'Psyche en Brein' special over identiteit (2020) publiceerde hij samen met Walter Daelemans (UAntwerpen), professor computertaalkunde, een stuk over het wat, hoe en waarom van taalalgoritmen. Nieuwsgierig naar wat je taalgebruik allemaal over je verraadt? De auteurs leggen perfect uit welke technologieën er bestaan, hoe accuraat die zijn en waarvoor die zoal (kunnen) worden gebruikt. Naast de analyse van eeuwenoude handschriften dan...