Deze AI-bot vertaalt dode oude talen naar het Engels

By | May 16, 2023

Foto-illustratie door Thomas Levinson/The Daily Beast/Getty/Wikimedia Commons

Op talloze plaatsen over de hele wereld waar oude artefacten en de overblijfselen van ooit bloeiende samenlevingen zijn ondergebracht, liggen kleitabletten begraven met berichten die al meer dan 5000 jaar wachten om gelezen te worden. Deze berichten, geschreven met een riet dat in de klei is gedrukt om spijkerschrifttekens te vormen, waardoor het zogenaamde spijkerschrift ontstaat, worden algemeen beschouwd als de vroegste voorbeelden van geschreven taal in de menselijke geschiedenis.

Ongeveer 600.000 van deze cryptische tabletten zijn de afgelopen eeuwen opgegraven en ze stapelen zich op in universiteits- en museumcollecties over de hele wereld. Met behulp van deze bevindingen konden onderzoekers, bekend als assyriologen, uitgestorven talen ontcijferen, vertalen en nieuw leven inblazen – zoals het Akkadisch, dat ooit werd gesproken door mensen die in Mesopotamië woonden in ‘s werelds eerste beschavingen.

Er is echter maar een beperkt aantal assyriologen die deze oude teksten kunnen vertalen. Aangezien er elk jaar nieuwe kleitabletten worden ontdekt, wordt het steeds moeilijker om deze oude berichten in moderne talen te raden.

“Er zijn maar heel weinig mensen die het echt goed kunnen lezen”, vertelde Shai Gordin, een assyrioloog aan de Ariel University, aan The Daily Beast. “Het is ook 3000 jaar geschreven geschiedenis, nietwaar? Dus alleen omdat iemand een spijkerschriftperiode heel goed kan lezen, wil nog niet zeggen dat ze de andere spijkerschriftperiodes ook heel goed kunnen lezen.

Om hen te helpen het groeiende aantal oude talen in moderne talen te vertalen, besloten Gordin en zijn collega’s zich te wenden tot een geavanceerde, opkomende technologie: kunstmatige intelligentie. Meer specifiek was het team in staat om een ​​neuraal netwerk te ontwikkelen dat Akkadisch en Sumerisch spijkerschrift in het Engels kon vertalen. De onderzoekers publiceerden op 2 mei een artikel over hun bevindingen in het tijdschrift PNAS Nexus.

Zo’n model kan niet alleen helpen om het vertaalproces voor onderzoekers aanzienlijk te versnellen, maar geeft historici en assyriologen ook de kans om nieuwe en diepere inzichten te verwerven in deze oude beschavingen. De auteurs zien ook mogelijkheden in het democratiseren van de Assyriologie door leken toegang te geven tot dergelijke hulpmiddelen.

“Dat wilden we heel graag [Assyriology] meer geïntegreerd zijn in de technologie, ‘zei Gordin. “Enerzijds maakt dit het proces meer naadloos en gestandaardiseerd. Aan de andere kant helpt het ons juist om nieuwe en opwindende vragen te stellen, omdat het ons in staat stelt patronen te zien die we voorheen niet zagen.”

In positieve of negatieve zin kan AI worden gezien als de volgende evolutie in de relatie van de mens met taal. AI-tools zoals Google Translate kunnen mensen niet alleen helpen communiceren en elkaar begrijpen, ongeacht in welke hoek van de wereld ze zijn geboren, maar grote taalmodellen (LLM) zoals OpenAI’s ChatGPT en Google’s Bard beginnen ook het soort en fundamentele de manier veranderen waarop sommige mensen werken Mensen schrijven en reageren op de inhoud die ze online zien.

Het is dus geen echte verrassing dat AI uiteindelijk zou voortkomen uit enkele van de oudste talen die de mens kent. Willis Monroe, een historicus van het oude Nabije Oosten aan de Universiteit van British Columbia die niet betrokken was bij het onderzoek, vindt het in bijna poëtische zin passend dat Gordin en zijn collega’s een AI-model ontwikkelden om zichzelf te testen om ermee om te gaan een van de vroegste geschreven talen in de menselijke geschiedenis.

“Spijkerschrift is heel, heel oud,” vertelde Monroe aan The Daily Beast. “Het is een van de vroegste, zo niet de vroegste scripts ter wereld. Wat het zo leuk maakt, is de combinatie van moderne, digitale benaderingen zoals neurale netwerken en machine learning met het eerste schrijven ooit. Het is een soort boekwinkel die de door de mensheid geschreven geschiedenis afsluit, dus het is echt opwindend werk.”

Een arts publiceerde in razend tempo verschillende onderzoekspapers. ChatGPT heeft ze allemaal geschreven.

Het model zelf is een uitbreiding van de Babylonian Engine, een digitaal assyriologisch platform dat tot doel heeft nieuwe technologieën te combineren met de studie van deze vroege geschreven talen. “Het doel is om kunstmatige intelligentie en machine learning-modellen te integreren in het daadwerkelijke werk dat we doen als historici en geleerden uit het verleden”, zei Gordin.

Deze nieuwste studie is een grote stap in de richting van dat doel – zij het een enorme stap gezien de beperkingen van spijkerschrift. Ten eerste lijkt het scenario op een ‘driedimensionaal handschrift’, zei Monroe. “Het is alsof je probeert een computer automatisch een vertaling te laten maken van iemand die in het Frans schrijft met een stok op het strand. Het is heel ingewikkeld.”

Hij voegde eraan toe dat hoewel er teams werken aan modellen die spijkerschrift rechtstreeks kunnen vertalen, dat nog ver weg is, aangezien het script bedoeld is om te worden gelezen in “verschuivend licht”. Dit is een inherente beperking van zelfs de krachtigste computer.

Dit kleine stadje gemaakt door ChatGPT is beter dan reality-tv

Om dit te omzeilen, trainde het team eigenlijk twee versies van het neurale netwerk. De eerste converteert Akkadisch getranscribeerd in de Latijnse tekst naar het Engels (T2E), terwijl de andere Unicode – een internationale coderingsstandaard die scripts en letters toewijst aan cijfers – weergaven van spijkerschrift – vertaalt naar het Engels (C2E). Hoewel spijkerschrift niet direct werd gebruikt, stelde deze methode onderzoekers in staat modellen te maken die het Akkadisch effectief vertaalden.

Om het succes van de vertalingen te meten, gebruikte het team de Best Bilingual Evaluation Understudy (BLEU), een beoordelingscategorie die de nauwkeurigheid van de vertaling meet. De T2E leverde de meest nauwkeurige verhoudingen van de twee modellen, met een gemiddelde van 37,47, terwijl de C2E een gemiddelde van 36,52 opleverde. Beide zijn relatief hoge BLEU-scores en tonen aan dat het model begrijpelijke vertalingen kon produceren.

Hoewel het neurale netwerk veelbelovend is, waren er enkele kanttekeningen. Ten eerste is het model vatbaar voor hallucinaties, een hardnekkig probleem met LLM’s en andere generatieve AI’s, waarbij het systeem onnauwkeurige of ronduit verkeerde antwoorden bedenkt. Gordin ontdekte dat dit vaak gebeurde wanneer het model probeerde tekst van meer dan 118 tekens te vertalen.

Google’s AI-chatbot Bard verspreidt desinformatie en haat, vinden onderzoekers

Een vertaling die ze via het neurale netwerk gaven was bijvoorbeeld: “Wanneer de dag van de verdwijning van de maan zijn normale lengte bereikt: de dagen van de heerser zullen lang zijn.” Het model vertaalde het echter als “Wanneer de dag bereikt zijn normale lengte: een heerschappij van lange dagen.”

“Dus het is heel dichtbij, maar niet zo nauwkeurig als een menselijke vertaler,” zei Gordin.

Gordin zei dat dit voorbeeld het belang onderstreept van het altijd op de hoogte hebben van een mens als het gaat om deze tool – en vergelijkbare AI’s. Met de proliferatie van LLM’s moeten deze systemen worden gezien als hulpmiddelen die echte mensen van vlees en bloed ondersteunen in hun werk, in plaats van ze volledig te vervangen. Hoe nuttig het Akkadische neurale netwerk ook is voor het werk van Gordin en zijn mede-assyriologen, het kan de intuïtie en het overzicht van een menselijke geleerde niet volledig vervangen.

“Er is nog steeds een menselijk element,” zei Monroe. “In termen van het vertalen van de Akkadische wereld is dit zeer effectief. Dit elimineert een of twee stappen in het proces – maar er zijn nog steeds mensen die de kleitabletten echt moeten vasthouden en bestuderen.”

Je weet het misschien niet, maar je hebt veel te danken aan de Mesopotamiërs. Alles, van ons numerieke systeem tot onze kennis van astronomie tot ons systeem van de rechtsstaat, is terug te voeren op deze zeer oude beschaving en haar schrijfsysteem. Om deze reden werken assyriologen zoals Gordin en Monroe aan het vertalen van deze tabletten, zodat we meer te weten kunnen komen over de oorsprong die leidde tot onze huidige toestand van de wereld.

Maar zelfs met een AI-model is er nog werk aan de winkel om de last te verlichten. Zoals we echter pas in de afgelopen paar maanden sinds de release van ChatGPT hebben gezien, kan technologie razendsnel evolueren – en dat geldt vooral als het gaat om kunstmatige intelligentie.

Volgens Gordin kan het model worden geüpgraded en getraind met verschillende spijkerschriftperioden. Dit maakt het mogelijk om een ​​nog groter corpus Akkadisch te vertalen en nog meer inzicht te krijgen in deze oude culturen. Bovendien is het team van plan het model over te zetten naar de Babylonische Engine, zodat meer mensen er toegang toe hebben.

“We willen het toegankelijker maken voor mensen die niet noodzakelijkerwijs historici of assyriologen zijn,” zei Gordin. “Met dit model willen we het voor hen makkelijker maken om een ​​tekst in zich op te nemen en een vertaling te krijgen.”

Deze democratisering van onderzoek zou kunnen helpen om nog meer inzicht te krijgen in deze oude beschavingen en de manier van leven van hun mensen. Ondertussen helpt het trainen van neurale netwerken voor deze talen om ze te verfijnen en te trainen op manieren die niet per se mogelijk zouden zijn door de vertaling van “levende” talen. Op deze manier kan een heel, heel oude en uitgestorven taal ons nog steeds nieuwe dingen over het leven van vandaag leren.

“Er zijn verbazingwekkende dingen die we vinden in spijkerschrift,” zei Monroe. “Er zijn al deze dingen die ons nu echt raken en de overeenkomsten laten zien die we hebben met de oude mensen die zo ver weg zijn, niet alleen in taal maar ook in tijd.”

Lees meer bij The Daily Beast.

Heb je een tip? Stuur het hier naar The Daily Beast

Ontvang het grootste nieuws en schandalen van de Daily Beast rechtstreeks in je inbox. Doe nu mee.

Blijf verbonden en krijg onbeperkte toegang tot de ongeëvenaarde dekking van de Daily Beast. Abonneer nu

Leave a Reply

Your email address will not be published. Required fields are marked *