Forskare vid Stockholms universitet har utvecklat ett banbrytande AI-verktyg som dramatiskt kan förkorta tiden det tar att dechiffrera historiska krypterade texter. Det som tidigare kunde ta flera veckor av mödosamt arbete kan nu lösas på under en halvtimme.

Omkring en procent av alla historiska skrifter som bevaras i arkiv och bibliotek världen över är helt eller delvis krypterade. Dessa texter innehåller ofta information som saknas i den traditionella historieskrivningen, från diplomatiska förbindelser och hemliga sällskaps ritualer till romantiska relationer och medicinska recept. De äldsta kända chiffren går tillbaka till antikens Grekland och Rom.

Beáta Megyesi, datorlingvist vid Stockholms universitet, har tillsammans med sitt forskarteam arbetat med att lösa historiska chiffer i många år. Hon beskriver arbetet som detektivarbete där varje litet genombrott kan öppna dörrar till historiska insikter.

”En del av Vatikanens korrespondens skrevs i chiffer, och den ger en fascinerande inblick i både diplomati och vardagsliv vid Europas hov. Där kan vi läsa om allt från politiska överväganden till mer personliga observationer – vem som umgicks med vem, vilka relationer som väckte intresse och vilka äktenskap som ansågs möjliga”, säger Megyesi.

Ett av forskarteamets mest uppmärksammade genombrott var när de lyckades dechiffrera det så kallade Borgchiffret. Detta 408 sidor långa handskrivna manuskript från 1600-talet, som sannolikt härstammar från Nordtyskland eller Skandinavien, avkodades av Megyesi tillsammans med Nada Aldarrab och Kevin Knight. Manuskriptet består av 34 olika symboler – både grafiska tecken och latinska bokstäver kombinerade med diakritiska markeringar.

När innehållet i Borgchiffret till slut blev läsbart visade det sig innehålla hemliga recept och farmaceutisk kunskap för behandling av olika sjukdomar. Bland annat rekommenderades att dricka flera glas högkvalitativt vin eller jäsa muskotnöt i en deg för att lindra tarmbesvär. Men processen var långdragen och komplicerad – bara att identifiera alla symboler kunde ta flera dagar, och hela avkodningen tog flera veckor.

Arbetet med att dechiffrera historiska texter fick ytterligare fart 2011 efter att forskarna lyckats knäcka det så kallade Copialechiffret. Detta krypterade manuskript på 105 sidor från 1730-talet innehåller ungefär 75 000 tecken med latinska och grekiska bokstäver, diakritiska tecken och mystiska symboler. Manuskriptet härrör från ockulisterna, ett hemligt tyskt ordenssällskap vars syfte bland annat var att kartlägga frimurarnas hemliga ritualer.

Efter genomslaget med Copialechiffret översköljdes Megyesi av förfrågningar från hela världen. Privatpersoner, organisationer och bibliotek kontaktade henne och bad om hjälp med att lösa chiffer. Detta väckte tanken om att skapa ett verktyg som skulle kunna göra arbetet mer tillgängligt och effektivt.

Nu har forskarna byggt upp en omfattande databas med över 20 000 filer och utvecklat ett AI-baserat verktyg med en inbyggd chattbott. Verktyget är tränat på att identifiera tecken och alfabet, föreslå ord och meningar, och slutligen översätta dessa till moderna språk.

”Modellerna utvecklas för att identifiera tecknen och alfabet, och sen föreslå ord och meningar, och till sist översätta dessa”, förklarar Megyesi.

När AI-modellen testades på tidigare avkodade chiffer blev resultatet slående. Borgchiffret, som tog forskarteamet flera veckor att lösa manuellt, kunde dechiffreras på knappt en halvtimme med det nya verktyget. Den korrekta transkriberingen och översättningen producerades på bråkdelen av den ursprungliga tiden.

Trots de imponerande resultaten betonar Megyesi att AI-modellen inte är avsedd att ersätta mänsklig expertis. De historiska texterna är ofta skrivna på gamla språkvarianter eller på språk som inte längre används, vilket kräver specialiserad kunskap för att tolka korrekt.

”Vi har ju inte levande människor som kan tala om för oss om det är rätt eller fel”, konstaterar hon. ”Det kräver lingvistisk, filologisk, epigrafisk och historisk kompetens för att tolka de här skrifterna. Så det är inte tanken att vi ska ersätta expertis, utan tanken är att AI-modellerna ska stödja arbetet.”

Samtidigt som dagens algoritmer är effektiva för enklare koder, återstår betydande utmaningar när det gäller mer komplexa krypteringar. Olika typer av chiffer kräver olika strategier – från substitutionschiffer där tecken ersätts med andra symboler, till transpositionschiffer där bokstäver byter plats enligt särskilda mönster.

Megyesi får ofta frågan om vilket chiffer hon allra helst skulle vilja lösa, men för henne handlar arbetet om mer än bara slutresultatet.

”För mig handlar det inte bara om vad texten faktiskt innehåller. Det mest fascinerande är ofta själva processen, att följa spåren, förstå mönstren och till sist se hur koden öppnar sig”, säger hon.

Hennes långsiktiga vision sträcker sig bortom akademiska sammanhang. Hon drömmer om att göra denna typ av kunskap tillgänglig för en bredare publik genom användarvänlig teknik.

”Min dröm är att skapa ett verktyg som gör den här typen av kunskap tillgänglig för fler. Om man till exempel går förbi Knossos på Kreta, eller ser en okänd skrift på ett museum, ska man kunna ta en bild med mobilen och få hjälp att förstå vad det kan stå. Inte nödvändigtvis ett färdigt svar direkt, men ett förslag på tolkning – en möjlig väg in i texten”, säger hon.

Genom att avkoda historiska chiffer kan forskarna få ny kunskap om hur språk faktiskt användes i sin samtid och fylla luckor i vår förståelse av historien. Kombinationen av traditionell expertis och modern AI-teknologi öppnar upp nya möjligheter för att låsa upp hemligheterna i tusentals okända dokument som förvaras i arkiv världen över.

Dela.

18 kommentarer

Leave A Reply

Exit mobile version