Kan computere lære at forstå menneskesprog?

På trods af store fremskridt inden for machine learning, er det stadig en stor udfordring at få computere til at forstå sprog. Daniel Varab og hans to specialemakkere på Softwareudvikling lærte et computerprogram at finde modsigelser i tekster – en teknologi, som måske på sigt kan hjælpe os med at holde styr på politikernes udtalelser og selvmodsigelser i loven.

Institut for Datalogi Uddannelse algoritmer kunstig intelligens ITU speciale

Skrevet 13. december 2017 08:21 af Vibeke Arildsen

Hvad handlede jeres speciale om?

Inspireret af præsidentvalget i USA tænkte vi, at kunne være sjovt, hvis et computerprogram automatisk kunne finde selvmodsigelser i de ting, politikerne siger i valgkampen. Fx udtalte Donald Trump i 1999:

“Look, I’m very pro-choice. I hate the concept of abortion. I hate it. I hate everything it stands for. I cringe when I listen to people debating the subject, but you still—I just believe in choice.”

I august 2015 sagde han derimod: “I am very, very proud to say that I’m pro-life.”

Sådan nogle eksempler kunne det være fedt at få computeren til at hjælpe med at finde.

Derfor kastede vi os over Natural Language Processing (sprogteknologi på dansk), et felt, der hedder som handler om at få computere til at forstå det menneskelige sprog. Sprogteknologi kender vi for eksempel fra Siri på iPhonen, Google Translate og stavekontrollen i Word. Det bliver også brugt til at analysere, om tekster er positivt eller negativt ladede.

Mere præcist arbejdede vi med contradiction detection, det vil sige en metode til at få computere til at vurdere, om to sætninger modsiger hinanden.

Hvordan lærer man en computer finde modsigelser?

Det gør man ved at fodre den med en hel masse eksempler på sætningspar, der modsiger hinanden, og sætningspar, der ikke gør. Vi trænede en machine learning-algoritme med et datasæt fra Stanford University med 500.000 sætningspar og testede den derefter på sætninger, den aldrig havde set før.

Vi fandt ud af, at modellen klarede sig bedst, når vi gav den information om, hvordan lingvister definerer en modsigelse. Fx at to sætninger sandsynligvis modsiger hinanden, hvis de indeholder antonymer. Der er stor hype om, at machine learning-algoritmer selv bare finder mønstre i information, men i praksis kommer man meget længere, hvis man hjælper dem på vej.

I sidste ende kunne vores model med 86 procents nøjagtighed vurdere, om to sætninger modsagde hinanden. Sjovt nok kunne kun 87 procent af en kontrolgruppe af mennesker blive enige om de samme sætninger.

Sprog handler i høj grad om fortolkning, og det er en af årsagerne til, at det er så svært at lære computere at forstå det.
Daniel Varab, cand. IT. i Softwareudvikling

Sprog handler i høj grad om fortolkning, og det er en af årsagerne til, at det er så svært at lære computere at forstå det.

Hvad kan vi bruge det til?

Der er en enorm mængde information derude, og det er umuligt for mennesker at have et overblik over alt, hvad der bliver sagt og skrevet af fx medier og politikere.

Det ville være nyttigt at have et redskab, som automatisk kunne finde modsigelser fx mellem hvad en politiker sagde for to måneder siden, og hvad han siger i dag. Et sådant værktøj kunne måske også bruges til at opdage selvmodsigelser i lovtekster eller spotte fake news.

Der er mange spændende perspektiver, men der er stadig et stykke vej igen, før computernes sprogforståelse er veludviklet nok.

Mere information

Vibeke Arildsen, presserådgiver, telefon 2555 0447, email viar@itu.dk

Nyheder

Er Danmark klar til cyberkrig?

8. april 2025

En gruppe forskere fra IT-Universitetet i København undersøger, hvad Danmark kan lære af Ukraine i forhold til at forberede sig på cyberkrigsførelse. Cyberkrigsførelse påvirker ikke kun regeringer og virksomheder, men også civile, og forskerne spørger, hvad der skal gøre, hvis vi bliver angreb

Forskere vil lære matematikelever kritisk tænkning med data science

31. marts 2025

I et nyt forskningsprojekt på IT-Universitetet og Københavns Universitet vil en gruppe forskere undersøge, hvordan data science kan blive en del af gymnasiets matematikundervisning for at give eleverne et bedre grundlag for kritisk tænkning og mulighed for at belyse og nuancere påstande de møder i deres hverdag.

Ny bog er en guide til succesfuld AI-implementering

28. marts 2025

Kunstig intelligens har stort potentiale i organisationer, men hvordan realiserer man det i praksis? Lektor og underviser på ITU’s Master i IT-ledelse, Carsten Lund Pedersen, er medforfatter til bogen ”Gunstig Intelligens,” der som den første af sin slags udstikker en kurs mod succes med AI-projekter i organisationen. Bogen kan forudbestilles nu.

ITU forsker sikrer bevilling til sikkerhedsoptimering af AI-systemer

19. marts 2025

Lektor Alessandro Bruni fra IT-Universitetet i København er i øjeblikket på Advanced Institute of Science and Technology i Japan, hvor han samarbejder med andre forskere om at udforske det matematiske fundament for verificering af maskinlæringssystemer. Projektet er støttet af Carlsbergfondet.

Professorportræt: Vasilis Galis fandt sin forskningsvej i Athens metro

13. marts 2025

Den 28. marts 2025 kl. 14.30 holder professor Vasilis Galis fra sektionen Technologies in Practice sin tiltrædelsesforelæsning i Auditorium 0 på IT-Universitetet i København. Forelæsningen har titlen: ”Research against dead time”.

ITU-forsker undersøger valg i Grønland

11. marts 2025

Den 11. marts 2025 er der valg til Inatsisartut (Grønlands parlament). I flere år har forskere fra ITU ledet af professor Carsten Schürmann og Center for Information Security and Trust undersøgt valg og muligheden for internetvalg i netop Grønland og valget i dag er ingen undtagelse.

DFF-støttet ITU-projekt skal udvikle teoretisk fundament for probabilistiske sessionstyper

6. marts 2025

Stigende teknologisk kompleksitet kræver en probabilitisk tilgang til kritisk vigtige it-systemer. Et nyt forskningsprojekt, anført af lektor på ITU Marco Carbone, vil skabe fundamentet for probabilistiske sessionstyper.

Urbane motorveje er barrierer for sociale forbindelser

5. marts 2025

Forskere fra IT-Universitetet i København har bevist, at urbane motorveje begrænser sociale relationer i de 50 største byer i USA. Det er det første kvantitative studie af barriereeffekten af urbane motorveje i reduktionen af sociale relationer på tværs af nabolag.

Ny forskning skal finde effektive strategier til epidemiforebyggelse

26. februar 2025

Adjunkt på ITU Jonas Juul modtager Novo Nordisk Fondens Data Science Investigator-bevilling på knap 6,5 mio. kr. til et projekt, der bl.a. skal forbedre statistiske metoder til at forudsige smitteudbrud.

Within Limits – en kunstinstallation om beregningskraft og ressourcebegrænsning

24. februar 2025

Den 7. marts inviterer kunstner Jacob Remin sammen med lektor James Maguire og postdoc Frauke Mennes fra Center for Klima-IT på ITU til åbningen af Within Limits – en kunstinstallation, der stiller spørgsmålstegn ved beregningskraft og ressourcegegrænsning.

ITU-studerende og -alumner vinder priser ved Copenhagen Gaming Week

21. februar 2025

ITU var repræsenteret med spil udviklet af både studerende og alumner fra universitetet ved Copenhagen Gaming Week og 'Spilprisen', som fandt sted i sidste uge. Studerende fra MSc Games vandt prisen for 'Best Student Game', mens alumner fra samme studieprogram vandt for 'Best Debut'.

Video: Kan kunst hjælpe os til at forstå AI?

13. februar 2025

Kunster og ekstern lektor på ITU, Mogens Jacobsen, arbejder med at lave digital kunst og bl.a. har skabt værker, der afslører iboende bias i de datasæt, som kunstig intelligens er trænet på.

Nyt forskningsprojekt vil finde mere inkluderende metoder til at udvikle algoritmer

10. februar 2025

Lektor Veronika Cheplygina har modtaget en ”Novo Nordisk Data Science Investigator”-bevilling på knap 11 mio. kr. Bevillingen kommer til at finansiere forskning i, hvordan mere inkluderende undervisnings- og forskningsmiljøer kan lede til bedre algoritmer for medicinsk billeddannelse.

Speciale om digital kløft i fængslerne vinder pris

31. januar 2025

Tre studerende fra ITU har vundet Institut for Menneskerettigheders Specialepris for deres speciale ”Fængslets digitale kløft”. I specialet undersøges det, hvordan den digitale kløft mellem indsatte i danske fængsler, og det omgivende samfund kan udbedres.

Ny forskning fra ITU analyserer angreb på store sprogmodeller

16. januar 2025

Hvad motiverer nogle til at manipulere med store sprogmodeller, og hvordan bærer de sig ad? I et nyt studie definerer forskere fra ITU såkaldt ”red teaming” af sprogmodeller for at øge sikkerheden i teknologien.

Jakob Grue Simonsen bliver ny prorektor på IT-Universitetet i København

22. november 2024

Jakob Grue Simonsen, der kommer fra en stilling som institutleder på Datalogisk Institut, Københavns Universitet, har fokus på trivsel og samarbejde, når han tiltræder som prorektor på ITU d. 1.januar 2025.

Ny bog sætter fokus på digital stress på arbejdspladsen

21. november 2024

Interview: Tidligere ph.d.-studerende på IT-Universitetet, Raluca Stana, har sammen med sin daværende vejleder, lektor Hanne Westh Nicolajsen, skrevet en bog, som skal hjælpe virksomheder med at håndtere teknostress.

IT-Universitetet i København præsenterer to nye medlemmer af ledelsen

18. november 2024

På IT-Universitetet i København bliver kommende uddannelseschef, Luís Cruz-Filipe (tv.), og kommende forskningschef, Morten Hjelholt (th.), del af universitetsledelsen, når de tiltræder deres respektive stillinger hhv. 1. februar og 1. januar, 2025.

Video: Er kunstig intelligens nøglen til menneskets bevidsthed?

7. november 2024

"Vores fremtid kommer til at ligne science fiction." Lektor ved IT-Universitetet i København, Paolo Burelli, bruger kunstig intelligens til at nærme sig en bedre forståelse af hjernen og den menneskelige bevidsthed.

Sundhedsapp til ukrainske patienter vinder specialepris

5. november 2024

Tre studerende fra IT-Universitetet i København vinder årets IT Specialepris for en mobil app, som kan oversætte i realtid mellem dansk og ukrainsk i en hospitalskontekst.