Mia byggede en kunstig hjerne, der kan skelne mellem en slørugle og en stork
Som fritids-ornitolog ønskede Mia Pontoppidan sig et værktøj til at bestemme fuglearter. I sit speciale fra softwareudvikling på ITU besluttede hun derfor at undersøge, om kunstig intelligens kan bruges til at klassificere en række danske fugle – og om det overhovedet kan lade sig gøre at bygge et neuralt netværk med kun halvandet års kodeerfaring.
Institut for DatalogiUddannelsekunstig intelligensITU speciale
Skrevet 2. november 2017 09:31 af Vibeke Arildsen
Hvordan kom du på at skrive om klassificering af fugle?
Som fritids-ornitolog ved jeg, at det nogle gange kan være rigtig svært at bestemme arterne ud fra billeder i en bog. For eksempel kan måger blive helt op til 25-30 år gamle, og de går igennem adskillige fjerdragter igennem livet, som kan se meget forskellige ud.
Så jeg syntes, det kunne være sjovt at se på, om teknologien inden for kunstig intelligens, mere specifikt deep learning, er kommet så langt, at man kan bruge den til at klassificere billeder af forskellige danske fuglearter.
Jeg syntes, det kunne være sjovt at se på, om teknologien inden for kunstig intelligens, mere specifikt deep learning, er kommet så langt, at man kan bruge den til at klassificere billeder af forskellige danske fuglearter.
Jeg byggede et Convolutional Neural Network (CNN), som er et neuralt netværk der bruges til billedgenkendelse. Man kalder det et neuralt netværk, fordi det egentlig er en matematisk modellering af den visuelle cortex i hjernen.
Hvordan greb du projektet an?
Først sammensatte jeg mit eget datasæt med hundredvis af billeder af fem forskellige danske fuglearter. Målet var at træne et neuralt netværk til at genkende og korrekt klassificere disse arter.
Jo flere billeder, man træner sit neurale netværk på, jo bedre bliver det til at klassificere, så jeg trænede mit netværk på forskellige datasæt for at se, hvilken metode der gav den største nøjagtighed.
Jeg fik det bedste resultat, da jeg havde trænet netværket på ImageNet, som er et åbent datasæt med over en million billeder af alt fra huse og biler til billeder af fugle og andre dyr. Ved at finde mønstre i den enorme mængde billeddata, lærte netværket at identificere, om der overhovedet var en fugl på billedet, eller om det eksempelvis var en kat eller et hus.
Derefter trænede jeg den sidste del af netværket på mit datasæt med danske fugle. I sidste ende kunne det klassificere fuglearterne med en nøjagtighed på over 72 procent, hvilket er rigtig godt, når datasættet ikke er større.
Hvad lærte du undervejs?
Min bachelor var inden for erhvervsøkonomi og kommunikation, så jeg havde kun halvandet års kodeerfaring fra mit studie på softwareudvikling, inden jeg gik i gang med specialet, og jeg kendte ikke noget til neurale netværk i forvejen.
Derfor bestod en stor del af arbejdet i at forstå den bagvedliggende teori og at lære at bygge netværket. Jeg lærte også en masse om, hvordan intelligens fungerer – både kunstig og biologisk.
Det var super spændende og motiverende at bruge teknologien til at løse et hverdagsproblem.
For mig handlede specialet også om at finde ud af, hvor tilgængelig teknologien egentlig er – hvor godt jeg kunne få netværket til at artsbestemme fuglene med en begrænset teknisk forhåndsviden og med kun en bærbar computer at arbejde på. Det var udfordrende, men også sjovt at se, at man faktisk kan komme ret langt på kort tid. Jeg lærte virkelig meget af projektet, og det var super spændende og motiverende at bruge teknologien til at løse et hverdagsproblem.
Vil vi snart kunne downloade en app, der kan klassificere fuglearter ved hjælp af billeder?
Jeg kan sagtens forestille mig, at det vil kunne lade sig gøre at lave en sådan app inden så længe. Vi er endnu ikke så langt, at neurale netværk for eksempel med sikkerhed kan skelne forskellige mågearter, som selv for mennesker kan være svære at skelne fra hinanden. Men det er helt sikkert der, vi er på vej hen.
Der er blandt andet forskere på Cornell University i USA, der arbejder med billedklassificering af fuglearter, og de har selvfølgelig langt flere ressourcer og computerkraft til rådighed, end jeg havde.
Hvad arbejder du med i dag?
Jeg arbejder som teknologikonsulent hos Accenture hvor jeg rådgiver virksomheder, og kan anvende kombinationen af teknisk it-forståelse, som jeg har fået på ITU, og forretningsforståelse og kommunikation, som jeg har fra min bachelor.
Vibeke Arildsen, presserådgiver, telefon 2555 0447, email viar@itu.dk