Professorportræt: Barbara Plank vil åbne NLP-feltet for sproglig mangfoldighed
Barbara Plank er nyudnævnt professor i datalogi ved IT-Universitetet i København og arbejder med at gøre Natural Language Processing mere åben og inkluderende over for mindre sprogområder. Hun holder indtrædelsesforelæsning i auditorium 3 på ITU d. 2. september.
Barbara PlankInstitut for Datalogialgoritmer
Skrevet 24. august 2021 06:57 af Theis Duelund Jensen
Barbara Plank, som tidligere har været del af det prestigiøse Sapere Aude-forskningslederprogram, kombinerer sin lidenskab for teknologi og sprog i sit arbejde inden for det voksende Natural Language Processing-felt. Under sine studier i datalogi ved Freie Universität Bozen i Sydtyrol tog hun et kursus i datalingvistik, der skulle vise sig at være en åbenbarende oplevelse: ”Jeg indså, hvor komplekst og fascinerende det er at bygge sprogmodeller. Det er et spændende problem, som jeg i mit arbejde med at lave sprogalgoritmer har beskæftiget mig med lige siden,” siger Barbara Plank, der sammen med sine kolleger for nylig vandt en demo track-pris for en forskningsartikel om multitask learning med NLP ved EACL 2021-konferencen.
I de senere år er NLP vokset som forskningsfelt, fordi teknologiens anvendelsesmuligheder er eksploderet i omfang. ”NLP spiller en stor rolle i dagens samfund. Det er ikke bare et felt for teoretisk videnskab, det anvendes både i det private såvel som det offentlige,” siger Barbara Plank. Ifølge professoren har deep learning – indarbejdelse af neurale netværk i kunstig intelligens, så systemer bliver i stand til at lære – revolutioneret forskning på området og udbredt NLP på helt nye måder:
”For år tilbage arbejdede man med en meget regelbaseret tilgang til NLP,” siger Barbara Plank. ”Men inden for de sidste år har vi været vidner til en voldsom udvikling, der har ført til den teknologi-tsunami, vi ser i dag”. De fleste bruger i dag NLP i et eller andet omfang – digitale assistenter, oversættelsestjenester, og apps, der tilbyder stavekontrol af e-mails og beskeder, bygger alle på teknologien.
Sprogundervisning for maskiner
På IT-Universitetet, hvor Barbara Plank blev ansat som lektor i 2018, er hun i sit arbejde fokuseret på at bygge deep learning-systemer til maskinlæring og forskellige typer kunstig intelligens. En af de ting, der i sin tid gjorde hende interesseret i feltet, er den brede vifte af anvendelsesmuligheder:
”Natural Language Processing kan tilgås fra mange vinkler – fra computervidenskab til kognitiv videnskab – men det, der altid har fascineret mig, er det lingvistiske perspektiv; det faktum, at man kan studere sprog fra et computervidenskabeligt perspektiv og udvikle teknologi, der kommer folk til gavn lige meget, hvilket sprog de taler”.
Kvaliteten af den sprogbaserede teknologi svinger dog kraftigt alt efter, hvad for et sprog man taler, og når man når ned på dialektbasis, venter det teknologiske gennembrud fortsat. Der er et stort behov for bedre modeller for mindre sprogområder, noget Barbara Plank også er bevidst om i kraft af, at hun selv kommer fra en tysktalende minoritetsgruppe med eget dialekt i Sydtyrol.
I 2019 blev hun Sapere Aude-forskningsleder baseret på et projekt, der netop havde til formål at åbne NLP-teknologi for bredere anvendelse. ”Tag for eksempel kundeservicesystemer,” siger Barbara Plank. ”De fungerer ganske godt på engelsk, tysk og kinesisk – de store sprogområder – men når det kommer til dansk, svensk eller islandsk, så findes der meget lidt understøttelse. Det er vigtigt at udvikle teknologier så flere kan få gavn af NLP.”
Mennesket i centrum
I sidste ende er målet at bruge deep learning-teknologi til at forbedre maskinernes evne til at lære sprog. Det indebærer bl.a. at gøre kunstig intelligens bedre til at tilpasse sig såkaldte datashifts: måden hvorpå sproget ”skifter” karakterer, hvis man fx går fra at tale på et sprog til at tale på et andet, eller hvis man går fra formel til uformel tale, osv.
”I det lange løb har vi brug for at gøre NLP mere centreret omkring mennesker. Det er en teknologi, der kan hjælpe os på mange områder. Alle skal have mulighed for at drage nytte af den.”
Den 2. september giver Professor Barbara Plank sin tiltrædelsesforelæsning, ”NLP for everyone”, kl. 15:15 efterfulgt af en reception kl. 16:15.
Theis Duelund Jensen, presseansvarlig, +45 25 55 04 47, thej@itu.dk