Institutionen för lingvistik vid Stockholms universitet deltar i Swe-Clarin genom två av sina avdelningar: datorlingvistik och teckenspråk.
Avdelningen för datorlingvistik bedriver forskning om flerspråkig lingvistisk analys med tillämpningar som storskaliga typologiska jämförelser, transfer av annotering till resursfattiga språk och annotering av narrativ struktur i litterära texter på olika språk. Andra forskningsområden är modeller och infrastruktur för första- och andraspråksinlärning. Avdelningen har utvecklat ett flertal korpusar, däribland för koreferens, barnriktat tal och bloggar, samt verktyg, såsom ordklasstaggning, språkmodeller och länkning av parallellkorpusar (läs mer om våra resurser).
Avdelningen för teckenspråk bedriver forskning främst fokuserad på svenskt teckenspråk (STS). Centrala resurser för detta är STS-lexikonet med 18 000 tecken och STS-korpusen med 18 timmar video innehållande 146 000 annoterade teckenförekomster (per 31/12 2019). Annoteringen omfattar glossning, ordklasstaggning och översättning till svenska, men även arbete med syntakisk annotering pågår. Lexikonet har utvecklats vid avdelningen sedan 1988 och korpusen sedan 2003, och båda tillhör de största dylika resurserna för något teckenspråk (läs mer om våra resurser).
Stockholms universitet medverkar i det distribuerade K-centrumet Swedish in a Multilingual Setting (CLARIN-SMS), som erbjuder expertis i språkteknologisk bearbetning av text med fokus på svenska och/eller flerspråkighet, liksom teckenspråk.
Mats Wirén, mats.wiren@ling.su.se
Läs vår handbok
Vill du lära dig att använda språkteknologi i din forskning? I Swe-Clarins handbok finns systematiska instruktioner och belysande exempel på hur man besvarar olika forskningsfrågor med våra verktyg och material.