SPRAK - Språkteknologi - mänskliga språk och datorer
Introduktion
Språkteknologi är ett tvärvetenskapligt ämne som använder och skapar kunskaper inom främst datavetenskap och språkvetenskap, men även inom ämnen som pedagogik, statistik och matematik. Området utvecklas i rasande fart, och språkteknologi finns i alltfler IT-tjänster och -produkter som sökmotorer, översättningsprogram, intelligenta svarsagenter, språkanalys, ordbehandlare, textsammanfattning, dialogsystem, datorspel, medicinsk informatik (t.ex. informationsextraktion), datorstött lärande och forensisk lingvistik (t.ex. författaridentifiering).
Kommersiella tillämpningar som används av många i vardagen inkluderar exempelvis Google translate, Apples Siri och Språkverktygen i Word, och också andra exempel som IBM:s Watson (ett helt automatiskt fråga-svar-system) som i 2011 vann Jeopardy i USA.
Mål
Efter avklarad kurs skall studenten kunna
- använda grundläggande begrepp inom språkteknologi.
- analysera språkteknologiska verktygs roll och effekt i olika IT-system.
- på ett enkelt sätt förklara de språkteknologiska verktygens uppbyggnad.
- använda språkteknologiska moduler för systemkonstruktion och språkteknologiska experiment.
- utvärdera språkteknologiska program inom olika användningsområden.
Innehåll
Under denna delkurs behandlas språkteknologins möjligheter och begränsningar med fokus på de språkteknologiska verktyg som ligger nära forskningsfronten samt är relevanta för DSV:s kandidaters framtida arbete med t.ex. design och implementation av informationssystem. Delkursen ger kunskap om hur språkteknologi tillämpas i olika tjänster och produkter. Vidare täcks de nödvändiga teoretiska grunderna i språkvetenskap (lingvistik) som behövs för att använda, utveckla och utvärdera språkteknologiska verktyg.
Genomförande
Kursen varvar föreläsningar och labbar så att studenterna får tillämpa delar av kursinnehållet praktiskt. Alla labbar är baserade på fritt tillgängliga resurser. I kursen kommer även ett projektarbete ingå, där studenterna får i grupp arbeta på ett delområde i mer detalj.
I kursen kommer följande delområden tas upp:
- Morfologi och ordklasstaggning
- Syntax
- Stavningskontroll
- Språkstatistik
- Informationsåtkomst
- Semantik
- Utvärdering
- Textsummering
- Maskinöversättning
- Dialogsystem
- Datorstöd för språkinlärning
- Språkteknologin i industrin