[ Skip to the content ]

Institute of Formal and Applied Linguistics Wiki


[ Back to the navigation ]

This is an old revision of the document!


Okruhy ke státním závěrečným zkouškám pro navazující magisterský program Informatika - Jazykové technologie a počítačová lingvistika

(pracovní materiál)

Státní závěrečná zkouška

Program Jazykové technologie a počítačová lingvistika má jeden společný povinný okruh pro obě zaměření, jeden povinný okruh dle zvoleného zaměření a jeden okruh si student vybírá z~volitelných okruhů. Jako tento poslední okruh si student může zvolit také povinný okruh druhého zaměření tohoto programu. Celkem tedy každý student dostane tři otázky.

Okruh 1 Základy počítačového zpracování přirozeného jazyka – povinný pro obě zaměření
Okruh 2 Lingvistické teorie a formalismy – povinný pro zaměření Počítačová a formální lingvistika
Okruh 3 Statistické metody a strojové učení v počítačové lingvistice – povinný pro zaměření Statistické metody a metody strojového učení pro zpracování jazyka
Okruh 4 Zpracování řeči, dialogové systémy a multimodální systémy – volitelný
Okruh 5 Aplikace metod zpracování přirozeného jazyka – volitelný

Okruh 1: Základy počítačového zpracování přirozeného jazyka // Fundamentals of natural language processing

Témata / Topics:

Doporučené předměty / Recommended courses:

Okruh 2: Lingvistické teorie a formalismy // Linguistic theories and formalisms

Témata / Topics:
Funkční generativní popis (rovinný přístup, forma a funkce, valence, tfa).
Pražský závislostní korpus (charakteristika rovin, lexikální, morfologická a syntaktická informace).
Universal Dependencies (základní charakteristika, dependencies vs. enhanced dependencies).
Další gramatické formalismy - přehled a základní charakteristika (Government and Binding, HPSG (unifikační gramatika, struktury rysů), Lexical Functional Grammar (LFG), kategoriální gramatiky, (Lexical) Tree Adjoining Grammar ((L)TAG), Meaning-Text Theory (roviny, lexikální funkce), Case Grammar a Frame Semantics, konstrukční gramatiky).
Fonetika, fonologie.
Komputační morfologie.
Povrchová a hloubková stavba věty; valence (složkové stromy, závislostní stromy; koordinace, neprojektivita; hloubková syntax, valence; elipsa).
Počítačová lexikografie (????????).
Aktuální členění věty; informační struktura, diskurz.
Koreference (gramatická vs. textová koreference).
Typologie jazyků (genetická a areálová klasifikace jazyků, strukturně-lingvistická typologie jazyků).
Formální gramatiky a jejich využití v pravidlové morfologii (konečné automaty pro morfologickou analýzu).
Parsing (přechodové parsery, grafové parsery).

Doporučené předměty / Recommended courses:

Okruh 3: Statistické metody a strojové učení v počítačové lingvistice // Statistical methods and machine learning in computational linguistics

Témata / Topics:
Generativní a diskriminativní modely.
Metody řízeného učení pro klasifikaci a regresi (lineární modely, ostatní metody: naive Bayes, rozhodovací stromy, učení založené na příkladech [KNN, lokálně vážená regrese], SVM a kernely, logistická regrese).
Metody neřízeného učení [clustering, EM].
Jazykové modely a modely kanálu.
Vyhlazování modelů, kombinace modelů [backoff, interpolace].
HMM, trellis, Viterbi, Baum-Welch.
Algoritmy pro statistický tagging.
Algoritmy pro složkový a závislostní statistický parsing.
Strojové učení s využitím neuronových sítí.
Konvoluční a rekurentní sítě. Slovní embeddingy.

Doporučené předměty / Recommended courses:

Okruh 4: Zpracování řeči, dialogové systémy a multimodální systémy //Speech, dialogue and multimodal systems

Témata / Topics:

Doporučené předměty / Recommended courses:

Okruh 5: Aplikace metod zpracování přirozeného jazyka //Applications in natural language processing

Témata / Topics:

Doporučené předměty / Recommended courses:


[ Back to the navigation ] [ Back to the content ]