This is an old revision of the document!
Okruhy ke státním závěrečným zkouškám pro navazující magisterský program Informatika - Jazykové technologie a počítačová lingvistika
(pracovní materiál)
Státní závěrečná zkouška
Program Jazykové technologie a počítačová lingvistika má jeden společný povinný okruh pro obě zaměření, jeden povinný okruh dle zvoleného zaměření a jeden okruh si student vybírá z~volitelných okruhů. Jako tento poslední okruh si student může zvolit také povinný okruh druhého zaměření tohoto programu. Celkem tedy každý student dostane tři otázky.
Okruh 1 Základy počítačového zpracování přirozeného jazyka – povinný pro obě zaměření
Okruh 2 Lingvistické teorie a formalismy – povinný pro zaměření Počítačová a formální lingvistika
Okruh 3 Statistické metody a strojové učení v počítačové lingvistice – povinný pro zaměření Statistické metody a metody strojového učení pro zpracování jazyka
Okruh 4 Zpracování řeči, dialogové systémy a multimodální systémy – volitelný
Okruh 5 Aplikace metod zpracování přirozeného jazyka – volitelný
Okruh 1: Základy počítačového zpracování přirozeného jazyka // Fundamentals of natural language processing
Témata / Topics:
Doporučené předměty / Recommended courses:
- NPFL063 Úvod do obecné lingvistiky
- NPFL067 Statistické metody zpracování přirozených jazyků I
- NPFL068 Statistické metody zpracování přirozených jazyků II
- NPFL104 Metody strojového učení
Okruh 2: Lingvistické teorie a formalismy // Linguistic theories and formalisms
Témata / Topics:
Funkční generativní popis (rovinný přístup, forma a funkce, valence, tfa).
Pražský závislostní korpus (charakteristika rovin, lexikální, morfologická a syntaktická informace).
Universal Dependencies (základní charakteristika, dependencies vs. enhanced dependencies).
Další gramatické formalismy (přehledově) (Government and Binding, HPSG (unifikační gramatika, struktury rysů), Lexical Functional Grammar (LFG), kategoriální gramatiky, (Lexical) Tree Adjoining Grammar ((L)TAG), MTT, Case Grammar a Frame Semantics, konstrukční gramatiky).
Fonetika, fonologie (????????).
Komputační morfologie (????????).
Syntax (složkové stromy, závislostní stromy; koordinace, neprojektivita; hloubková syntax, valence; elipsa).
Počítačová lexikografie (????????).
Aktuální členění věty; informační struktura, diskurz (????????).
Koreference (????????).
Typologie jazyků (????????).
Formální gramatiky a jejich využití v pravidlové morfologii (konečné automaty pro morfologickou analýzu).
Parsing (přechodové parsery, grafové parsery).
Doporučené předměty / Recommended courses:
- NPFL063 Úvod do obecné lingvistiky
- NPFL006 Úvod do formální lingvistiky
- NPFL075 Závislostní gramatiky a korpusy
- NPFL083 Lingvistická teorie a gramatické formalismy
- NPFL094 Morfologická a syntaktická analýza
Okruh 3: Statistické metody a strojové učení v počítačové lingvistice // Statistical methods and machine learning in computational linguistics
Témata / Topics:
detaily druhého stupně v hranaticích:
Generativní a diskriminativní modely. Metody řízeného učení pro klasifikaci a regresi (lineární modely, ostatní metody: naive Bayes, rozhodovací stromy, učení založené na příkladech [KNN, lokálně vážená regrese], SVM a kernely, logistická regrese). Metody neřízeného učení [clustering, EM]. Jazykové modely a modely kanálu. Vyhlazování modelů, kombinace modelů [backoff, interpolace]. HMM, trellis, Viterbi, Baum-Welch. Algoritmy pro statistický tagging. Algoritmy pro složkový a závislostní statistický parsing. Strojové učení s využitím neuronových sítí. Konvoluční a rekurentní sítě. Slovní embeddingy.
Doporučené předměty / Recommended courses:
- NPFL067 Statistické metody zpracování přirozených jazyků I
- NPFL114 Hluboké učení
- NPFL068 Statistické metody zpracování přirozených jazyků II
- NPFL104 Metody strojového učení
Okruh 4: Zpracování řeči, dialogové systémy a multimodální systémy //Speech, dialogue and multimodal systems
Témata / Topics:
Doporučené předměty / Recommended courses:
- NPFL038 Základy rozpoznávání a generování mluvené řeči
- NPFL079 Algoritmy rozpoznávání mluvené řeči
- NPFL099 Statistické dialogové systémy
Okruh 5: Aplikace metod zpracování přirozeného jazyka //Applications in natural language processing
Témata / Topics:
Doporučené předměty / Recommended courses:
- NPFL087 Statistický strojový překlad
- NPFL093 Aplikace NLP
- NPFL103 Vyhledávání informací
[ Back to the navigation ] [ Back to the content ]