This is an old revision of the document!
Table of Contents
Okruhy ke státním závěrečným zkouškám pro navazující magisterský program Informatika - Jazykové technologie a počítačová lingvistika
(pracovní materiál)
Státní závěrečná zkouška
Program Jazykové technologie a počítačová lingvistika má jeden společný povinný okruh pro obě zaměření, jeden povinný okruh dle zvoleného zaměření a jeden okruh si student vybírá z~volitelných okruhů. Jako tento poslední okruh si student může zvolit také povinný okruh druhého zaměření tohoto programu. Celkem tedy každý student dostane tři otázky.
Okruh 1 Základy počítačového zpracování přirozeného jazyka – povinný pro obě zaměření
Okruh 2 Lingvistické teorie a formalismy – povinný pro zaměření Počítačová a formální lingvistika
Okruh 3 Statistické metody a strojové učení v počítačové lingvistice – povinný pro zaměření Statistické metody a metody strojového učení pro zpracování jazyka
Okruh 4 Zpracování řeči, dialogové systémy a multimodální systémy – volitelný
Okruh 5 Aplikace metod zpracování přirozeného jazyka – volitelný
Okruh 1
Základy počítačového zpracování přirozeného jazyka // Fundamentals of natural language processing
Témata / Topics:
Doporučené předměty / Recommended courses:
- NPFL063 Úvod do obecné lingvistiky
- NPFL067 Statistické metody zpracování přirozených jazyků I
- NPFL068 Statistické metody zpracování přirozených jazyků II
- NPFL104 Metody strojového učení
Okruh 2: Lingvistické teorie a formalismy // Linguistic theories and formalisms
Témata / Topics:
Funkční generativní popis (rovinný přístup, forma a funkce, valence, tfa).
Pražský závislostní korpus (charakteristika rovin, lexikální, morfologická a syntaktická informace).
Universal Dependencies (základní charakteristika, dependencies vs. enhanced dependencies).
Další gramatické formalismy - přehled a základní charakteristika (Government and Binding, HPSG (unifikační gramatika, struktury rysů), Lexical Functional Grammar (LFG), kategoriální gramatiky, (Lexical) Tree Adjoining Grammar ((L)TAG), Meaning-Text Theory (roviny, lexikální funkce), Case Grammar a Frame Semantics, konstrukční gramatiky).
Fonetika, fonologie.
Komputační morfologie.
Povrchová a hloubková stavba věty; valence (složkové stromy, závislostní stromy; koordinace, neprojektivita; hloubková syntax, valence; elipsa).
Počítačová lexikografie (????????).
Aktuální členění věty; informační struktura, diskurz.
Koreference (gramatická vs. textová koreference).
Typologie jazyků (genetická a areálová klasifikace jazyků, strukturně-lingvistická typologie jazyků).
Formální gramatiky a jejich využití v pravidlové morfologii (konečné automaty pro morfologickou analýzu).
Parsing (přechodové parsery, grafové parsery).
Doporučené předměty / Recommended courses:
- NPFL063 Úvod do obecné lingvistiky
- NPFL006 Úvod do formální lingvistiky
- NPFL075 Závislostní gramatiky a korpusy
- NPFL083 Lingvistická teorie a gramatické formalismy
- NPFL094 Morfologická a syntaktická analýza
Okruh 3: Statistické metody a strojové učení v počítačové lingvistice // Statistical methods and machine learning in computational linguistics
Témata / Topics:
Generativní a diskriminativní modely.
Metody řízeného učení pro klasifikaci a regresi (lineární modely, ostatní metody: naive Bayes, rozhodovací stromy, učení založené na příkladech [KNN, lokálně vážená regrese], SVM a kernely, logistická regrese).
Metody neřízeného učení [clustering, EM].
Jazykové modely a modely kanálu.
Vyhlazování modelů, kombinace modelů [backoff, interpolace].
HMM, trellis, Viterbi, Baum-Welch.
Algoritmy pro statistický tagging.
Algoritmy pro složkový a závislostní statistický parsing.
Strojové učení s využitím neuronových sítí.
Konvoluční a rekurentní sítě. Slovní embeddingy.
Doporučené předměty / Recommended courses:
- NPFL067 Statistické metody zpracování přirozených jazyků I
- NPFL114 Hluboké učení
- NPFL068 Statistické metody zpracování přirozených jazyků II
- NPFL104 Metody strojového učení
Okruh 4: Zpracování řeči, dialogové systémy a multimodální systémy //Speech, dialogue and multimodal systems
Témata / Topics:
Doporučené předměty / Recommended courses:
- NPFL038 Základy rozpoznávání a generování mluvené řeči
- NPFL079 Algoritmy rozpoznávání mluvené řeči
- NPFL099 Statistické dialogové systémy
Okruh 5: Aplikace metod zpracování přirozeného jazyka //Applications in natural language processing
Témata / Topics:
Doporučené předměty / Recommended courses:
- NPFL087 Statistický strojový překlad
- NPFL093 Aplikace NLP
- NPFL103 Vyhledávání informací