[ Skip to the content ]

Institute of Formal and Applied Linguistics Wiki


[ Back to the navigation ]

Jan Hajič, Pavel Straňák
LINDAT-CLARIN: CESKY UZEL PANEVROPSKE INFRASTRUKTURY PRO VYZKUM

Prednaska predstavi projekt Lindat-Clarin, ktery ve spolupraci ctyr
prednich ceskych pracovist v oblasti zpracovani prirozeneho jazyka (UK,
ZCU, MU a UJC) pripravi a bude provozovat uzel infrastruktury pro jazykova
data, primarne pro projekt Clarin a sit META-NET. Uzel bude mit za ukol
vybudovat repozitar na velka jazykova data i jazykova data komplexne
anotovana, kompatibilni s evropskou infrastrukturni siti Clarin i
META-SHARE, ktera je soucasti site META-NET. V narodni casti projektu je
pak ukolem repozitar naplnit daty, ktera maji narodni prvek, tj. daty
ceskymi a paralelnimi, od surovych textu pres mluvene korpusy (vetne audia
a jeho prepisu) az po komplexne anotovane psane i mluvene korpusy.


[ Back to the navigation ] [ Back to the content ]