[ Skip to the content ]

Institute of Formal and Applied Linguistics Wiki


[ Back to the navigation ]

Differences

This shows you the differences between two versions of the page.

Link to this comparison view

Both sides previous revision Previous revision
Next revision
Previous revision
Last revision Both sides next revision
user:zeman:ukoly:pc-kimmo [2008/10/21 18:03]
zeman Skripty.
user:zeman:ukoly:pc-kimmo [2011/10/14 09:09]
zeman ltag
Line 18: Line 18:
 ===== Data ===== ===== Data =====
  
-Pro přístup k datům je potřeba souhlasit s licenční smlouvou a odeslat registraci na http://ufal.mff.cuni.cz/corp-lic/pdt20-reg.html; do kolonky //Optional information// vyplňte "PFL007". O registraci bych se měl dozvědět a poslat vám odkaz na data.+Pro přístup k datům je potřeba souhlasit s licenční smlouvou a odeslat registraci na http://ufal.mff.cuni.cz/corp-lic/pdt20-reg.html; do kolonky //Optional information// vyplňte "NPFL007.ltag". O registraci bych se měl dozvědět a poslat vám odkaz na data.
  
 V datech je ke každému slovu trojice informací, oddělených lomítky (jednotlivé trojice jsou pak oddělené mezerami): V datech je ke každému slovu trojice informací, oddělených lomítky (jednotlivé trojice jsou pak oddělené mezerami):
   * slovní tvar   * slovní tvar
   * lemma (hlavní tvar, slovníkové heslo)   * lemma (hlavní tvar, slovníkové heslo)
-  * značka (zakódovaná informace o slovním druhu a mluvnických kategoriích)+  * morfologická značka (zakódovaná informace o slovním druhu a mluvnických kategoriích) 
 +V případě, že lomítko bylo součástí textu, je nahrazeno entitou "&slash;"; kvůli tomu je také znak "&" nahrazen entitou "&".
  
-Jestliže je vaším úkolem např. napsat morfologii sloves, potřebujete z dat vytáhnout všechna slovesa. Hledáte tedy trojice, ve kterých značka začíná písmenem V. (Dokumentaci ke značkám na požádání dodám celou.) Od každého slovesa vás zajímá jeho lemma - to je heslo, které budete chtít vložit do svého morfologického slovníku. Slovní tvar by vás mohl zajímat také, protože vám pomůže odhadnout časovací třídu, do které sloveso patří (třídu totiž ze značky nezjistíte).+Vysvětlivky k morfologickým značkám najdete např. na adrese http://ufal.mff.cuni.cz/pdt2.0/doc/manuals/en/m-layer/html/ch02s02s01.html, popř. též na http://quest.ms.mff.cuni.cz/cgi-bin/interset/index.pl?tagset=cs::pdt a http://quest.ms.mff.cuni.cz/cgi-bin/tagzplorer/index.pl?corpus=conll-2007-cs. 
 + 
 +Jestliže je vaším úkolem např. napsat morfologii sloves, potřebujete z dat vytáhnout všechna slovesa. Hledáte tedy trojice, ve kterých značka začíná písmenem V. Od každého slovesa vás zajímá jeho lemma - to je heslo, které budete chtít vložit do svého morfologického slovníku. Slovní tvar by vás mohl zajímat také, protože vám pomůže odhadnout časovací třídu, do které sloveso patří (třídu totiž ze značky nezjistíte).
  
 ===== Skripty ===== ===== Skripty =====

[ Back to the navigation ] [ Back to the content ]