Both sides previous revision
Previous revision
Next revision
|
Previous revision
|
user:zeman:ukoly [2007/11/01 12:30] zeman PC-Kimmo. |
user:zeman:ukoly [2013/10/08 06:55] (current) zeman Formulář pro rezervaci úkolů. |
====== Úlohy z počítačového zpracování přirozeného jazyka ====== | ====== Úlohy z počítačového zpracování přirozeného jazyka ====== |
| |
| **Upozornění:** Je možné, že některá zde uvedená zadání jsou již rozebrána, nebo dokonce letos vůbec nebyla v nabídce. Dostupnost zadání zjistíte na stránce s [[http://quest.ms.mff.cuni.cz/cgi-bin/zeman/zapoctaky/rezervace_ukolu.pl|rezervačním formulářem]]. |
| |
* [[user:zeman:ukoly:Pavouk]] (získávání korpusu z webu) | * [[user:zeman:ukoly:Pavouk]] (získávání korpusu z webu) |
| * [[user:zeman:ukoly:Minoritní jazyky]] (získávání korpusu z webu pro málo zastoupené jazyky) |
* [[user:zeman:ukoly:Třídění jazyků]] | * [[user:zeman:ukoly:Třídění jazyků]] |
* [[user:zeman:ukoly:Hranice slov a vět]] (tokenizace a segmentace) | * [[user:zeman:ukoly:Hranice slov a vět]] (tokenizace a segmentace) |
* [[user:zeman:ukoly:Háčkování]] (doplňování chybějící diakritiky do textu) | * [[user:zeman:ukoly:Háčkování]] (doplňování chybějící diakritiky do textu) |
| * [[user:zeman:ukoly:T9]] |
| * [[user:zeman:ukoly:Rekonstrukce velkých písmen]] |
| * [[user:zeman:ukoly:Kontrola pravopisu]] |
| * [[user:zeman:ukoly:Podobnost slov a vět]] |
| * [[user:zeman:ukoly:Chart parser]] |
| * [[user:zeman:ukoly:Morfologická gramatika pro chart parser]] |
| * [[user:zeman:ukoly:HMM tagger]] |
| * [[user:zeman:ukoly:Pojmenované entity]] |
| * [[user:zeman:ukoly:Vícejazyčné pojmenované entity z Wikipedie]] |
| * [[user:zeman:ukoly:Neřízená morfologická analýza|Segmentace slov na morfémy]] |
| * [[user:zeman:ukoly:Dobývání informací]] |
| * [[user:zeman:ukoly:Geocaching]] |
| |
* [[user:zeman:ukoly:Brillův tagger]] | * Taggery |
* [[user:zeman:ukoly:Tagger TnT]] | * [[user:zeman:ukoly:Brillův tagger]] |
* [[user:zeman:ukoly:Malt parser]] (http://w3.msi.vxu.se/~nivre/research/MaltParser.html) | * [[user:zeman:ukoly:TreeTagger]] |
* [[user:zeman:ukoly:MST parser]] (http://sourceforge.net/projects/mstparser) | * [[user:zeman:ukoly:Tagger TnT]] |
* [[user:zeman:ukoly:Collinsův/Bikelův parser]] (http://people.csail.mit.edu/mcollins/code.html) | * [[user:zeman:ukoly:Tagger Morče]] |
* [[user:zeman:ukoly:Charniakův/Johnsonův parser]] (http://www.cog.brown.edu/~mj/Software.htm) | * Parsery |
* [[user:zeman:ukoly:Stanfordský parser]] (http://nlp.stanford.edu/software/lex-parser.shtml) | * [[user:zeman:ukoly:Malt parser]] (závislostní) |
| * [[user:zeman:ukoly:MST parser]] (závislostní) |
| * [[user:zeman:ukoly:Collinsův/Bikelův parser]] (složkový) |
| * [[user:zeman:ukoly:Charniakův/Johnsonův parser]] (složkový) |
| * [[user:zeman:ukoly:Stanfordský parser]] (složkový i závislostní) |
| * Překladače |
| * [[user:zeman:ukoly:Moses]] |
| * [[user:zeman:ukoly:Joshua]] |
* [[user:zeman:ukoly:PC-Kimmo]] (http://www.sil.org/pckimmo/) | * [[user:zeman:ukoly:PC-Kimmo]] (http://www.sil.org/pckimmo/) |
| |
Zadání týkající se parserů budou podobného ražení jako již vyvěšená zadání pro taggery. Některé parsery jsou závislostní (Malt, MST), některé složkové (Collins, Charniak, Stanford), takže s ohledem na dostupná data může být potřeba také provést konverzi mezi oběma formalismy. | * [[user:zeman:ukoly:tipy|DZ tipy]] |