Differences
This shows you the differences between two versions of the page.
Both sides previous revision Previous revision Next revision | Previous revision Next revision Both sides next revision | ||
user:zeman:ukoly:pavouk [2007/10/12 13:54] zeman telugu2latin.pl |
user:zeman:ukoly:pavouk [2007/10/27 18:40] zeman Rumunština. |
||
---|---|---|---|
Line 10: | Line 10: | ||
- Program na natrénování statistiky, podle které dokážeme rozpoznat jazyk dokumentu. | - Program na natrénování statistiky, podle které dokážeme rozpoznat jazyk dokumentu. | ||
- Rozšíření pavouka o modul, který načte natrénované statistiky jazyků a o stahovaných dokumentech pak dokáže říct, zda jsou v požadovaném jazyku, nebo ne. | - Rozšíření pavouka o modul, který načte natrénované statistiky jazyků a o stahovaných dokumentech pak dokáže říct, zda jsou v požadovaném jazyku, nebo ne. | ||
- | - Vytipování počátečního URL pro jazyk, který vám byl zadán. Spusťte pavouka a stáhněte korpus, který po vyčištění bude obsahovat alespoň | + | - Vytipování počátečního URL pro jazyk, který vám byl zadán. Spusťte pavouka a stáhněte korpus, který po vyčištění bude obsahovat alespoň |
Odevzdávat budete oba programy a stažený korpus. | Odevzdávat budete oba programy a stažený korpus. | ||
Line 83: | Line 83: | ||
Krátké ukázky z jazyků, které jsou v nabídce v zimním semestru 2007-8: | Krátké ukázky z jazyků, které jsou v nabídce v zimním semestru 2007-8: | ||
+ | |||
+ | ==== Rumunština ==== | ||
+ | Limba română (sau dacoromână) este o limbă indo-europeană, | ||
==== Svahilština ==== | ==== Svahilština ==== |