Differences
This shows you the differences between two versions of the page.
Both sides previous revision Previous revision Next revision | Previous revision | ||
user:zeman:ukoly:hackovani [2009/10/01 11:26] zeman Rozšíření motivace doplňování arabských souhlásek. |
user:zeman:ukoly:hackovani [2013/10/08 08:07] (current) zeman quest |
||
---|---|---|---|
Line 2: | Line 2: | ||
{{template> | {{template> | ||
- | Napište program, který doplní do textu chybějící diakritiku. K testování dostanete data v konkrétním jazyku, váš program by však měl být v maximální možné míře jazykově nezávislý. Můžete předpokládat, | + | Napište program, který doplní do textu chybějící diakritiku. K testování dostanete data v konkrétním jazyku, váš program by však měl být v maximální možné míře jazykově nezávislý. Můžete předpokládat, |
Úloha má tyto části: | Úloha má tyto části: | ||
- | - Trénovací program. Projde trénovací data (tokenizovaný text v UTF-8) a naučí se slovník, tj. pro každý řetězec bez diakritiky všechny možné řetězce (s diakritikou či bez), ze kterých mohl vzniknout. | + | - Trénovací program. Projde trénovací data (tokenizovaný text v UTF-8) a naučí se slovník, tj. pro každý řetězec bez diakritiky všechny možné řetězce (s diakritikou či bez), ze kterých mohl vzniknout. |
- Vlastní háčkovač. Čte ze standardního vstupu tokenizovaný text bez diakritiky, na standardní výstup vypisuje tentýž text s diakritikou (v UTF-8). | - Vlastní háčkovač. Čte ze standardního vstupu tokenizovaný text bez diakritiky, na standardní výstup vypisuje tentýž text s diakritikou (v UTF-8). | ||
- Za pomoci trénovacího programu nebo jeho upravené verze: | - Za pomoci trénovacího programu nebo jeho upravené verze: | ||
Line 18: | Line 18: | ||
Program '' | Program '' | ||
+ | |||
+ | <code bash> | ||
===== Háčkování ===== | ===== Háčkování ===== | ||
Line 24: | Line 26: | ||
Program píše na standardní výstup. Posílá tam tentýž text obohacený o diakritiku. Pozor, nesmíte změnit počet mezer, zalomení řádku apod.! Na výstupu má být přesně stejný počet znaků jako na vstupu, akorát místo znaků bez diakritiky se mohou objevit znaky s diakritikou, | Program píše na standardní výstup. Posílá tam tentýž text obohacený o diakritiku. Pozor, nesmíte změnit počet mezer, zalomení řádku apod.! Na výstupu má být přesně stejný počet znaků jako na vstupu, akorát místo znaků bez diakritiky se mohou objevit znaky s diakritikou, | ||
+ | |||
+ | <code bash> | ||
===== Varianta pro arabštinu ===== | ===== Varianta pro arabštinu ===== | ||
Line 44: | Line 48: | ||
Pro učení budete mít k& | Pro učení budete mít k& | ||
- | |||
===== Další informace ===== | ===== Další informace ===== | ||
- | Tento úkol (včetně zadání konkrétního jazyka) si můžete zarezervovat vyplněním formuláře na http://ufal.mff.cuni.cz/ | + | Tento úkol (včetně zadání konkrétního jazyka) si můžete zarezervovat vyplněním formuláře na http://quest.ms.mff.cuni.cz/ |
Pokud se individuálně nedohodneme jinak, termín odevzdání je konec listopadu. Při některé prosincové přednášce program předvedete ostatním. | Pokud se individuálně nedohodneme jinak, termín odevzdání je konec listopadu. Při některé prosincové přednášce program předvedete ostatním. | ||
Line 56: | Line 59: | ||
V& | V& | ||
- | V& | + | V& |
- | + | ||
- | * {{user: | + | |
- | * {{user: | + | |
- | * {{user: | + | |
+ | * {{user: | ||
+ | * {{user: | ||
+ | * {{user: | ||
+ | * Arabská data (2009-2010): | ||
+ | * {{user: | ||
+ | * Řecká data (2012-2013): |