Differences
This shows you the differences between two versions of the page.
Both sides previous revision Previous revision Next revision | Previous revision | ||
user:zeman:ukoly:minoritni-jazyky [2008/10/22 17:22] zeman Syntaxe seznamu. |
user:zeman:ukoly:minoritni-jazyky [2009/09/24 13:31] (current) zeman Změna pořadí ukázek jazyků. |
||
---|---|---|---|
Line 1: | Line 1: | ||
====== Minoritní jazyky ====== | ====== Minoritní jazyky ====== | ||
+ | {{template> | ||
Toto je variace na úlohu [[Pavouk]], avšak pro jazyky, pro které je i na webu velký nedostatek dat, a proto vyžadují odlišné metody. Jsou to jazyky, pro které tu a tam někdo vyvěsil dokument, obvykle obklopený dokumenty v jiném jazyku, který na daném serveru převažuje. Prostým procházením webu byste se rychle octli v nepřátelském jazykovém prostředí a mohlo by trvat celé měsíce, než náhodou znova narazíte na dokument v hledaném jazyce. Musíte tedy svého robota napsat tak, aby komunikoval s jedním nebo několika vyhledávači (Google, Yahoo, Altavista...), | Toto je variace na úlohu [[Pavouk]], avšak pro jazyky, pro které je i na webu velký nedostatek dat, a proto vyžadují odlišné metody. Jsou to jazyky, pro které tu a tam někdo vyvěsil dokument, obvykle obklopený dokumenty v jiném jazyku, který na daném serveru převažuje. Prostým procházením webu byste se rychle octli v nepřátelském jazykovém prostředí a mohlo by trvat celé měsíce, než náhodou znova narazíte na dokument v hledaném jazyce. Musíte tedy svého robota napsat tak, aby komunikoval s jedním nebo několika vyhledávači (Google, Yahoo, Altavista...), | ||
Line 23: | Line 24: | ||
Tato úloha je ve školním roce 2008-2009 vypisována poprvé, není proto ještě prověřeno, | Tato úloha je ve školním roce 2008-2009 vypisována poprvé, není proto ještě prověřeno, | ||
+ | |||
+ | Následují ukázky jazyků, které jsou nebo v& | ||
+ | |||
+ | ===== 2009-2010 ===== | ||
+ | |||
+ | ==== Běloruština (be) ==== | ||
+ | |||
+ | У познім 17 – пач. 19 ст. у Рэчы Паспалітай жывая старабеларуская гаворка захоўвалася толькі на беларускіх землях і ў простага народу, | ||
+ | |||
+ | ==== Rétorománština (rm) ==== | ||
+ | |||
+ | Il rumantsch dal Grischun che vegn discurrì en il chantun Grischun fa part da las linguas neolatinas e vegn numnà en la lingua da mintgadi rumantsch (sursilvan: romontsch / puter: rumauntsch). Il term rumantsch dal Grischun vegn duvrà en la linguistica, | ||
+ | |||
+ | ==== Romština (rom) v (česko-)slovenském pravopisu ==== | ||
+ | |||
+ | TERDŽIPEN le nenonacistickengre maršoske !! 6. 11. 2007 Andre rat tel 9. po 10. novembris andro 1938 andre Nemciko pes ačhiľas jekhbareder mariben po hebrejsko ňipos. Andre koja rat so pes ada džives vičhinel „Krištalikro rat“ has murdarde 91 Hebrejca teh aver ezera has zoraha bičhade andro koncentráka. Andro 10. novembris 2007 po 69.beršeskro džives kan pes o mariben ačhiľas, kamen o čechijske neonacistura te kerel maršos palo purano hebrejsko foros andre Praha. Kada maršos kamukeri kamen te kerel sar protestos, kaj o Čechy te na aven andro mariben so džal andro Irak . O čačipen pes džanel, kamen te sikhavel peskri zor so džal avri andalo neonacizmo. | ||
+ | |||
+ | ===== 2008-2009 ===== | ||
+ | |||
+ | ==== Urijština ==== | ||
Testovací jazyk je urijština (Oriya, úřední jazyk indického státu Urísa). Cíl je jasný: získat co největší sbírku textů v tomto jazyce. Pro praktickou použitelnost by to měly být alespoň desetitisíce slov, ale není jisté, kolik textů je na webu vlastně k dispozici. Tento jazyk má např. i svou mutaci Wikipedie (http:// | Testovací jazyk je urijština (Oriya, úřední jazyk indického státu Urísa). Cíl je jasný: získat co největší sbírku textů v tomto jazyce. Pro praktickou použitelnost by to měly být alespoň desetitisíce slov, ale není jisté, kolik textů je na webu vlastně k dispozici. Tento jazyk má např. i svou mutaci Wikipedie (http:// | ||
Line 35: | Line 56: | ||
Pokud si chcete počíst, můžu vám také poskytnout skript, který převede urijské písmo do latinky. | Pokud si chcete počíst, můžu vám také poskytnout skript, který převede urijské písmo do latinky. | ||
+ |