Differences
This shows you the differences between two versions of the page.
Next revision | Previous revision Next revision Both sides next revision | ||
khresmoi:fr [2012/01/20 11:17] hlavacova vytvořeno |
khresmoi:fr [2012/01/20 11:22] hlavacova |
||
---|---|---|---|
Line 1: | Line 1: | ||
- | ====== FR ====== | + | ===== Jazyková data FR ===== |
- | ===== LDC ===== | + | Zatím mám vše uloženo u sebe. --- // |
- | French Gigaword | + | == Vysvětlivky |
+ | 8-) už stažená data | ||
+ | :?: nevíme, jestli chceme | ||
+ | :-? chceme stahovat, ale zatím nevíme, jak na to ... z různých příčin | ||
+ | |||
+ | ==== LDC ==== | ||
+ | French Gigaword | ||
+ | Formát: SGML, segmentace na věty, netokenizováno | ||
+ | 862 851 slov, tj. simply the number of white space-separated tokens (of all types) after all SGML tags are eliminated | ||
+ | Všeobecné novinové texty, ne lékařské - Agence France-Presse, |