[ Skip to the content ]

Institute of Formal and Applied Linguistics Wiki


[ Back to the navigation ]

Differences

This shows you the differences between two versions of the page.

Link to this comparison view

Next revision
Previous revision
Next revision Both sides next revision
khresmoi:fr [2012/01/20 11:17]
hlavacova vytvořeno
khresmoi:fr [2012/01/20 11:22]
hlavacova
Line 1: Line 1:
-=====FR ====== +===== Jazyková data FR ===== 
-===== LDC ===== +Zatím mám vše uloženo u sebe.  ---  //[[hlavacova@ufal.mff.cuni.cz|hlavacova]] 2012/01/20 11:18// 
-French Gigaword+== Vysvětlivky == 
 +8-) už stažená data 
 +:?: nevíme, jestli chceme 
 +:-? chceme stahovat, ale zatím nevíme, jak na to ... z různých příčin 
 + 
 +==== LDC ==== 
 +French Gigaword 3rd edition 
 +Formát: SGML, segmentace na věty, netokenizováno 
 +862 851 slov, tj. simply the number of white space-separated tokens (of all types) after all SGML tags are eliminated 
 +Všeobecné novinové texty, ne lékařské - Agence France-Presse, Associated Press French Service.

[ Back to the navigation ] [ Back to the content ]