[ Skip to the content ]

Institute of Formal and Applied Linguistics Wiki


[ Back to the navigation ]

Differences

This shows you the differences between two versions of the page.

Link to this comparison view

Both sides previous revision Previous revision
Next revision
Previous revision
khresmoi:fr [2012/01/20 11:26]
hlavacova
— (current)
Line 1: Line 1:
-===== Jazyková data FR ===== 
-Zatím mám vše uloženo u sebe.  ---  //[[hlavacova@ufal.mff.cuni.cz|hlavacova]] 2012/01/20 11:18// 
-== Vysvětlivky == 
-8-) už stažená data 
-:?: nevíme, jestli chceme 
-:-? chceme stahovat, ale zatím nevíme, jak na to ... z různých příčin 
- 
-==== LDC ==== 
-**French Gigaword** 3rd edition, catalogue number LDC2011T10, máme DVD 
-Formát: SGML, segmentace na věty, netokenizováno 
-862 851 slov, tj. simply the number of white space-separated tokens (of all types) after all SGML tags are eliminated 
-Všeobecné novinové texty, ne lékařské - Agence France-Presse, Associated Press French Service. 
-Dále jsem našla  
-**Hansard French/English** ... LDC Catalog No.: LDC95T20 
-**UN Parallel Text (Complete)** ... LDC Catalog No.: LDC94T4A, jazyky EN, FR, SP 
  

[ Back to the navigation ] [ Back to the content ]