[ Skip to the content ]

Institute of Formal and Applied Linguistics Wiki


[ Back to the navigation ]

Differences

This shows you the differences between two versions of the page.

Link to this comparison view

Both sides previous revision Previous revision
Next revision
Previous revision
Next revision Both sides next revision
khresmoi:en-fr [2012/01/19 16:09]
hlavacova
khresmoi:en-fr [2012/01/23 10:51]
ufal
Line 3: Line 3:
 == Vysvětlivky == == Vysvětlivky ==
 8-) už stažená data 8-) už stažená data
-:?: chceme stahovat, ale zatím nevíme, jak na to ... z různých příčin+:?: nevíme, jestli chceme 
 +:-? chceme stahovat, ale zatím nevíme, jak na to ... z různých příčin 
 + 
 +==== ELDA ==== 
 + 
 +**ELRA-E0020, CESTA Evaluation Package**  
 + 
 +Subpart: English-French parallel corpus from the second campagne data. Includes an adaptation corpus of 19,383 English words and 22,741 French words + a test corpus of 18,880 English words and 23,411 French words 
 + 
 +Zatim nedodáno (PP) 
 + 
 +==== TDA ==== 
 + 
 +**Pharmaceuticals and Biotechnology** 
 + 
 +en-GB -> fr-FR: 13,033,584 slov 
 +fr-FR -> en-GB  483,610 slov 
 + 
 +Staženo, TMX format, kvalita zatím neověřena (PP)
  
 ==== EMEA ==== ==== EMEA ====
-8-)+8-) 
 Zdroj: http://opus.lingfil.uu.se/EMEA.php Zdroj: http://opus.lingfil.uu.se/EMEA.php
 **en-fr.tmx.gz** ... alignovana data - download translation memory files (TMX), 373 152 sentence pairs **en-fr.tmx.gz** ... alignovana data - download translation memory files (TMX), 373 152 sentence pairs
Line 14: Line 32:
  
 ==== Orphanet ==== ==== Orphanet ====
-:?:+:-?
 info na Kh wiki: http://wiki.khresmoi.eu/index.php5/Data_sets/Orphanet info na Kh wiki: http://wiki.khresmoi.eu/index.php5/Data_sets/Orphanet
 orig. stránka: http://www.orpha.net orig. stránka: http://www.orpha.net
Line 49: Line 67:
 celkem 1 250 090 linků celkem 1 250 090 linků
  
 +==== LDC ====
 +:?:
 +Hansard French/English z roku 1995
 +LDC Catalog No.:        LDC95T20
 +
 +UN Parallel Text (Complete) z roku 1994
 +LDC Catalog No.:        LDC94T4A
 +
 +Obojí jsou staré government documents

[ Back to the navigation ] [ Back to the content ]