[ Skip to the content ]

Institute of Formal and Applied Linguistics Wiki


[ Back to the navigation ]

Differences

This shows you the differences between two versions of the page.

Link to this comparison view

Both sides previous revision Previous revision
Next revision
Previous revision
Next revision Both sides next revision
khresmoi:start [2012/01/24 13:50]
hlavacova
khresmoi:start [2012/01/24 15:08]
ufal
Line 16: Line 16:
 ==== Data ==== ==== Data ====
  
-Actual situation of downloads: [[khresmoi:data|here]]+=== MT training data available for KHRESMOI === 
 + 
 +^ Corpus ^ Source ^ Domain ^  EN-FR  ^  EN-DE  ^  EN  ^  FR  ^  DE  ^  Note  ^ 
 +TDA translation memory  | TDA |  in  |  13517 Kw |  6797 Kw |  |  |  |  8-) PP  | 
 +| CESTA Evaluation Package  | ELRA |  in  |  38 Kw |  |  |  |  |  waiting 
 +| EQueR Evaluation Package  | ELRA |  in  |  |  |  |  140 MiB | |  waiting 
 +| CESART Evaluation Package | ELRA |  in  |  |  |  |  9000 Kw | |  waiting 
 +| French Gigaword | LDC |  news  |  |  |  |   863 Kw | |  DVD  | 
 +| Acquis | JRC |  law  |  1,25 Ms |  |  |  |    8-) JHla  | 
 +| EMEA | European Medicines Agency |  in  |  373 Ks |  |  |  |    8-) JHla  | 
 +| EMEA | European Medicines Agency |  in  |  |  |  |  14.9Mw |    8-) JHla  | 
 +| EMEA | European Medicines Agency |  in  |  |  |  26.34 Mw |  |    8-) JHla  | 
 +| MESH | U.S. National Library of Medicine |  in  |  |  |  838 kw |      8-) JHla  | 
 +| OrphaNet  | OrphaNet |  in  |  ?  |  |  |  | |  negotiating 
 + 
 + 
 +K,M ... thousand, milion  
 +w,s ... words, sentences (for parallel data only source (English) words are counted)
  
 === Zdroje (dle PP) === === Zdroje (dle PP) ===

[ Back to the navigation ] [ Back to the content ]