[ Skip to the content ]

Institute of Formal and Applied Linguistics Wiki


[ Back to the navigation ]

Differences

This shows you the differences between two versions of the page.

Link to this comparison view

Both sides previous revision Previous revision
Next revision
Previous revision
Next revision Both sides next revision
khresmoi:start [2012/01/18 13:37]
hlavacova
khresmoi:start [2012/01/24 14:24]
hlavacova
Line 14: Line 14:
  
 ---- ----
- 
 ==== Data ==== ==== Data ====
 +=== MT training data available for KHRESMOI ===
 +
 +^ Corpus ^ Source ^ Domain ^  EN-FR  ^  EN-DE  ^  EN  ^  FR  ^  DE  ^  Note  ^
 +| TMX | TDA |  in  |  13517 Kw |  6797 Kw |  |  |  |  8-) PP  |
 +| CESTA Evaluation Package  | ELRA |  in  |  38 Kw |  |  |  |  |  waiting  |
 +| EQueR Evaluation Package  | ELRA |  in  |  |  |  |  140 MiB | |  waiting  |
 +| CESART Evaluation Package | ELRA |  in  |  |  |  |  9000 Kw | |  waiting  |
 +| French Gigaword | LDC |  out  |  |  |  |   863Kw | |  DVD  |
 +| Acquis | JRC |  out  |  1,25M sentences |  |  |  |    8-) JHla  |
 +| EMEA | European Medicines Agency |  in  |  373k sentences |  |  |  |    8-) JHla  |
 +| EMEA | European Medicines Agency |  in  |  |  |  |  14.9Mw |    8-) JHla  |
 +| EMEA | European Medicines Agency |  in  |  |  |  26,34Mw |  |    8-) JHla  |
 +| MESH | U.S. National Library of Medicine |  in  |  |  |  838kw |      8-) JHla  |
 +| OrphaNet  | OrphaNet |  in  |  ?  |  |  |  | |  negotiating  |
 +
 === Zdroje (dle PP) === === Zdroje (dle PP) ===
 __Khresmoi wiki__ __Khresmoi wiki__
Line 31: Line 45:
  
 __ELDA__ __ELDA__
 +
 +Objednali jsme několik balíčků s in-domain daty (EN-FR, FR) 
  
 __TDA__ __TDA__
 +
 +Máme kredit na stažení 1 mld. slov. Zatím stažena EN-FR, EN-DE in-domain data.
  
 __LDC__ __LDC__

[ Back to the navigation ] [ Back to the content ]