[ Skip to the content ]

Institute of Formal and Applied Linguistics Wiki


[ Back to the navigation ]

Differences

This shows you the differences between two versions of the page.

Link to this comparison view

Both sides previous revision Previous revision
Next revision
Previous revision
Next revision Both sides next revision
khresmoi:start [2012/01/25 20:42]
ufal
khresmoi:start [2012/01/30 18:39]
ufal
Line 18: Line 18:
 === MT training data available for KHRESMOI === === MT training data available for KHRESMOI ===
  
-^ Corpus ^ Source ^ Domain ^  EN-FR  ^  EN-DE  ^  EN  ^  FR  ^  DE  ^  Note  ^ +^ Corpus ^ Source ^ Domain ^  EN-FR  ^  EN-DE   alignment   EN  ^  FR  ^  DE  ^  Note  ^ 
-| TDA translation memory  | TDA |  in  |  13517 Kw |  6797 Kw |  |  |  |  8-) PP  | +| TDA translation memory  | TDA |  in  |  13517 Kw |  6797 Kw |  sent  |  |  |  |  8-) PP  | 
-| CESTA Evaluation Package  | ELRA |  in  |  38 Kw |  |  |  |  |  waiting +| CESTA Evaluation Package  | ELRA |  in  |  38 Kw |   sent   |  |  |  waiting 
-| EQueR Evaluation Package  | ELRA |  in  |  |  |  |  140 MiB | |  waiting +| EQueR Evaluation Package  | ELRA |  in    |  |  |  140 MiB | |  waiting 
-| CESART Evaluation Package | ELRA |  in  |  |  |  |  9000 Kw | |  waiting +| CESART Evaluation Package | ELRA |  in    |  |  |  9000 Kw | |  waiting 
-| French Gigaword | LDC |  news  |  |  |  |   863 Kw | |  DVD  | +| French Gigaword | LDC |  news    |  |  |   863 Kw | |  8-) DVD  | 
-| Acquis | JRC |  law  |  1,25 Ms (?3,034 Ms) (3,128 Ms|  |  |    8-) JHla  | +| Acquis | JRC |  law  |  1,25 Ms |  1,33 Ms |  sent   |  |    8-) JHla (jen FR) 
-| EMEA | European Medicines Agency |  in  |  373 Ks |   |  |    8-) JHla  +| EMEA | European Medicines Agency |  in  |  373 Ks |  12 Mw |  |  26.34 Mw |  14.9Mw |    8-) JHla, JB  | 
-| EMEA | European Medicines Agency |  in  |  |  |  |  14.9Mw |    8-) JHla  | +| MESH | U.S. National Library of Medicine |  in    |  |  838 kw |      8-) JHla  | 
-| EMEA | European Medicines Agency |  in  |  |  |  26.34 Mw |  |    8-) JHla  | +| OrphaNet  | OrphaNet |  in  |  ?    |  |  | |  Wien will do  | 
-| MESH | U.S. National Library of Medicine |  in  |  |  |  838 kw |      8-) JHla  | +| Europarl | WMT12 |  parl  |  1.8Ms |  1.7Ms  |  sent   |  | |  8-) JHla  | 
-| OrphaNet  | OrphaNet |  in  |  ?  |  |  |  | |  negotiating  | +| News Commentary  | WMT12 |  news  |  43ks |  60ks |  sent   |  | |  8-) JHla  | 
-| Europarl | WMT12 |  parl  |   |    |  | |  JHla  | +| News monolingual | WMT12 |  news  |  |  |  |  181kw  147kw |  162kw |  8-) JHla  | 
-| News Commentary  | WMT12 |  news  |   |    |  | |  JHla  | +| United Nations | WMT12 |  news  |  12.3Ms |   |  |  | |  8-) JHla  | 
-| News monolingual | WMT12 |  news  |  |  |  |  | |  JHla  | +| French-English 109 corpus | WMT12 |  web  |  22.5Ms |   sent   |  | |  8-) JHla  | 
-| United Nations | WMT12 |   |    |  |  | |  JHla  | +| Medpedia wiki| Medpedia |  in  |   |  |  |  ? |  | |  only EN found  | 
-| French-English 109 corpus | WMT12 |  web  |    |  |  | |  JHla  | +Corpus Of Parallel Patent Applications (Coppa)WIPO |  in#all  |  1.6Mf#170Mw |  |  |   |   |   |  waiting for DVD JHla   | 
-| Medpedia wiki| Medpedia |  in  |    |  ? |  | |  only EN found  | +| Springer Bilingual Corpus | much.more |  in  |    |  1.09 Mw |  sent     |    8-) JB   | 
-MAREC IPC |  in  |  ?  |  |  ?   ?  |   |  contacted JHla   | +Europarl3 OPUS |    |    |  1.3 Ms |  sent     |    8-) JB   | 
-| Springer Bilingual Corpus | much.more |  in  |    | 1.09 Mw |       |    8-) JB   | +| OpenSubtitles2011 | OPUS |    |    |  5 Ms |  sent  |  |   |    8-) JB   | 
-EMEA CORPUS |  in     12 Mw |    |    |    8-) JB   |+
  
 k, M ... thousand, milion  k, M ... thousand, milion 
-w, s ... words, sentences (for parallel data only source (English) words are counted)+w, s, f ... words, sentences, files (for parallel data only source (English) words are counted)
  
-  +=== Zdroje  === 
- +__JRC Acquis__ 
-JRC Acquis by mel mit pres 3 Ms:+
 http://optima.jrc.it/Acquis/JRC-Acquis.3.0/alignmentsHunAlign/index.html http://optima.jrc.it/Acquis/JRC-Acquis.3.0/alignmentsHunAlign/index.html
- 
-=== Zdroje  === 
  
 __MAREC__ __MAREC__
Line 60: Line 57:
 __www stranka WMT workshopu__ __www stranka WMT workshopu__
 http://www.statmt.org/wmt12/ http://www.statmt.org/wmt12/
 +http://www.statmt.org/wmt11/translation-task.html   ... tady je to vsecko pohromade
  
 __korpus OPUS__  __korpus OPUS__ 

[ Back to the navigation ] [ Back to the content ]