[ Skip to the content ]

Institute of Formal and Applied Linguistics Wiki


[ Back to the navigation ]

Differences

This shows you the differences between two versions of the page.

Link to this comparison view

Both sides previous revision Previous revision
Next revision
Previous revision
Next revision Both sides next revision
khresmoi:start [2012/02/29 09:57]
hlavacova
khresmoi:start [2012/02/29 10:14]
hlavacova
Line 27: Line 27:
 | CESART Evaluation Package | ELRA |  in  |  |  |  |  |  9000 Kw | |  DONE  | | CESART Evaluation Package | ELRA |  in  |  |  |  |  |  9000 Kw | |  DONE  |
 | French Gigaword | LDC |  news  |  |  |  |  |   863 Kw | |  8-) DVD  | | French Gigaword | LDC |  news  |  |  |  |  |   863 Kw | |  8-) DVD  |
-| [[khresmoi:data_notes|Acquis]] | JRC |  law  |  1,25 Ms |  1,33 Ms |  sent  |  |  |   |  Part DONE (jen FR), see ↑ |+| [[khresmoi:data_notes#JRC-Acquis|Acquis]] | JRC |  law  |  1,25 Ms |  1,33 Ms |  sent  |  |  |   |  jrc :!:  |
 | EMEA | European Medicines Agency |  in  |  373 Ks |  12 Mw |  |  26.34 Mw |  14.9Mw |    DONE - i CS  | | EMEA | European Medicines Agency |  in  |  373 Ks |  12 Mw |  |  26.34 Mw |  14.9Mw |    DONE - i CS  |
 | MESH | U.S. National Library of Medicine |  in  |  |  |  |  838 kw |      DONE*  | | MESH | U.S. National Library of Medicine |  in  |  |  |  |  838 kw |      DONE*  |
Line 46: Line 46:
 | OpenSubtitles2011 | OPUS |    |    |  5 Ms |  sent  |  |      8-) JB   | | OpenSubtitles2011 | OPUS |    |    |  5 Ms |  sent  |  |      8-) JB   |
  
 +== Vysvětlivky ==
 k, M ... thousand, milion  k, M ... thousand, milion 
 w, s, f ... words, sentences, files (for parallel data only source (English) words are counted) w, s, f ... words, sentences, files (for parallel data only source (English) words are counted)
 * viz podrobnější info v podsekcích * viz podrobnější info v podsekcích
 +8-) stažená data, ale nezpracovaná
 +:?: nevíme, jestli chceme
 +:-? chceme stahovat, ale zatím nevíme, jak na to ... z různých příčin
 +8-O čekáme na data
 +:!: nějaký problém, podrobněji v poznámkách - prokliknout z prvního sloupce
  
  
Line 56: Line 61:
  
 === Zdroje  === === Zdroje  ===
-__JRC Acquis__  
-http://optima.jrc.it/Acquis/JRC-Acquis.3.0/alignmentsHunAlign/index.html 
  
 __MAREC__ __MAREC__
Line 82: Line 85:
 __korpus OPUS__  __korpus OPUS__ 
 http://opus.lingfil.uu.se/ http://opus.lingfil.uu.se/
- 
-__JRC Acquis__ 
-http://langtech.jrc.it/JRC-Acquis.html 
  
 __ELDA__ __ELDA__

[ Back to the navigation ] [ Back to the content ]