[ Skip to the content ]

Institute of Formal and Applied Linguistics Wiki


[ Back to the navigation ]

Differences

This shows you the differences between two versions of the page.

Link to this comparison view

Both sides previous revision Previous revision
Next revision
Previous revision
khresmoi:start [2012/03/07 12:00]
ufal
khresmoi:start [2013/04/23 23:40] (current)
ufal +rosa
Line 12: Line 12:
     * **JB**   = Jakub Bystroň <jb.elitecode (at) gmail.com>     * **JB**   = Jakub Bystroň <jb.elitecode (at) gmail.com>
     * **ZU**   = Zdeňka Urešová <uresova (at) ufal.mff.cuni.cz>     * **ZU**   = Zdeňka Urešová <uresova (at) ufal.mff.cuni.cz>
 +    * **RR**   = Rudolf Rosa <rosa (at) ufal.mff.cuni.cz>
  
 ---- ----
Line 20: Line 21:
  
 === MT training data available for KHRESMOI === === MT training data available for KHRESMOI ===
-Kliknutím na korpus (první sloupec) se dostanete do sekce [[khresmoi:data_notes|Poznámky k datům]].+Kliknutím na korpus (první sloupec) se dostanete do sekce [[khresmoi:data_notes|Poznámky k datům]], případně na stránku, odkud jsou data stažená.
 ---- ----
 ^ Corpus ^ Source ^ Domain ^  EN-FR  ^  EN-DE  ^  alignment  ^  EN  ^  FR  ^  DE  ^  Note  ^ ^ Corpus ^ Source ^ Domain ^  EN-FR  ^  EN-DE  ^  alignment  ^  EN  ^  FR  ^  DE  ^  Note  ^
Line 43: Line 44:
 | [[khresmoi:data_notes#Coppa|Coppa]] (patenty)| WIPO |  tech  |  178,8Mw |  |  par  |        DONE:wipo  | | [[khresmoi:data_notes#Coppa|Coppa]] (patenty)| WIPO |  tech  |  178,8Mw |  |  par  |        DONE:wipo  |
 | [[khresmoi:data_notes#MAREC|MAREC]] | Wien TU |  in  |  ? |  ? |  ?  |  |      :-?  | | [[khresmoi:data_notes#MAREC|MAREC]] | Wien TU |  in  |  ? |  ? |  ?  |  |      :-?  |
-| [[khresmoi:data_notes#much.more|Springer Bilingual Corpus]] | much.more |  in  |    |  1.09 Mw |  sent   |     |  8-) JB   |+| [[khresmoi:data_notes#much.more|Springer Bilingual Corpus]] | much.more |  in  |    |  800kw |  par  1.1Mw |    1.0Mw |  DONE:muchmore   |
 | Europarl3 | OPUS |    |    |  1.3 Ms |  sent  |  |      neni poreba   | | Europarl3 | OPUS |    |    |  1.3 Ms |  sent  |  |      neni poreba   |
 | OpenSubtitles2011 | OPUS |    |    |  5 Ms |  sent  |  |      8-) JB   | | OpenSubtitles2011 | OPUS |    |    |  5 Ms |  sent  |  |      8-) JB   |
 | Czeng | UFAL |    |    |    sent  |  |      JB   | | Czeng | UFAL |    |    |    sent  |  |      JB   |
 +| Drugbank | drugbank.ca |  in  |    |  |    624kw |      DONE:drugbank   |
 +| [[http://sig.biostr.washington.edu/projects/fma/release/v3.2.1/alt_formats.html|FMA]] | Foundational Model of Anatomy ontology |  in  |    |  |    855,5kw |      DONE:fma   |
 +| PIL | The Patient Information Leaflet Corpus |  in  |    |  |    0,5Mw |      DONE:pil   |
 +| [[www.nactem.ac.uk/download.php?target=GREC/GREC_Standoff.zip|GREC]] | Gene Regulation Event Corpus |  in  |    |  |    52kw |      DONE:grec   |
 +| [[www.nactem.ac.uk/GENIA/current/GENIA-corpus/Part-of-speech/GENIAcorpus3.02p.tgz|GENIA]] | GENIA |  in  |    |  |    490kw |      DONE:genia   |
 +| [[https://download.ir-facility.org/khresmoi/coch.zip|Cochrane]] | Cochrane |  in  |    |  |    53.6Mw |      DONE:cochrane  |
 +| [[khresmoi:data_notes#un|un]]| Euromatrix |  gen  |  |  |  sent  |  517.4Mw |  386.3Mw |  5.9Mw |  DONE:un  |
 +| [[http://universitypublisher.meduniwien.ac.at/radio2wiki/index.php/Main_Page|Radio2wiki]] | Radio2wiki |  in  |    |  |    |    74kw |  DONE:radio2wiki   |
 +
 +
 +
  
 == Vysvětlivky == == Vysvětlivky ==

[ Back to the navigation ] [ Back to the content ]