[ Skip to the content ]

Institute of Formal and Applied Linguistics Wiki


[ Back to the navigation ]

Differences

This shows you the differences between two versions of the page.

Link to this comparison view

Both sides previous revision Previous revision
Next revision
Previous revision
Next revision Both sides next revision
khresmoi:en-fr [2012/01/24 09:50]
hlavacova
khresmoi:en-fr [2012/01/26 16:43]
hlavacova
Line 5: Line 5:
 :?: nevíme, jestli chceme :?: nevíme, jestli chceme
 :-? chceme stahovat, ale zatím nevíme, jak na to ... z různých příčin :-? chceme stahovat, ale zatím nevíme, jak na to ... z různých příčin
 +8-O čekáme na data
 ==== ELDA ==== ==== ELDA ====
  
Line 59: Line 59:
 egrep "\<s2\>" alignedCorpus_en_fr.xml | wc → 1250095 egrep "\<s2\>" alignedCorpus_en_fr.xml | wc → 1250095
  
-Nevím, proč se ta čísla liší. 
 egrep "\<link type=" alignedCorpus_en_fr.xml | cut -d" " -f2|sort|uniq -c  → egrep "\<link type=" alignedCorpus_en_fr.xml | cut -d" " -f2|sort|uniq -c  →
   *  1228037 type="1:1"   *  1228037 type="1:1"
Line 66: Line 65:
   *     1284 type="2:2"   *     1284 type="2:2"
 celkem 1 250 090 linků celkem 1 250 090 linků
 +
 +==== korpus Europarl ====
 +8-)
 +http://www.statmt.org/europarl/
 +wc europarl-v6.fr-en.*
 +  1825077  45682922 273660925 europarl-v6.fr-en.en
 +  1825077  47667366 314658361 europarl-v6.fr-en.fr
 +Stažený nástroj na alignment.
 +
 +
  
 ==== LDC ==== ==== LDC ====
Line 78: Line 87:
 Non-member Fee: US $4000.00 Non-member Fee: US $4000.00
 Reduced-License Fee: US $2000.00 Reduced-License Fee: US $2000.00
 +
 +==== MAREC ====
 +8-O
 +Tenhle odkaz z wiki Khresmoi vede na stránky WIPO. Jde o patenty z nejrůznějších oborů.
 +Odpověděli na můj dotaz mailem, objednala jsem korpus COPPA (viz tabulka) - viz http://www.wipo.int/patentscope/en/data/products.html
 +Měl by být paralelní se 170Mw. Z toho je něco in domain - podle kódu, který mám, je možno data identifikovat.
 +Možná se budou hodit i ostatní, ale nevím, z jakých jsou oborů.
 +
 +
  

[ Back to the navigation ] [ Back to the content ]