[ Skip to the content ]

Institute of Formal and Applied Linguistics Wiki


[ Back to the navigation ]

Differences

This shows you the differences between two versions of the page.

Link to this comparison view

Both sides previous revision Previous revision
Next revision
Previous revision
prehled-o-anotovanych-datech [2010/10/11 08:20]
ufal
prehled-o-anotovanych-datech [2011/10/05 11:42] (current)
mirovsky
Line 218: Line 218:
 ==== etest ==== ==== etest ====
 ^ data ^ # souborů ^ # vět ^ # slov ^ anotátor ^ odesláno ^ vráceno ^ soubory ^ poznámka ^ ^ data ^ # souborů ^ # vět ^ # slov ^ anotátor ^ odesláno ^ vráceno ^ soubory ^ poznámka ^
-| data_20101008_JP_rijen.zip | 61 | 1000 | 16566 | JP | 8.10.2010 | | ln94200_159 - ln94200_37, ln94200_55 - ln94205_19 | září vynecháno - dovolená |+| data_20101008_JP_rijen.zip | 61 | 1000 | 16566 | JP | 8.10.2010 | 26.10.2010 | ln94200_159 - ln94200_37, ln94200_55 - ln94205_19 | září vynecháno - dovolená 
 +| data_20101011_RO_rijen.zip | 42 | 1020 | 17304 | RO | 11.10.2010 | 3.11.2010 | cmpr9410_040, lnd94103_064, ln94200_46, ln94205_28 - ln94208_10, mf920925_095 | září vynecháno - dovolená | 
 +| data_20101203_RO_prosinec.zip | 70 | 1020 | 17442 | RO | 3.12.2010 | 1.1.2011 | ln94208_109 - ln95046_044 | listopad vynecháno - práce na anglických datech | 
 +| data_20110103_RO_leden.zip | 28 | 456 | 8566 | RO | 3.1.2011 | 26.1.2011 | ln95046_054 - ln95048_040, ln95048_061, ln95048_071 | cca 550 vět udělal začátkem prosince anglických, ale dostal k tomu plnou dávku prosincových českých dat, tak teď je to o těch 550 vět zkráceno | 
 +| data_20110103_JP_leden.zip | 26 | 599 | 9619 | JP | 3.1.2011 | 27.1.2011 | ln95048_051, ln95048_081 - ln95049_136, mf920922_003, mf920922_013| listopad a prosinec vynecháno - práce na angl. datech; ještě cca 350 vět bude v lednu dělat anglických, takže dostává jen zkrácenou dávku českých; je tam extra dlouhý soubor (220 vět), takže celkem radši mírně pod 1000 vět než přes | 
 + 
 + 
 + 
 +---- 
 + 
 + 
 +==== odsud dál v datech nastavuju atribut src podle anotátora (všechny bridging a nové coref_text šipky) ==== 
 +pozn.: To už jsem nastavil i u starších dat. 
 + 
 +==== etest/dtest (konec prvního, začátek druhého kola anotací) ==== 
 +^ data ^ # souborů ^ # vět ^ # slov ^ anotátor ^ odesláno ^ vráceno ^ soubory ^ poznámka ^ 
 +| data_20110128_RO_unor.zip | 60 | 989 | 16932 | RO | 28.1.2011 | 27.2.2011 | první kolo: etest: mf920922_023 - mf930713_155 (bez mf920925_095), druhé kolo: dtest: cmpr9410_009, cmpr9410_019, ln94200_167 - ln94200_36 |  | 
 + 
 +==== dtest (druhé kolo anotací) ==== 
 +^ data ^ # souborů ^ # vět ^ # slov ^ anotátor ^ odesláno ^ vráceno ^ soubory ^ poznámka ^ 
 +| data_20110128_JP_unor.zip | 43 | 995 | 15459 | JP | 28.1.2011 | 18.2.2011 | cmpr9410_029 - cmpr9415_055 (bez cmpr9415_005), lnd* (bez lnd94103_063), ln94200_103 - ln94200_158, ln94205_90 - ln94206_27 |  | 
 +| rozdelene_po_55_vetach_JP.zip | 24 | 1329 | 25050 | JP | 24.2.2011 | 20.3.2011 | data pro PlayCoref - česká verze Studie v Šarlatové (zhruba půlka), pouze textová koreference | březnová práce pro PlayCoref | 
 +| rozdelene_po_55_vetach_RO.zip | 24 | 1329 | 24775 | RO | 1.3.2011 | 5.4.2011 | data pro PlayCoref - česká verze Studie v Šarlatové (zhruba půlka), pouze textová koreference | březnová práce pro PlayCoref | 
 +| data_20110322_JP_duben.zip | 77 | 998 | 16850 | JP | 22.3.2011 | 3.5.2011 | ln94206_36 až ln95045_038 bez ln94207_36 a bez ln94207_90 |  | 
 +| data_20110401_RO_duben.zip | 68 | 997 | 17381 | RO | 6.4.2011 | 4.5.2011 | ln94200_45 - ln94202_73, ln94202_91 - ln94205_81, mf930713_104 - mf930713_154 bez mf930713_134 |  | 
 +| data_20110501_JP_kveten.zip | 60 | 1014 | 18204 | JP | 11.4.2011 | 30.5.2011 | ln95045_048 - ln95049_085 |  | 
 + 
 +==== dtest/etest (druhé kolo anotací) ==== 
 +^ data ^ # souborů ^ # vět ^ # slov ^ anotátor ^ odesláno ^ vráceno ^ soubory ^ poznámka ^ 
 +| data_20110607_JP_cerven.zip | 77 | 1016 | 16994 | JP | 7.6.2011 | 24.6.2011 | dtest: ln95049_095 - ln95049_135, mf920922_002 - mf930713_093 bez mf930709_052; etest: ln94205_28 - ln94206_82 |  | 
 + 
 +==== etest (druhé kolo anotací) ==== 
 +^ data ^ # souborů ^ # vět ^ # slov ^ anotátor ^ odesláno ^ vráceno ^ soubory ^ poznámka ^ 
 +| data_20110501_RO_kveten.zip | 62 | 1011 | 15947 | RO | 11.4.2011 | 6.6.2011 | cmpr* bez cmpr9410_040, lnd* bez lnd94103_064, ln94200_104 - ln94203_119 bez ln94200_46 |  | 
 +| data_20110609_RO_cerven.zip | 60 | 1144 | 18859 | RO | 9.6.2011 | 15.8.2011 | ln94203_128 - ln94205_19, ln95048_051, ln95048_081 - ln95049_136, mf920922_003, mf920922_013 |  | 
 +| data_20110627_JP_cervenec.zip | 57 | 1003 | 17809 | JP | 27.6.2011 | 28.7.2011 | ln94206_91 - ln94211_106 |  | 
 +| data_20110801_JP_srpen.zip | 58 | 1017 | 18656 | JP | 1.8.2011 | 1.9.2011 | ln94211_115 - ln95048_071 (bez ln95048_051), mf920922_013, mf920922_023 |  | 
 +| data_20110829_JP_zari.zip | 53 | 746 | 12834 | JP | 29.8.2011 | 4.10.2011 | mf920922_033 - mf930713_155 (bez mf920925_095) |  |
  

[ Back to the navigation ] [ Back to the content ]