[ Skip to the content ]

Institute of Formal and Applied Linguistics Wiki


[ Back to the navigation ]

Differences

This shows you the differences between two versions of the page.

Link to this comparison view

Both sides previous revision Previous revision
Next revision
Previous revision
Last revision Both sides next revision
prehled-o-anotovanych-datech [2010/10/11 08:29]
ufal
prehled-o-anotovanych-datech [2011/09/02 11:44]
mirovsky
Line 218: Line 218:
 ==== etest ==== ==== etest ====
 ^ data ^ # souborů ^ # vět ^ # slov ^ anotátor ^ odesláno ^ vráceno ^ soubory ^ poznámka ^ ^ data ^ # souborů ^ # vět ^ # slov ^ anotátor ^ odesláno ^ vráceno ^ soubory ^ poznámka ^
-| data_20101008_JP_rijen.zip | 61 | 1000 | 16566 | JP | 8.10.2010 | | ln94200_159 - ln94200_37, ln94200_55 - ln94205_19 | září vynecháno - dovolená | +| data_20101008_JP_rijen.zip | 61 | 1000 | 16566 | JP | 8.10.2010 | 26.10.2010 | ln94200_159 - ln94200_37, ln94200_55 - ln94205_19 | září vynecháno - dovolená | 
-| data_20101011_RO_rijen.zip | 42 | 1020 | 17304 | RO | 11.10.2010 | | cmpr9410_040, lnd94103_064, ln94200_46, ln94205_28 - ln94208_10, mf920925_095 | září vynecháno - dovolená |+| data_20101011_RO_rijen.zip | 42 | 1020 | 17304 | RO | 11.10.2010 | 3.11.2010 | cmpr9410_040, lnd94103_064, ln94200_46, ln94205_28 - ln94208_10, mf920925_095 | září vynecháno - dovolená 
 +| data_20101203_RO_prosinec.zip | 70 | 1020 | 17442 | RO | 3.12.2010 | 1.1.2011 | ln94208_109 - ln95046_044 | listopad vynecháno - práce na anglických datech | 
 +| data_20110103_RO_leden.zip | 28 | 456 | 8566 | RO | 3.1.2011 | 26.1.2011 | ln95046_054 - ln95048_040, ln95048_061, ln95048_071 | cca 550 vět udělal začátkem prosince anglických, ale dostal k tomu plnou dávku prosincových českých dat, tak teď je to o těch 550 vět zkráceno | 
 +| data_20110103_JP_leden.zip | 26 | 599 | 9619 | JP | 3.1.2011 | 27.1.2011 | ln95048_051, ln95048_081 - ln95049_136, mf920922_003, mf920922_013| listopad a prosinec vynecháno - práce na angl. datech; ještě cca 350 vět bude v lednu dělat anglických, takže dostává jen zkrácenou dávku českých; je tam extra dlouhý soubor (220 vět), takže celkem radši mírně pod 1000 vět než přes | 
 + 
 + 
 + 
 +---- 
 + 
 + 
 +==== odsud dál v datech nastavuju atribut src podle anotátora (všechny bridging a nové coref_text šipky) ==== 
 +pozn.: To už jsem nastavil i u starších dat. 
 + 
 +==== etest/dtest (konec prvního, začátek druhého kola anotací) ==== 
 +^ data ^ # souborů ^ # vět ^ # slov ^ anotátor ^ odesláno ^ vráceno ^ soubory ^ poznámka ^ 
 +| data_20110128_RO_unor.zip | 60 | 989 | 16932 | RO | 28.1.2011 | 27.2.2011 | první kolo: etest: mf920922_023 - mf930713_155 (bez mf920925_095), druhé kolo: dtest: cmpr9410_009, cmpr9410_019, ln94200_167 - ln94200_36 |  | 
 + 
 +==== dtest (druhé kolo anotací) ==== 
 +^ data ^ # souborů ^ # vět ^ # slov ^ anotátor ^ odesláno ^ vráceno ^ soubory ^ poznámka ^ 
 +| data_20110128_JP_unor.zip | 43 | 995 | 15459 | JP | 28.1.2011 | 18.2.2011 | cmpr9410_029 - cmpr9415_055 (bez cmpr9415_005), lnd* (bez lnd94103_063), ln94200_103 - ln94200_158, ln94205_90 - ln94206_27 |  | 
 +| rozdelene_po_55_vetach_JP.zip | 24 | 1329 | 25050 | JP | 24.2.2011 | 20.3.2011 | data pro PlayCoref - česká verze Studie v Šarlatové (zhruba půlka), pouze textová koreference | březnová práce pro PlayCoref | 
 +| rozdelene_po_55_vetach_RO.zip | 24 | 1329 | 24775 | RO | 1.3.2011 | 5.4.2011 | data pro PlayCoref - česká verze Studie v Šarlatové (zhruba půlka), pouze textová koreference | březnová práce pro PlayCoref | 
 +| data_20110322_JP_duben.zip | 77 | 998 | 16850 | JP | 22.3.2011 | 3.5.2011 | ln94206_36 až ln95045_038 bez ln94207_36 a bez ln94207_90 |  | 
 +| data_20110401_RO_duben.zip | 68 | 997 | 17381 | RO | 6.4.2011 | 4.5.2011 | ln94200_45 - ln94202_73, ln94202_91 - ln94205_81, mf930713_104 - mf930713_154 bez mf930713_134 |  | 
 +| data_20110501_JP_kveten.zip | 60 | 1014 | 18204 | JP | 11.4.2011 | 30.5.2011 | ln95045_048 - ln95049_085 |  | 
 + 
 +==== dtest/etest (druhé kolo anotací) ==== 
 +^ data ^ # souborů ^ # vět ^ # slov ^ anotátor ^ odesláno ^ vráceno ^ soubory ^ poznámka ^ 
 +| data_20110607_JP_cerven.zip | 77 | 1016 | 16994 | JP | 7.6.2011 | 24.6.2011 | dtest: ln95049_095 - ln95049_135, mf920922_002 - mf930713_093 bez mf930709_052; etest: ln94205_28 - ln94206_82 |  | 
 + 
 +==== etest (druhé kolo anotací) ==== 
 +^ data ^ # souborů ^ # vět ^ # slov ^ anotátor ^ odesláno ^ vráceno ^ soubory ^ poznámka ^ 
 +| data_20110501_RO_kveten.zip | 62 | 1011 | 15947 | RO | 11.4.2011 | 6.6.2011 | cmpr* bez cmpr9410_040, lnd* bez lnd94103_064, ln94200_104 - ln94203_119 bez ln94200_46 |  | 
 +| data_20110609_RO_cerven.zip | 60 | 1144 | 18859 | RO | 9.6.2011 | 15.8.2011 | ln94203_128 - ln94205_19, ln95048_051, ln95048_081 - ln95049_136, mf920922_003, mf920922_013 |  | 
 +| data_20110627_JP_cervenec.zip | 57 | 1003 | 17809 | JP | 27.6.2011 | 28.7.2011 | ln94206_91 - ln94211_106 |  | 
 +| data_20110801_JP_srpen.zip | 58 | 1017 | 18656 | JP | 1.8.2011 | 1.9.2011 | ln94211_115 - ln95048_071 (bez ln95048_051), mf920922_013, mf920922_023 |  | 
 +| data_20110829_JP_zari.zip | 53 | 746 | 12834 | JP | 29.8.2011 | - | mf920922_033 - mf930713_155 (bez mf920925_095) |  |
  

[ Back to the navigation ] [ Back to the content ]