Differences
This shows you the differences between two versions of the page.
Both sides previous revision Previous revision Next revision | Previous revision Next revision Both sides next revision | ||
prehled-o-anotovanych-datech [2010/04/02 14:22] ufal |
prehled-o-anotovanych-datech [2011/03/22 14:43] ufal |
||
---|---|---|---|
Line 155: | Line 155: | ||
^ data ^ # souborů ^ # vět ^ # slov ^ anotátor ^ odesláno ^ vráceno ^ soubory ^ poznámka ^ | ^ data ^ # souborů ^ # vět ^ # slov ^ anotátor ^ odesláno ^ vráceno ^ soubory ^ poznámka ^ | ||
| data_20091209_prosinec_JP.zip | 67 | 1002 | 15872 | JP | 9.12.2009 | 21.12.2009 | train-8: mf920922_001 - mf930713_163, | | data_20091209_prosinec_JP.zip | 67 | 1002 | 15872 | JP | 9.12.2009 | 21.12.2009 | train-8: mf920922_001 - mf930713_163, | ||
+ | |||
Line 174: | Line 175: | ||
| data_20100201_unor_RO.zip | 70 | 1007 | 17032 | RO | 1.2.2010 | 2.3.2010 | ln94211_111 - ln95049_022 | | | | data_20100201_unor_RO.zip | 70 | 1007 | 17032 | RO | 1.2.2010 | 2.3.2010 | ln94211_111 - ln95049_022 | | | ||
- | + | ==== Train-6/7 ==== | |
- | + | ||
- | + | ||
- | + | ||
- | .==== Train-6/7 ==== | + | |
^ data ^ # souborů ^ # vět ^ # slov ^ anotátor ^ odesláno ^ vráceno ^ soubory ^ poznámka ^ | ^ data ^ # souborů ^ # vět ^ # slov ^ anotátor ^ odesláno ^ vráceno ^ soubory ^ poznámka ^ | ||
Line 195: | Line 192: | ||
| data_20100303_RO_brezen.zip | 52 | 985 | 15663 | RO | 3.3.2010 | 28.3.2010 | cmpr*, lnd*, ln94200_101 - ln94200_98, ln94210_95, mf930709_101 | | | | data_20100303_RO_brezen.zip | 52 | 985 | 15663 | RO | 3.3.2010 | 28.3.2010 | cmpr*, lnd*, ln94200_101 - ln94200_98, ln94210_95, mf930709_101 | | | ||
| data_20100309_JP_duben.zip | 64 | 1005 | 17596 | JP | 9.3.2010 | 2.4.2010 | ln94202_106 - ln94206_143 | | | | data_20100309_JP_duben.zip | 64 | 1005 | 17596 | JP | 9.3.2010 | 2.4.2010 | ln94202_106 - ln94206_143 | | | ||
- | | data_20100328_RO_duben.zip | 61 | 1010 | 16932 | RO | 28.3.2010 | - | ln94206_143 - ln94210_68 | | | + | | data_20100328_RO_duben.zip | 61 | 1010 | 16932 | RO | 28.3.2010 | 3.5.2010 |
- | | data_20100402_JP_kveten.zip | 74 | 1012 | 16659 | JP | 2.4.2010 | - | ln9420, ln94210_77, ln94210_86, ln94211_103 - ln95049_033 | | | + | | data_20100402_JP_kveten.zip | 74 | 1012 | 16659 | JP | 2.4.2010 | 23.4.2010 |
+ | |||
+ | ==== Train-7/ | ||
+ | |||
+ | ^ data ^ # souborů ^ # vět ^ # slov ^ anotátor ^ odesláno ^ vráceno ^ soubory ^ poznámka ^ | ||
+ | | data_201000423_JP_cerven.zip | 73 | 1022 | 17435 | JP | 23.4.2010 | 19.5.2010 | ln95049_043 - mf930709_091, | ||
+ | |||
+ | ==== dtest ==== | ||
+ | |||
+ | ^ data ^ # souborů ^ # vět ^ # slov ^ anotátor ^ odesláno ^ vráceno ^ soubory ^ poznámka ^ | ||
+ | | data_201000505_RO_kveten.zip | 39 | 1002 | 15764 | RO | 5.5.2010 | 22.6.2010 | cmpr9410_029 - cmpr9415_055, | ||
+ | | data_201000521_JP_cervenec.zip | 67 | 1003 | 17623 | JP | 21.5.2010 | 27.9.2010 | ln94200_167 - ln94202_73, ln94202_91 - ln94205_81 | | | ||
+ | | 20100521_mereni_jistoty.zip | 2 | 190 | 2802 | JP, RO | 21.5.2010 | JP: 19.8.2010, RO: 8.6.2010 | ln94207_36, mf930709_052 | | | ||
+ | | data_20100623_RO_cerven.zip | 52 | 839 | 14539 | RO | 23.6.2010 | 30.7.2010 | ln94205_90 - ln94207_27, ln94207_45 - ln94207_81, ln94208_1 - ln94209_76 | souborů je míň kvůli předchozímu měření jistoty | | ||
+ | | data_20100802_RO_cervenec.zip | 74 | 1036 | 18828 | RO | 2.8.2010 | 31.8.2010 | ln94209_85 - ln95048_050 | | | ||
+ | | data_20100903_RO_srpen.zip | 75 | 1000 | 16287 | RO | 3.9.2010 | - | ln94209_85 - ln95048_050 | | | ||
+ | |||
+ | ==== dtest/etest ==== | ||
+ | |||
+ | ^ data ^ # souborů ^ # vět ^ # slov ^ anotátor ^ odesláno ^ vráceno ^ soubory ^ poznámka ^ | ||
+ | | data_20100927_JP_srpen.zip | 44 | 813 | 11961 | JP | 29.9.2010 | 8.10.2010 | dtest: mf930713_104 - mf930713_124, | ||
+ | |||
+ | |||
+ | ==== etest ==== | ||
+ | ^ data ^ # souborů ^ # vět ^ # slov ^ anotátor ^ odesláno ^ vráceno ^ soubory ^ poznámka ^ | ||
+ | | data_20101008_JP_rijen.zip | 61 | 1000 | 16566 | JP | 8.10.2010 | 26.10.2010 | ln94200_159 - ln94200_37, ln94200_55 - ln94205_19 | září vynecháno - dovolená | | ||
+ | | data_20101011_RO_rijen.zip | 42 | 1020 | 17304 | RO | 11.10.2010 | 3.11.2010 | cmpr9410_040, | ||
+ | | data_20101203_RO_prosinec.zip | 70 | 1020 | 17442 | RO | 3.12.2010 | 1.1.2011 | ln94208_109 - ln95046_044 | listopad vynecháno - práce na anglických datech | | ||
+ | | data_20110103_RO_leden.zip | 28 | 456 | 8566 | RO | 3.1.2011 | 26.1.2011 | ln95046_054 - ln95048_040, | ||
+ | | data_20110103_JP_leden.zip | 26 | 599 | 9619 | JP | 3.1.2011 | 27.1.2011 | ln95048_051, | ||
+ | |||
+ | |||
+ | |||
+ | ---- | ||
+ | |||
+ | |||
+ | ==== odsud dál v datech nastavuju atribut src podle anotátora (všechny bridging a coref_text šipky) ==== | ||
+ | |||
+ | ==== etest/dtest (konec prvního, začátek druhého kola anotací) ==== | ||
+ | ^ data ^ # souborů ^ # vět ^ # slov ^ anotátor ^ odesláno ^ vráceno ^ soubory ^ poznámka ^ | ||
+ | | data_20110128_RO_unor.zip | 60 | 989 | 16932 | RO | 28.1.2011 | 27.2.2011 | první kolo: etest: mf920922_023 - mf930713_155 (bez mf920925_095), | ||
+ | |||
+ | ==== dtest (druhé kolo anotací) ==== | ||
+ | ^ data ^ # souborů ^ # vět ^ # slov ^ anotátor ^ odesláno ^ vráceno ^ soubory ^ poznámka ^ | ||
+ | | data_20110128_JP_unor.zip | 43 | 995 | 15459 | JP | 28.1.2011 | 18.2.2011 | cmpr9410_029 - cmpr9415_055 (bez cmpr9415_005), | ||
+ | | rozdelene_po_55_vetach_JP.zip | 24 | 1329 | 25050 | JP | 24.2.2011 | - | data pro PlayCoref - česká verze Studie v Šarlatové (zhruba půlka), pouze textová koreference | březnová práce pro PlayCoref | | ||
+ | | rozdelene_po_55_vetach_RO.zip | 24 | 1329 | 24775 | RO | 1.3.2011 | - | data pro PlayCoref - česká verze Studie v Šarlatové (zhruba půlka), pouze textová koreference | březnová práce pro PlayCoref | | ||
+ | | data_20110322_JP_duben.zip | 77 | 998 | 16850 | JP | 22.3.2011 | - | ln94206_36 až ln95045_038 bez ln94207_36 a bez ln94207_90 | | ||