[ Skip to the content ]

Institute of Formal and Applied Linguistics Wiki


[ Back to the navigation ]

Differences

This shows you the differences between two versions of the page.

Link to this comparison view

Both sides previous revision Previous revision
Last revision Both sides next revision
user:zeman:treebanks:ta [2012/03/22 10:43]
zeman Links to publications.
user:zeman:treebanks:ta [2012/03/22 10:49]
zeman Sample.
Line 50: Line 50:
 ==== Sample ==== ==== Sample ====
  
-The first two sentences of the CoNLL 2006 training data:+The first sentence of the CoNLL version of training data:
  
-| 1 | غِيابُ_giyAbu غِياب_giyAb | N | case=1<nowiki>|</nowiki>def=R ExD | _ | _ | +| 1 | cennai cennai | N | <nowiki>NEN-3SN--</nowiki> | <nowiki>Cas=N|Per=3|Num=S|Gen=N</nowiki>AAdjn <nowiki>_</nowiki> <nowiki>_</nowiki> 
-| 2 | فُؤاد_fu&Ad فُؤاد_fu&Ad | _ | Atr | _ | _ | +| 2 | arukE arukE <nowiki>PP-------</nowiki> <nowiki>_</nowiki> 18 AuxP <nowiki>_</nowiki> <nowiki>_</nowiki> 
-| 3 | كَنْعان_kanoEAn كَنْعان_kanoEAn | Atr | _ | _ | +| 3 | sri sri <nowiki>NEN-3SN--</nowiki> <nowiki>Cas=N|Per=3|Num=S|Gen=N</nowiki> | 4 | Atr | <nowiki>_</nowiki> <nowiki>_</nowiki> 
-| |||||||||| +perumpuTUril perumpuTUr <nowiki>NEL-3SN--</nowiki> <nowiki>Cas=L|Per=3|Num=S|Gen=N</nowiki> 18 | AAdjn | <nowiki>_</nowiki> | <nowiki>_</nowiki> 
-فُؤاد_fu&Ad فُؤاد_fu&Ad | Atr | _ | _ | +kirIn kirIn <nowiki>NEN-3SN--</nowiki> <nowiki>Cas=N|Per=3|Num=S|Gen=N</nowiki> | 6 | Atr | <nowiki>_</nowiki> <nowiki>_</nowiki> 
-كَنْعان_kanoEAn كَنْعان_kanoEAn Sb | _ | _ | +pIltu pIltu <nowiki>NEN-3SN--</nowiki> <nowiki>Cas=N|Per=3|Num=S|Gen=N</nowiki> | 11 | Atr | <nowiki>_</nowiki> <nowiki>_</nowiki> 
-،_, ،_, | _ | | AuxG | _ | _ | +<nowiki>(</nowiki> <nowiki>(</nowiki> <nowiki>Z:-------</nowiki> <nowiki>_</nowiki> | AuxG | <nowiki>_</nowiki> <nowiki>_</nowiki> 
-رائِد_rA}id رائِد_rA}id | _ | | Atr | _ | _ | +wavIna wavInam <nowiki>JJ-------</nowiki> <nowiki>_</nowiki> | Atr | <nowiki>_</nowiki> <nowiki>_</nowiki> 
-القِصَّة_AlqiS~ap قِصَّة_qiS~ap N | N gen=F<nowiki>|</nowiki>num=S<nowiki>|</nowiki>def=D Atr | _ | _ | +<nowiki>)</nowiki> <nowiki>)</nowiki> | <nowiki>Z:-------</nowiki> <nowiki>_</nowiki>AuxG <nowiki>_</nowiki> <nowiki>_</nowiki> 
-القَصِيرَةِ_AlqaSiyrapi قَصِير_qaSiyr A | gen=F<nowiki>|</nowiki>num=S<nowiki>|</nowiki>case=2<nowiki>|</nowiki>def=D | | Atr | _ | _ | +10 vimAna vimAnam | <nowiki>NO--3SN--</nowiki> | <nowiki>Per=3|Num=S|Gen=N</nowiki> | 11 | Atr | <nowiki>_</nowiki> <nowiki>_</nowiki> 
-فِي_fiy فِي_fiy | _ | AuxP | _ | _ | +| 11 | wilaiyaTTukkukk | wilaiyam | N <nowiki>NND-3SN--</nowiki> | <nowiki>Cas=D|Per=3|Num=S|Gen=N</nowiki> | 12 | Atr | <nowiki>_</nowiki> <nowiki>_</nowiki> 
-لُبْنانِ_lubonAni لُبْنان_lubonAn case=2<nowiki>|</nowiki>def=R Atr | _ | _ | +12 Ana Aku <nowiki>Tg-------</nowiki> <nowiki>_</nowiki> 13 Atr <nowiki>_</nowiki> <nowiki>_</nowiki> 
-رَحَلَ_raHala رَحَل-َ_raHal-V | VP pers=3<nowiki>|</nowiki>gen=M<nowiki>|</nowiki>num=S | Pred | _ | _ | +13 wilam wilam <nowiki>NNN-3SN--</nowiki> | <nowiki>Cas=N|Per=3|Num=S|Gen=N</nowiki>18 Sb <nowiki>_</nowiki> <nowiki>_</nowiki> 
-10 مَساءَ_masA'مَساء_masA' | _ | Adv | _ | _ | +14 yArukkum yAr | R | <nowiki>RBD-3SA--</nowiki> <nowiki>Cas=D|Per=3|Num=S|Gen=A</nowiki> | 15 | Atr | <nowiki>_</nowiki> <nowiki>_</nowiki> | 
-11 أَمْسِ_>amosi أَمْسِ_>amosi 10 Atr | _ | _ | +| 15 | pATippu | pATippu | N | <nowiki>NNN-3SN--</nowiki> | <nowiki>Cas=N|Per=3|Num=S|Gen=N</nowiki> 16 Comp | <nowiki>_</nowiki> <nowiki>_</nowiki> 
-12 عَن_Ean عَن_Ean | P | AuxP | _ | _ | +16 illATa il <nowiki>PP-------</nowiki> <nowiki>_</nowiki> 17 AuxP <nowiki>_</nowiki> <nowiki>_</nowiki> 
-13 81_81 81_81 12 Adv | _ | _ | +17 vakaiyil | vakai | N | <nowiki>NNL-3SN--</nowiki> | <nowiki>Cas=L|Per=3|Num=S|Gen=N</nowiki> | 18 | AAdjn | <nowiki>_</nowiki> | <nowiki>_</nowiki> | 
-14 عاماً_EAmAF عام_EAm | N | N | gen=M<nowiki>|</nowiki>num=S<nowiki>|</nowiki>case=4<nowiki>|</nowiki>def=13 Atr | _ | _ | +18 etukkap etu <nowiki>Vu-T---AA</nowiki> | <nowiki>Ten=T|Voi=A|Neg=A</nowiki> | 20 | Obj | <nowiki>_</nowiki> <nowiki>_</nowiki> 
-15 ._._. | | _ | 0 | AuxK | _ | _ |+19 patum patu <nowiki>VR-F3SNPA</nowiki> | <nowiki>Ten=F|Per=3|Num=S|Gen=N|Voi=P|Neg=A</nowiki> 18 AuxV <nowiki>_</nowiki> <nowiki>_</nowiki> 
 +20 enRu en <nowiki>Tt-T----A</nowiki> <nowiki>Ten=T|Neg=A</nowiki> 23 AuxC | <nowiki>_</nowiki> <nowiki>_</nowiki> 
 +21 muTalvar muTalvar | N | <nowiki>NNN-3SH--</nowiki> | <nowiki>Cas=N|Per=3|Num=S|Gen=H</nowiki> | 22 | Atr <nowiki>_</nowiki> | <nowiki>_</nowiki>
 +| 22 | karuNAwiTi | karuNAwiTi | N | <nowiki>NEN-3SH--</nowiki> | <nowiki>Cas=N|Per=3|Num=S|Gen=H</nowiki> | 23 | Sb | <nowiki>_</nowiki> <nowiki>_</nowiki> 
 +| 23 | uRuTiyaLiTT | uRuTiyaLi | V <nowiki>Vt-T---AA</nowiki> | <nowiki>Ten=T|Voi=A|Neg=A</nowiki> 0 | Pred | <nowiki>_</nowiki> <nowiki>_</nowiki> 
 +24 uLLAr | uL | V | <nowiki>VR-T3SHAA</nowiki> | <nowiki>Ten=T|Per=3|Num=S|Gen=H|Voi=A|Neg=A</nowiki> | 23 | AuxV | <nowiki>_</nowiki> <nowiki>_</nowiki>
 +| 25 | <nowiki>.</nowiki> <nowiki>.</nowiki> <nowiki>Z#-------</nowiki> | <nowiki>_</nowiki> | 0 | AuxK | <nowiki>_</nowiki> <nowiki>_</nowiki> |
  
-The first sentence of the CoNLL 2006 test data:+The first sentence of the CoNLL version of test data:
  
-| 1 | اِتِّفاقٌ_Ait~ifAqN اِتِّفاق_Ait~ifAq | N | N | case=1<nowiki>|</nowiki>def=ExD _ | _ | +| 1 | pikAr pikAr | N | <nowiki>NEN-3SN--</nowiki> | <nowiki>Cas=N|Per=3|Num=S|Gen=N</nowiki> | 2 | Atr <nowiki>_</nowiki> | <nowiki>_</nowiki>
-| 2 | بَيْنَ_bayona | بَيْنَ_bayona | P | P | _ | 1 | AuxP | _ | _ | +| 2 | iliruwTu iliruwTu | <nowiki>PP-------</nowiki> | <nowiki>_</nowiki> | 4 | AuxP | <nowiki>_</nowiki> | <nowiki>_</nowiki>
-| 3 | لُبْنانِ_lubonAni | لُبْنان_lubonAn | Z | Z | case=2<nowiki>|</nowiki>def=R | 4 | Atr | _ | _ +ErALamAna ErALamAna | <nowiki>JJ-------</nowiki> | <nowiki>_</nowiki>| Atr | <nowiki>_</nowiki> | <nowiki>_</nowiki>
-| 4 | وَ_wa | وَ_wa | C | C | _ | 2 | Coord | +iLainjarkaL iLainjar | N | <nowiki>NNN-3PA--</nowiki> | <nowiki>Cas=N|Per=3|Num=P|Gen=A</nowiki>| Sb | <nowiki>_</nowiki> <nowiki>_</nowiki> 
-| 5 | سُورِيَّةٍ_suwriy~apK | سُورِيا_suwriyA | Z | Z | gen=F<nowiki>|</nowiki>num=S<nowiki>|</nowiki>case=2<nowiki>|</nowiki>def=I | 4 | Atr | _ | _ | +vElai vElai | N | <nowiki>NNN-3SN--</nowiki> | <nowiki>Cas=N|Per=3|Num=S|Gen=N</nowiki> | 6 | Obj | <nowiki>_</nowiki> | <nowiki>_</nowiki>
-| 6 | عَلَى_EalaY | عَلَى_EalaY | P | P | _ | 1 | AuxP | _ | _ | +TEti TEtu <nowiki>Vt-T---AA</nowiki> | <nowiki>Ten=T|Voi=A|Neg=A</nowiki> | 9 | AAdjn | <nowiki>_</nowiki> | <nowiki>_</nowiki>
-| 7 | رَفْعِ_rafoEi | رَفْع_rafoE | N | N | case=2<nowiki>|</nowiki>def=R | 6 | Atr | _ | _ +| 7 | veLi veLi | <nowiki>JJ-------</nowiki> <nowiki>_</nowiki> | 8 | Atr | <nowiki>_</nowiki> <nowiki>_</nowiki>
-مُسْتَوَى_musotawaY مُسْتَوَى_musotawaY N | _ | 7 | Atr | _ | _ | +| 8 | mAwilangkaLukku mAwilam <nowiki>NND-3PN--</nowiki> | <nowiki>Cas=D|Per=3|Num=P|Gen=N</nowiki> | 9 | AAdjn <nowiki>_</nowiki> <nowiki>_</nowiki> 
-| 9 | التَبادُلِ_AltabAduli | تَبادُل_tabAdul | N | N | case=2<nowiki>|</nowiki>def=D 8 | Atr | _ | _ | +kutipeyarwTu kutipeyar <nowiki>Vt-T---AA</nowiki> | <nowiki>Ten=T|Voi=A|Neg=A</nowiki> | 0 | Pred | <nowiki>_</nowiki> | <nowiki>_</nowiki>
-| 10 | التِجارِيِّ_AltijAriy~i | تِجارِيّ_tijAriy~ | A | A | case=2<nowiki>|</nowiki>def=D | Atr | _ | _ | +10 varukinRanar varu <nowiki>VR-P3PHAA</nowiki> | <nowiki>Ten=P|Per=3|Num=P|Gen=H|Voi=A|Neg=A</nowiki> AuxV | <nowiki>_</nowiki><nowiki>_</nowiki> 
-| 11 | إِلَى_<ilaY | إِلَى_<ilaY P | P | _ | 7 | AuxP | _ | _ | +11 | <nowiki>.</nowiki> <nowiki>.</nowiki> | Z | <nowiki>Z#-------</nowiki> | <nowiki>_</nowiki>AuxK | <nowiki>_</nowiki> | <nowiki>_</nowiki> |
-| 12 | 500_500 | 500_500 | Q | Q | _ | 11 | Atr | _ | _ | +
-| 13 | مِلْيُونِ_miloyuwni | مِلْيُون_miloyuwn | N | N | case=2<nowiki>|</nowiki>def=R | 12 | Atr | _ | _ +
-14 دُولارٍ_duwlArK دُولار_duwlAr | N | N | case=2<nowiki>|</nowiki>def=I | 13 | Atr | _ | _ | +
- +
-The first sentence of the CoNLL 2007 training data: +
- +
-| 1 | تَعْدادُ | تَعْداد_1 | N | N- Case=1<nowiki>|</nowiki>Defin=R | Sb | _ | _ | +
-سُكّانِ ساكِن_1 | N | N| Case=2<nowiki>|</nowiki>Defin=R | 1 | Atr | _ | _ | +
-| 3 | 22 | [DEFAULT] | Q | Q- | _ | 2 | Atr | _ | _ | +
-| 4 | دَوْلَةً | دَوْلَة_1 | N | N- | Gender=F<nowiki>|</nowiki>Number=S<nowiki>|</nowiki>Case=4<nowiki>|</nowiki>Defin=I | 3 | Atr | _ | _ +
-عَرَبِيَّةً عَرَبِيّ_1 A| Gender=F<nowiki>|</nowiki>Number=S<nowiki>|</nowiki>Case=4<nowiki>|</nowiki>Defin=I | 4 | Atr | _ | _ +
-| 6 | سَ | سَ_FUT | F | F- | _ | 7 | AuxM | +
-| 7 | يَرْتَفِعُ | اِرْتَفَع_1 | V | VI | Mood=I<nowiki>|</nowiki>Voice=A<nowiki>|</nowiki>Person=3<nowiki>|</nowiki>Gender=M<nowiki>|</nowiki>Number=S | 0 | Pred | _ | _ +
-| 8 | إِلَى إِلَى_1 P| _ | 7 | AuxP | _ | _ | +
-| 9 | 654 | [DEFAULT] | Q | Q| _ | 8 | Adv | _ | _ | +
-| 10 | مِلْيُونَ | مِلْيُون_1 | N | N- | Case=4<nowiki>|</nowiki>Defin=R | 9 | Atr | _ | _ | +
-11 نَسَمَةٍ نَسَمَة_1 N| Gender=F<nowiki>|</nowiki>Number=S<nowiki>|</nowiki>Case=2<nowiki>|</nowiki>Defin=I | 10 | Atr | _ | _ +
-12 فِي فِي_1 P| _ | 7 | AuxP | _ | _ | +
-| 13 | مُنْتَصَفِ | مُنْتَصَف_1 | N | N- | Case=2<nowiki>|</nowiki>Defin=12 Adv | +
-14 القَرْنِ قَرْن_1 | N | N- | Case=2<nowiki>|</nowiki>Defin=D | 13 | Atr | _ | _ | +
- +
-The first sentence of the CoNLL 2007 test data: +
- +
-مُقاوَمَةُ | مُقاوَمَة_1 | N | N- | Gender=F<nowiki>|</nowiki>Number=S<nowiki>|</nowiki>Case=1<nowiki>|</nowiki>Defin=R 0 | ExD | _ | _ | +
-| 2 | زَواجِ | زَواج_1 | N | N- | Case=2<nowiki>|</nowiki>Defin=R Atr _ | _ | +
-| 3 | الطُلّابِ | طالِب_1 | N | N- | Case=2<nowiki>|</nowiki>Defin=D 2 | Atr | _ | _ | +
-| 4 | العُرْفِيِّ | عُرْفِيّ_1 | A | A- | Case=2<nowiki>|</nowiki>Defin=D | 2 | Atr | _ | _ |+
  
 ==== Parsing ==== ==== Parsing ====

[ Back to the navigation ] [ Back to the content ]