[ Skip to the content ]

Institute of Formal and Applied Linguistics Wiki


[ Back to the navigation ]

Differences

This shows you the differences between two versions of the page.

Link to this comparison view

Both sides previous revision Previous revision
Next revision Both sides next revision
user:zeman:treebanks:hi [2011/12/06 16:32]
zeman Sample training Shakti.
user:zeman:treebanks:hi [2011/12/06 16:51]
zeman Sample training CoNLL.
Line 64: Line 64:
  
 ==== Inside ==== ==== Inside ====
 +
 +  * Broken characters (''\x{FFFD} REPLACEMENT CHARACTER'') in the WX encoding.
 +
 +--
  
 The text uses the [[http://ltrc.iiit.ac.in/nlptools2010/files/documents/map.pdf|WX encoding]] of Indian letters. If we know what the original script is (Bengali in this case) we can map the WX encoding to the original characters in UTF-8. WX uses English letters so if there was embedded English (or other string using Latin letters) it will probably get lost during the conversion. The text uses the [[http://ltrc.iiit.ac.in/nlptools2010/files/documents/map.pdf|WX encoding]] of Indian letters. If we know what the original script is (Bengali in this case) we can map the WX encoding to the original characters in UTF-8. WX uses English letters so if there was embedded English (or other string using Latin letters) it will probably get lost during the conversion.
Line 204: Line 208:
 </Sentence></code> </Sentence></code>
  
-And in the CoNLL format+The same two sentences converted to the CoNLL formatWX characters decoded back to Devanagari in UTF-8:
- +
-| 1 | Agei | Age | NP | NST | lex-Age<nowiki>|</nowiki>cat-adv<nowiki>|</nowiki>gend-<nowiki>|</nowiki>num-<nowiki>|</nowiki>pers-<nowiki>|</nowiki>case-<nowiki>|</nowiki>vib-<nowiki>|</nowiki>tam-<nowiki>|</nowiki>head-Agei<nowiki>|</nowiki>name-NP | 3 | k7t | _ | _ | +
-| 2 | cA | cA | NP | NN | lex-cA<nowiki>|</nowiki>cat-n<nowiki>|</nowiki>gend-<nowiki>|</nowiki>num-sg<nowiki>|</nowiki>pers-<nowiki>|</nowiki>case-d<nowiki>|</nowiki>vib-0<nowiki>|</nowiki>tam-0<nowiki>|</nowiki>head-cA<nowiki>|</nowiki>name-NP2 | 3 | k1 | _ | _ | +
-| 3 | ese | As | VGF | VM | lex-As<nowiki>|</nowiki>cat-v<nowiki>|</nowiki>gend-<nowiki>|</nowiki>num-<nowiki>|</nowiki>pers-5<nowiki>|</nowiki>case-<nowiki>|</nowiki>vib-A_yA+Ce<nowiki>|</nowiki>tam-A<nowiki>|</nowiki>head-ese<nowiki>|</nowiki>name-VGF | 0 | main | _ | _ | +
- +
-And after conversion of the WX encoding to the Bengali script in UTF-8:+
  
-| 1 | আগেই আগে | NP | NST | lex-Age<nowiki>|</nowiki>cat-adv<nowiki>|</nowiki>gend-<nowiki>|</nowiki>num-<nowiki>|</nowiki>pers-<nowiki>|</nowiki>case-<nowiki>|</nowiki>vib-<nowiki>|</nowiki>tam-<nowiki>|</nowiki>head-Agei<nowiki>|</nowiki>name-NP | 3 | k7t | _ | _ | +| 1 | बात बात NN | n | lex-bAwa<nowiki>|</nowiki>cat-n<nowiki>|</nowiki>gend-f<nowiki>|</nowiki>num-sg<nowiki>|</nowiki>pers-3<nowiki>|</nowiki>case-d<nowiki>|</nowiki>vib-0<nowiki>|</nowiki>tam-0<nowiki>|</nowiki>posn-10<nowiki>|</nowiki>name-bAwa<nowiki>|</nowiki>chunkId-NP<nowiki>|</nowiki>chunkType-head:NP | 3 | k1 | _ | _ | 
-| 2 | চা চা | NP | NN | lex-cA<nowiki>|</nowiki>cat-n<nowiki>|</nowiki>gend-<nowiki>|</nowiki>num-sg<nowiki>|</nowiki>pers-<nowiki>|</nowiki>case-d<nowiki>|</nowiki>vib-0<nowiki>|</nowiki>tam-0<nowiki>|</nowiki>head-cA<nowiki>|</nowiki>name-NP2 | 3 | k1 | _ | _ | +| 2 | गलत | गलत | JJ | adj | lex-galawa<nowiki>|</nowiki>cat-adj<nowiki>|</nowiki>gend-any<nowiki>|</nowiki>num-any<nowiki>|</nowiki>pers-<nowiki>|</nowiki>case-any<nowiki>|</nowiki>vib-<nowiki>|</nowiki>tam-<nowiki>|</nowiki>posn-20<nowiki>|</nowiki>name-galawa<nowiki>|</nowiki>chunkId-JJP<nowiki>|</nowiki>chunkType-head:JJP | 3 | k1s | _ | _ | 
-| 3 | এসে আস্ VGF | VM | lex-As<nowiki>|</nowiki>cat-v<nowiki>|</nowiki>gend-<nowiki>|</nowiki>num-<nowiki>|</nowiki>pers-5<nowiki>|</nowiki>case-<nowiki>|</nowiki>vib-A_yA+Ce<nowiki>|</nowiki>tam-A<nowiki>|</nowiki>head-ese<nowiki>|</nowiki>name-VGF | 0 | main | _ | _ |+| 3 | हो | हो | VM | v | lex-ho<nowiki>|</nowiki>cat-v<nowiki>|</nowiki>gend-any<nowiki>|</nowiki>num-any<nowiki>|</nowiki>pers-any<nowiki>|</nowiki>case-<nowiki>|</nowiki>vib-0<nowiki>|</nowiki>tam-0<nowiki>|</nowiki>stype-declarative<nowiki>|</nowiki>posn-30<nowiki>|</nowiki>voicetype-active<nowiki>|</nowiki>name-ho<nowiki>|</nowiki>chunkId-VGF<nowiki>|</nowiki>chunkType-head:VGF | 11 | vmod | _ | _ | 
 +| 4 | तो | तो | CC | avy | lex-wo<nowiki>|</nowiki>cat-avy<nowiki>|</nowiki>gend-<nowiki>|</nowiki>num-<nowiki>|</nowiki>pers-<nowiki>|</nowiki>case-<nowiki>|</nowiki>vib-<nowiki>|</nowiki>tam-<nowiki>|</nowiki>posn-40<nowiki>|</nowiki>name-wo<nowiki>|</nowiki>chunkId-CCP<nowiki>|</nowiki>chunkType-head:CCP | 0 | main | _ | _ | 
 +| 5 | गुस्सा | गुस्सा | NN | n | lex-gussA<nowiki>|</nowiki>cat-n<nowiki>|</nowiki>gend-m<nowiki>|</nowiki>num-sg<nowiki>|</nowiki>pers-3<nowiki>|</nowiki>case-d<nowiki>|</nowiki>vib-0<nowiki>|</nowiki>tam-0<nowiki>|</nowiki>posn-50<nowiki>|</nowiki>name-gussA<nowiki>|</nowiki>chunkId-NP2<nowiki>|</nowiki>chunkType-head:NP2 | 9 | pof | _ | _ | 
 +| 6 | सेलेब्रिटिज | सेलेब्रिटिज | NN | unk | lex-selebritija<nowiki>|</nowiki>cat-unk<nowiki>|</nowiki>gend-<nowiki>|</nowiki>num-<nowiki>|</nowiki>pers-<nowiki>|</nowiki>case-<nowiki>|</nowiki>vib-0_ko<nowiki>|</nowiki>tam-<nowiki>|</nowiki>posn-60<nowiki>|</nowiki>vpos-vib_2_RP<nowiki>|</nowiki>name-selebritija<nowiki>|</nowiki>chunkId-NP3<nowiki>|</nowiki>chunkType-head:NP3 | 9 | k4a | _ | _ | 
 +| 7 | को | को | PSP | psp | lex-ko<nowiki>|</nowiki>cat-psp<nowiki>|</nowiki>gend-<nowiki>|</nowiki>num-<nowiki>|</nowiki>pers-<nowiki>|</nowiki>case-<nowiki>|</nowiki>vib-<nowiki>|</nowiki>tam-<nowiki>|</nowiki>posn-70<nowiki>|</nowiki>chunkType-child:NP3<nowiki>|</nowiki>name-ko | 6 | lwg__psp | _ | _ | 
 +| 8 | भी | भी | RP | avy | lex-BI<nowiki>|</nowiki>cat-avy<nowiki>|</nowiki>gend-<nowiki>|</nowiki>num-<nowiki>|</nowiki>pers-<nowiki>|</nowiki>case-<nowiki>|</nowiki>vib-<nowiki>|</nowiki>tam-<nowiki>|</nowiki>posn-80<nowiki>|</nowiki>chunkType-child:NP3<nowiki>|</nowiki>name-BI | 6 | lwg__rp | _ | _ | 
 +| 9 | आना | आ | VM | v | lex-A<nowiki>|</nowiki>cat-v<nowiki>|</nowiki>gend-any<nowiki>|</nowiki>num-any<nowiki>|</nowiki>pers-any<nowiki>|</nowiki>case-d<nowiki>|</nowiki>vib-nA<nowiki>|</nowiki>tam-nA<nowiki>|</nowiki>posn-90<nowiki>|</nowiki>name-AnA<nowiki>|</nowiki>chunkId-VGNN<nowiki>|</nowiki>chunkType-head:VGNN | 11 | k1 | _ | _ | 
 +| 10 | लाजमी | लाजमी | JJ | adj | lex-lAjamI<nowiki>|</nowiki>cat-adj<nowiki>|</nowiki>gend-any<nowiki>|</nowiki>num-any<nowiki>|</nowiki>pers-<nowiki>|</nowiki>case-<nowiki>|</nowiki>vib-<nowiki>|</nowiki>tam-<nowiki>|</nowiki>posn-100<nowiki>|</nowiki>name-lAjamI<nowiki>|</nowiki>chunkId-JJP2<nowiki>|</nowiki>chunkType-head:JJP2 | 11 | pof | _ | _ | 
 +| 11 | है | है | VM | v | lex-hE<nowiki>|</nowiki>cat-v<nowiki>|</nowiki>gend-any<nowiki>|</nowiki>num-sg<nowiki>|</nowiki>pers-3<nowiki>|</nowiki>case-<nowiki>|</nowiki>vib-hE<nowiki>|</nowiki>tam-hE<nowiki>|</nowiki>stype-declarative<nowiki>|</nowiki>posn-110<nowiki>|</nowiki>voicetype-active<nowiki>|</nowiki>name-hE<nowiki>|</nowiki>chunkId-VGF2<nowiki>|</nowiki>chunkType-head:VGF2 | 4 | ccof | _ | _ | 
 +| 12 | . | . | SYM | punc | lex-.<nowiki>|</nowiki>cat-punc<nowiki>|</nowiki>gend-<nowiki>|</nowiki>num-<nowiki>|</nowiki>pers-<nowiki>|</nowiki>case-<nowiki>|</nowiki>vib-<nowiki>|</nowiki>tam-<nowiki>|</nowiki>posn-120<nowiki>|</nowiki>chunkType-child:VGF2<nowiki>|</nowiki>name-. | 11 | rsym | _ | _ | 
 +| |||||||||| 
 +| |||||||||| 
 +| 1 | बृहस्पतिवार | बृहस्पतिवार | NNP | n | lex-bqhaspawivAra<nowiki>|</nowiki>cat-n<nowiki>|</nowiki>gend-m<nowiki>|</nowiki>num-sg<nowiki>|</nowiki>pers-3<nowiki>|</nowiki>case-o<nowiki>|</nowiki>vib-0_ko<nowiki>|</nowiki>tam-0<nowiki>|</nowiki>posn-10<nowiki>|</nowiki>vpos-vib_2<nowiki>|</nowiki>name-bqhaspawivAra<nowiki>|</nowiki>chunkId-NP<nowiki>|</nowiki>chunkType-head:NP | 6 | k7t | _ | _ | 
 +| 2 | को को PSP | psp | lex-ko<nowiki>|</nowiki>cat-psp<nowiki>|</nowiki>gend-<nowiki>|</nowiki>num-<nowiki>|</nowiki>pers-<nowiki>|</nowiki>case-<nowiki>|</nowiki>vib-<nowiki>|</nowiki>tam-<nowiki>|</nowiki>posn-20<nowiki>|</nowiki>chunkType-child:NP<nowiki>|</nowiki>name-ko | 1 | lwg__psp | _ | _ | 
 +| 3 | ज़ी | जी | NNP | n | lex-jI<nowiki>|</nowiki>cat-n<nowiki>|</nowiki>gend-m<nowiki>|</nowiki>num-sg<nowiki>|</nowiki>pers-3<nowiki>|</nowiki>case-o<nowiki>|</nowiki>vib-0_meM<nowiki>|</nowiki>tam-0<nowiki>|</nowiki>posn-30<nowiki>|</nowiki>vpos-vib_2<nowiki>|</nowiki>name-jZI<nowiki>|</nowiki>chunkId-NP2<nowiki>|</nowiki>chunkType-head:NP2 | 6 | k7 | _ | _ | 
 +| 4 | में | में | PSP | psp | lex-meM<nowiki>|</nowiki>cat-psp<nowiki>|</nowiki>gend-<nowiki>|</nowiki>num-<nowiki>|</nowiki>pers-<nowiki>|</nowiki>case-<nowiki>|</nowiki>vib-<nowiki>|</nowiki>tam-<nowiki>|</nowiki>posn-40<nowiki>|</nowiki>chunkType-child:NP2<nowiki>|</nowiki>name-meM | 3 | lwg__psp | _ | _ | 
 +| 5 | शुरू | शुरू | NN | n | lex-SurU<nowiki>|</nowiki>cat-n<nowiki>|</nowiki>gend-m<nowiki>|</nowiki>num-sg<nowiki>|</nowiki>pers-3<nowiki>|</nowiki>case-d<nowiki>|</nowiki>vib-0<nowiki>|</nowiki>tam-0<nowiki>|</nowiki>posn-50<nowiki>|</nowiki>name-SurU<nowiki>|</nowiki>chunkId-NP3<nowiki>|</nowiki>chunkType-head:NP3 | 6 | pof | _ | _ | 
 +| 6 | हुए | हो | VM | v | lex-ho<nowiki>|</nowiki>cat-v<nowiki>|</nowiki>gend-m<nowiki>|</nowiki>num-sg<nowiki>|</nowiki>pers-any<nowiki>|</nowiki>case-<nowiki>|</nowiki>vib-eM<nowiki>|</nowiki>tam-eM<nowiki>|</nowiki>posn-60<nowiki>|</nowiki>name-hue<nowiki>|</nowiki>chunkId-VGNF<nowiki>|</nowiki>chunkType-head:VGNF | 10 | nmod__k1inv | _ | _ | 
 +| 7 | ��वें | ��वें | XC | n | lex-��veM<nowiki>|</nowiki>cat-n<nowiki>|</nowiki>gend-m<nowiki>|</nowiki>num-sg<nowiki>|</nowiki>pers-3<nowiki>|</nowiki>case-d<nowiki>|</nowiki>vib-0<nowiki>|</nowiki>tam-0<nowiki>|</nowiki>posn-70<nowiki>|</nowiki>chunkType-child:NP4<nowiki>|</nowiki>name-��veM | 10 | mod | _ | _ | 
 +8 | अंतर्राष्ट्रीय | अंतर्राष्ट्रीय | XC | n | lex-aMwarrARtrIya<nowiki>|</nowiki>cat-n<nowiki>|</nowiki>gend-m<nowiki>|</nowiki>num-sg<nowiki>|</nowiki>pers-3<nowiki>|</nowiki>case-d<nowiki>|</nowiki>vib-0<nowiki>|</nowiki>tam-0<nowiki>|</nowiki>posn-80<nowiki>|</nowiki>chunkType-child:NP4<nowiki>|</nowiki>name-aMwarrARtrIya | 10 | mod | _ | _ | 
 +| 9 | फिल्म | फिल्म | XC | n | lex-Pilma<nowiki>|</nowiki>cat-n<nowiki>|</nowiki>gend-f<nowiki>|</nowiki>num-sg<nowiki>|</nowiki>pers-3<nowiki>|</nowiki>case-d<nowiki>|</nowiki>vib-0<nowiki>|</nowiki>tam-0<nowiki>|</nowiki>posn-90<nowiki>|</nowiki>chunkType-child:NP4<nowiki>|</nowiki>name-Pilma | 10 | mod | _ | _ | 
 +| 10 | महोत्सव | महोत्सव | NNP | n | lex-mahowsava<nowiki>|</nowiki>cat-n<nowiki>|</nowiki>gend-m<nowiki>|</nowiki>num-sg<nowiki>|</nowiki>pers-<nowiki>|</nowiki>case-o<nowiki>|</nowiki>vib-0_kA<nowiki>|</nowiki>tam-0<nowiki>|</nowiki>posn-100<nowiki>|</nowiki>vpos-vib_5<nowiki>|</nowiki>name-mahowsava<nowiki>|</nowiki>chunkId-NP4<nowiki>|</nowiki>chunkType-head:NP4 | 12 | r6 | _ | _ | 
 +| 11 | के | का | PSP | psp | lex-kA<nowiki>|</nowiki>cat-psp<nowiki>|</nowiki>gend-m<nowiki>|</nowiki>num-sg<nowiki>|</nowiki>pers-<nowiki>|</nowiki>case-o<nowiki>|</nowiki>vib-<nowiki>|</nowiki>tam-<nowiki>|</nowiki>posn-110<nowiki>|</nowiki>chunkType-child:NP4<nowiki>|</nowiki>name-ke | 10 | lwg__psp | _ | _ | 
 +| 12 | रंग | रंग | NN | n | lex-raMga<nowiki>|</nowiki>cat-n<nowiki>|</nowiki>gend-m<nowiki>|</nowiki>num-sg<nowiki>|</nowiki>pers-3<nowiki>|</nowiki>case-o<nowiki>|</nowiki>vib-0_meM<nowiki>|</nowiki>tam-0<nowiki>|</nowiki>posn-120<nowiki>|</nowiki>vpos-vib_2<nowiki>|</nowiki>name-raMga<nowiki>|</nowiki>chunkId-NP5<nowiki>|</nowiki>chunkType-head:NP5 | 17 | k7 | _ | _ | 
 +| 13 | में | में | PSP | psp | lex-meM<nowiki>|</nowiki>cat-psp<nowiki>|</nowiki>gend-<nowiki>|</nowiki>num-<nowiki>|</nowiki>pers-<nowiki>|</nowiki>case-<nowiki>|</nowiki>vib-<nowiki>|</nowiki>tam-<nowiki>|</nowiki>posn-130<nowiki>|</nowiki>chunkType-child:NP5<nowiki>|</nowiki>name-meM2 | 12 | lwg__psp | _ | _ | 
 +| 14 | भंग | भंग | JJ | adj | lex-BaMga<nowiki>|</nowiki>cat-adj<nowiki>|</nowiki>gend-any<nowiki>|</nowiki>num-any<nowiki>|</nowiki>pers-<nowiki>|</nowiki>case-any<nowiki>|</nowiki>vib-<nowiki>|</nowiki>tam-<nowiki>|</nowiki>posn-140<nowiki>|</nowiki>name-BaMga<nowiki>|</nowiki>chunkId-JJP<nowiki>|</nowiki>chunkType-head:JJP | 17 | pof | _ | _ | 
 +| 15 | उस | वह | DEM | pn | lex-vaha<nowiki>|</nowiki>cat-pn<nowiki>|</nowiki>gend-any<nowiki>|</nowiki>num-sg<nowiki>|</nowiki>pers-3<nowiki>|</nowiki>case-o<nowiki>|</nowiki>vib-<nowiki>|</nowiki>tam-<nowiki>|</nowiki>posn-150<nowiki>|</nowiki>chunkType-child:NP6<nowiki>|</nowiki>name-usa | 16 | nmod__adj | _ | _ | 
 +| 16 | समय | समय | NN | n | lex-samaya<nowiki>|</nowiki>cat-n<nowiki>|</nowiki>gend-any<nowiki>|</nowiki>num-sg<nowiki>|</nowiki>pers-3<nowiki>|</nowiki>case-d<nowiki>|</nowiki>vib-0<nowiki>|</nowiki>tam-0<nowiki>|</nowiki>posn-160<nowiki>|</nowiki>name-samaya<nowiki>|</nowiki>chunkId-NP6<nowiki>|</nowiki>chunkType-head:NP6 | 17 | k7t | _ | _ | 
 +| 17 | पड़ा | पड | VM | v | lex-pada<nowiki>|</nowiki>cat-v<nowiki>|</nowiki>gend-any<nowiki>|</nowiki>num-any<nowiki>|</nowiki>pers-any<nowiki>|</nowiki>case-<nowiki>|</nowiki>vib-yA<nowiki>|</nowiki>tam-yA<nowiki>|</nowiki>stype-declarative<nowiki>|</nowiki>posn-170<nowiki>|</nowiki>voicetype-active<nowiki>|</nowiki>name-padZA<nowiki>|</nowiki>chunkId-VGF<nowiki>|</nowiki>chunkType-head:VGF | 0 | main | _ | _ | 
 +| 18 | जब | जब | PRP | pn | lex-jaba<nowiki>|</nowiki>cat-pn<nowiki>|</nowiki>gend-<nowiki>|</nowiki>num-<nowiki>|</nowiki>pers-<nowiki>|</nowiki>case-<nowiki>|</nowiki>vib-<nowiki>|</nowiki>tam-<nowiki>|</nowiki>posn-180<nowiki>|</nowiki>coref-samaya<nowiki>|</nowiki>name-jaba<nowiki>|</nowiki>chunkId-NP7<nowiki>|</nowiki>chunkType-head:NP7 | 32 | k7t | _ | _ | 
 +| 19 | वहां | वहाँ | PRP | pn | lex-vahAz<nowiki>|</nowiki>cat-pn<nowiki>|</nowiki>gend-<nowiki>|</nowiki>num-<nowiki>|</nowiki>pers-<nowiki>|</nowiki>case-<nowiki>|</nowiki>vib-0_para<nowiki>|</nowiki>tam-<nowiki>|</nowiki>posn-190<nowiki>|</nowiki>vpos-vib_2<nowiki>|</nowiki>name-vahAM<nowiki>|</nowiki>chunkId-NP8<nowiki>|</nowiki>chunkType-head:NP8 | 21 | jjmod | _ | _ | 
 +| 20 | पर | पर | PSP | psp | lex-para<nowiki>|</nowiki>cat-psp<nowiki>|</nowiki>gend-<nowiki>|</nowiki>num-<nowiki>|</nowiki>pers-<nowiki>|</nowiki>case-<nowiki>|</nowiki>vib-<nowiki>|</nowiki>tam-<nowiki>|</nowiki>posn-200<nowiki>|</nowiki>chunkType-child:NP8<nowiki>|</nowiki>name-para | 19 | lwg__psp | _ | _ | 
 +| 21 | तैनात | तैनात | JJ | adj | lex-wEnAwa<nowiki>|</nowiki>cat-adj<nowiki>|</nowiki>gend-any<nowiki>|</nowiki>num-any<nowiki>|</nowiki>pers-<nowiki>|</nowiki>case-o<nowiki>|</nowiki>vib-<nowiki>|</nowiki>tam-<nowiki>|</nowiki>posn-210<nowiki>|</nowiki>name-wEnAwa<nowiki>|</nowiki>chunkId-JJP2<nowiki>|</nowiki>chunkType-head:JJP2 | 22 | nmod | _ | _ | 
 +| 22 | सुरक्षाकर्मियों | सुरक्षाकर्मी | NN | n | lex-surakRAkarmI<nowiki>|</nowiki>cat-n<nowiki>|</nowiki>gend-m<nowiki>|</nowiki>num-pl<nowiki>|</nowiki>pers-3<nowiki>|</nowiki>case-o<nowiki>|</nowiki>vib-0_ne<nowiki>|</nowiki>tam-0<nowiki>|</nowiki>posn-220<nowiki>|</nowiki>vpos-vib_2<nowiki>|</nowiki>name-surakRAkarmiyoM<nowiki>|</nowiki>chunkId-NP9<nowiki>|</nowiki>chunkType-head:NP9 | 32 | k1 | _ | _ | 
 +| 23 | ने | ने | PSP | psp | lex-ne<nowiki>|</nowiki>cat-psp<nowiki>|</nowiki>gend-<nowiki>|</nowiki>num-<nowiki>|</nowiki>pers-<nowiki>|</nowiki>case-<nowiki>|</nowiki>vib-<nowiki>|</nowiki>tam-<nowiki>|</nowiki>posn-230<nowiki>|</nowiki>chunkType-child:NP9<nowiki>|</nowiki>name-ne | 22 | lwg__psp | _ | _ | 
 +| 24 | बॉलीवुड | बॉलीवुड | NN | n | lex-bOYlIvuda<nowiki>|</nowiki>cat-n<nowiki>|</nowiki>gend-m<nowiki>|</nowiki>num-sg<nowiki>|</nowiki>pers-3<nowiki>|</nowiki>case-o<nowiki>|</nowiki>vib-0_kA<nowiki>|</nowiki>tam-0<nowiki>|</nowiki>posn-240<nowiki>|</nowiki>vpos-vib_2<nowiki>|</nowiki>name-bOYlIvuda<nowiki>|</nowiki>chunkId-NP10<nowiki>|</nowiki>chunkType-head:NP10 | 28 | r6 | _ | _ | 
 +| 25 | की | का | PSP | psp | lex-kA<nowiki>|</nowiki>cat-psp<nowiki>|</nowiki>gend-f<nowiki>|</nowiki>num-sg<nowiki>|</nowiki>pers-<nowiki>|</nowiki>case-o<nowiki>|</nowiki>vib-<nowiki>|</nowiki>tam-<nowiki>|</nowiki>posn-250<nowiki>|</nowiki>chunkType-child:NP10<nowiki>|</nowiki>name-kI | 24 | lwg__psp | _ | _ | 
 +| 26 | अभिनेत्री | अभिनेत्री | NN | n | lex-aBinewrI<nowiki>|</nowiki>cat-n<nowiki>|</nowiki>gend-f<nowiki>|</nowiki>num-sg<nowiki>|</nowiki>pers-3<nowiki>|</nowiki>case-o<nowiki>|</nowiki>vib-0<nowiki>|</nowiki>tam-0<nowiki>|</nowiki>posn-260<nowiki>|</nowiki>chunkType-child:NP11<nowiki>|</nowiki>name-aBinewrI | 27 | nmod | _ | _ | 
 +| 27 | बिपाशा | बिपाशा | NN | n | lex-bipASA<nowiki>|</nowiki>cat-n<nowiki>|</nowiki>gend-f<nowiki>|</nowiki>num-sg<nowiki>|</nowiki>pers-3<nowiki>|</nowiki>case-d<nowiki>|</nowiki>vib-0<nowiki>|</nowiki>tam-0<nowiki>|</nowiki>posn-270<nowiki>|</nowiki>chunkType-child:NP11<nowiki>|</nowiki>name-bipASA | 28 | nmod | _ | _ | 
 +| 28 | बसु | बसु | NNP | n | lex-basu<nowiki>|</nowiki>cat-n<nowiki>|</nowiki>gend-f<nowiki>|</nowiki>num-sg<nowiki>|</nowiki>pers-3<nowiki>|</nowiki>case-o<nowiki>|</nowiki>vib-0_ke_sAWa<nowiki>|</nowiki>tam-0<nowiki>|</nowiki>posn-280<nowiki>|</nowiki>vpos-vib_vib_vib_4_5<nowiki>|</nowiki>name-basu<nowiki>|</nowiki>chunkId-NP11<nowiki>|</nowiki>chunkType-head:NP11 | 32 | k2 | _ | _ | 
 +| 29 | के | के | PSP | psp | lex-ke<nowiki>|</nowiki>cat-psp<nowiki>|</nowiki>gend-<nowiki>|</nowiki>num-<nowiki>|</nowiki>pers-<nowiki>|</nowiki>case-<nowiki>|</nowiki>vib-<nowiki>|</nowiki>tam-<nowiki>|</nowiki>posn-290<nowiki>|</nowiki>chunkType-child:NP11<nowiki>|</nowiki>name-ke2 | 28 | lwg__psp | _ | _ | 
 +| 30 | साथ | साथ | NST | nst | lex-sAWa<nowiki>|</nowiki>cat-nst<nowiki>|</nowiki>gend-m<nowiki>|</nowiki>num-sg<nowiki>|</nowiki>pers-3<nowiki>|</nowiki>case-d<nowiki>|</nowiki>vib-<nowiki>|</nowiki>tam-<nowiki>|</nowiki>posn-300<nowiki>|</nowiki>chunkType-child:NP11<nowiki>|</nowiki>name-sAWa | 28 | lwg__psp | _ | _ | 
 +| 31 | दुव्यर्वहार | दुव्यर्वहार | NN | n | lex-xuvyarvahAra<nowiki>|</nowiki>cat-n<nowiki>|</nowiki>gend-m<nowiki>|</nowiki>num-sg<nowiki>|</nowiki>pers-3<nowiki>|</nowiki>case-d<nowiki>|</nowiki>vib-0<nowiki>|</nowiki>tam-0<nowiki>|</nowiki>posn-310<nowiki>|</nowiki>name-xuvyarvahAra<nowiki>|</nowiki>chunkId-NP12<nowiki>|</nowiki>chunkType-head:NP12 | 32 | pof | _ | _ | 
 +| 32 | किया | कर | VM | v | lex-kara<nowiki>|</nowiki>cat-v<nowiki>|</nowiki>gend-m<nowiki>|</nowiki>num-sg<nowiki>|</nowiki>pers-any<nowiki>|</nowiki>case-<nowiki>|</nowiki>vib-yA<nowiki>|</nowiki>tam-yA<nowiki>|</nowiki>stype-declarative<nowiki>|</nowiki>posn-320<nowiki>|</nowiki>voicetype-active<nowiki>|</nowiki>name-kiyA<nowiki>|</nowiki>chunkId-VGF2<nowiki>|</nowiki>chunkType-head:VGF2 | 16 | nmod__relc | _ | _ | 
 +| 33 | . | . | SYM | punc | lex-.<nowiki>|</nowiki>cat-punc<nowiki>|</nowiki>gend-<nowiki>|</nowiki>num-<nowiki>|</nowiki>pers-<nowiki>|</nowiki>case-<nowiki>|</nowiki>vib-<nowiki>|</nowiki>tam-<nowiki>|</nowiki>posn-330<nowiki>|</nowiki>chunkType-child:VGF2<nowiki>|</nowiki>name-. | 32 | rsym | _ | _ |
  
 The first sentence of the ICON 2010 development data (with fine-grained syntactic tags) in the Shakti format: The first sentence of the ICON 2010 development data (with fine-grained syntactic tags) in the Shakti format:

[ Back to the navigation ] [ Back to the content ]