[ Skip to the content ]

Institute of Formal and Applied Linguistics Wiki


[ Back to the navigation ]

Morfologická analýza hindštiny

Evidentně existuje vícero nástrojů, ale dlouho bylo těžké se k nim dostat a rozchodit je. Hajdarábádský analyzátor (anusAraka), který se nám v létě 2009 nepodařilo rozchodit ani za přímé asistence jeho hajdarábádského správce Avinéše PVS, nakonec doznal změn a objevil se na jejich webu ke stažení pod licencí GNU GPL v podobě, kterou už se po jistém úsilí podařilo přeložit.

Aktuální verzi jsem nalezl na stránce http://ltrc.iiit.ac.in/showfile.php?filename=onlineServices/morph/index.htm, kde se klikne na Linux version.

Podle README se má spustit skript auto_install.pl, který všechno přeloží. Řešil jsem následující problémy:

README dále praví:

Add the following line to your .bash_profile
PATH=$PATH:/ha/home/zeman/nastroje/ltrc/anusAraka/hindi/morph_SV

The input file "inp" contents are ::
muJe
usane

The outut file generated by command 
	morph_sv.sh inp 
is "inp.mo" and its contents are ::
MO_¤1_mEM{mEM P any s 1 *ko* }/_MO
MO_¤1_vaha{vaha P any s 1 *ne* }/_MO
The outut file generated by command 
	morph_svu.sh inp 
is "inp.mo" and its contents are ::
MO_¤ROOT:1_mEM{PDGM:mEM CAT:P gender:any number:s case:1 TAM:*ko* }/_MO
MO_¤ROOT:1_vaha{PDGM:vaha CAT:P gender:any number:s case:1 TAM:*ne* }/_MO

Pozor:


[ Back to the navigation ] [ Back to the content ]