[ Skip to the content ]

Institute of Formal and Applied Linguistics Wiki


[ Back to the navigation ]

Instalace prohlížeče pro Penn Discourse Treebank

K instalaci jsou potřeba data z CD Penn Treebank v.2 a z CD Penn Discourse Treebank v.2.

Prohlížecí a vyhledávací nástroj (napsaný v Javě) lze stáhnout ze stránek http://www.seas.upenn.edu/~pdtb/PDTBAPI/.
Nástroj se tam šikovně skrývá pod odkazem "The user distribution". Jedná se o zipový archiv pdtbuser.zip.
Po rozbalení se vytvoří adresář PDTBUser a v něm lze aplikaci už přímo spustit, např. příkazem java -jar pdtb.jar.
Údajně je potřeba používat aktuální verzi Javy přímo z java.sun.com.

Po spuštění je potřeba nastavit několik adresářů. Jedná se o tyto adresáře z CD PTB v.2:

- raw/wsj
- combined/wsj

a o tento adresář z CD PDTB v.2:

- data

Nic jiného ze jmenovaných CD není potřeba.


[ Back to the navigation ] [ Back to the content ]