K instalaci jsou potřeba data z CD Penn Treebank v.2 a z CD Penn Discourse Treebank v.2.
Prohlížecí a vyhledávací nástroj (napsaný v Javě) lze stáhnout ze stránek http://www.seas.upenn.edu/~pdtb/PDTBAPI/.
Nástroj se tam šikovně skrývá pod odkazem "The user distribution". Jedná se o zipový archiv pdtbuser.zip
.
Po rozbalení se vytvoří adresář PDTBUser
a v něm lze aplikaci už přímo spustit, např. příkazem java -jar pdtb.jar
.
Údajně je potřeba používat aktuální verzi Javy přímo z java.sun.com.
Po spuštění je potřeba nastavit několik adresářů. Jedná se o tyto adresáře z CD PTB v.2:
- raw/wsj
- combined/wsj
a o tento adresář z CD PDTB v.2:
- data
Nic jiného ze jmenovaných CD není potřeba.