[ Skip to the content ]

Institute of Formal and Applied Linguistics Wiki


[ Back to the navigation ]

Formát FS

FS (pravděpodobně zkratka za Feature Structures) je asi nejstarším datovým formátem Pražského závislostního korpusu, který se pro svou jednoduchost používá stále. Mimo jiné představuje nejjednodušší způsob, jak uložit hierarchicky organizovaná data, aby je bylo možné zobrazit v Tredu. FS formát pro svou jednoduchost a rychlost načítání zůstává datovým formátem používaným v Netgraphu.

Popis formátu FS lze nalézt u PDT 1.0 na adrese http://ufal.mff.cuni.cz/pdt/Corpora/PDT_1.0/Doc/fs.html. Základní rysy jsou tyto: na každém řádku jeden strom, hierarchie stromu je zakódována kulatými závorkami, atributy jednoho uzlu jsou odděleny čárkami a jejich seznam (tedy celý uzel) je uzavřen v hranatých závorkách. V záhlaví na začátku je řečeno, který číselný atribut udává slovosled a který reprezentuje uzel v lineárním (textovém) zápisu věty.

Převody z a do jiných formátů


[ Back to the navigation ] [ Back to the content ]