Differences
This shows you the differences between two versions of the page.
Both sides previous revision Previous revision | Next revision Both sides next revision | ||
khresmoi:data_notes [2012/03/01 15:57] hlavacova |
khresmoi:data_notes [2012/03/01 16:16] hlavacova |
||
---|---|---|---|
Line 74: | Line 74: | ||
* segmentované podle vět, ale menší - viz tabulka. Některé patenty chybí zcela, některé jsou zkráceny. | * segmentované podle vět, ale menší - viz tabulka. Některé patenty chybí zcela, některé jsou zkráceny. | ||
* nesegmentované - každý patent má 2 záznamy: jméno a abstract, obojí v EN i FR, tedy alignment podle paragrafu (odhad) | * nesegmentované - každý patent má 2 záznamy: jméno a abstract, obojí v EN i FR, tedy alignment podle paragrafu (odhad) | ||
- | Zpracované obojí, viz read.me u dat. | + | Zpracované obojí, viz read.me u dat. |
+ | POZOR!!! segmentovaná a nesegmentovaná verze neobsahují totéž | ||
===== French Gigaword ===== | ===== French Gigaword ===== |