[ Skip to the content ]

Institute of Formal and Applied Linguistics Wiki


[ Back to the navigation ]

Differences

This shows you the differences between two versions of the page.

Link to this comparison view

Both sides previous revision Previous revision
Next revision
Previous revision
user:zeman:joshua [2010/08/31 13:21]
zeman Lanceův návod na extrakci gramatiky s Joshuou 1.3.
user:zeman:joshua [2010/08/31 15:55] (current)
zeman Překlep.
Line 98: Line 98:
 ==== Zastaralý návod ==== ==== Zastaralý návod ====
  
-**Pozor, následující poznámky pocházejí z doby, kdy jsem se učil pracovat s první verzí Joshuy, a jsou zastaralé! Níže je kopie mailu od Lance Schwartze, kde je vysvětlen postup pro Joshuu 1.3.**+**Pozor, následující poznámky pocházejí z doby, kdy jsem se učil pracovat s první verzí Joshuy, a jsou zastaralé! Níže je kopie mailu od Lana Schwartze, kde je vysvětlen postup pro Joshuu 1.3.**
  
 A takhle pustíme Joshuu, aby z trénovacích dat extrahoval gramatiku. Joshua z nějakého důvodu vyžaduje také testovací soubor se zdrojovým jazykem. Soudě podle příkladu, který dodali, stačí zkopírovat první větu ze zdrojových trénovacích dat. Gramatiku je pak ještě třeba seřadit, vyházet duplicitní pravidla a zagzipovat. A takhle pustíme Joshuu, aby z trénovacích dat extrahoval gramatiku. Joshua z nějakého důvodu vyžaduje také testovací soubor se zdrojovým jazykem. Soudě podle příkladu, který dodali, stačí zkopírovat první větu ze zdrojových trénovacích dat. Gramatiku je pak ještě třeba seřadit, vyházet duplicitní pravidla a zagzipovat.
Line 149: Line 149:
 ==== Nový návod pro Joshuu 1.3 ==== ==== Nový návod pro Joshuu 1.3 ====
  
-Následuje výtah z mailu od Lance Schwartze, který vysvětluje, jak zadávat parametry při extrakci gramatiky s Joshuou 1.3. V dokumentaci u Joshuy jsem to nenašel.+Následuje výtah z mailu od Lana Schwartze, který vysvětluje, jak zadávat parametry při extrakci gramatiky s Joshuou 1.3. V dokumentaci u Joshuy jsem to nenašel.
  
 The recommended way to extract a grammar is to configure an ant XML file for ExtractRules. All available parameters can be configured using that technique. The main method is meant now to just be a simple version for use if you don't need any custom configuration. The recommended way to extract a grammar is to configure an ant XML file for ExtractRules. All available parameters can be configured using that technique. The main method is meant now to just be a simple version for use if you don't need any custom configuration.
Line 207: Line 207:
  outputFile="/path/to/output/de-en.grammar"  outputFile="/path/to/output/de-en.grammar"
  testFile="/path/to/test.de"  testFile="/path/to/test.de"
- maxPhraseLength="5"+ maxPhraseSpan="5"
  maxPhraseLength="5"  maxPhraseLength="5"
  requireTightSpans="true"  requireTightSpans="true"
  edgeXViolates="false"  edgeXViolates="false"
  sentenceInitialX="false"  sentenceInitialX="false"
- sentenceFinalX=false"+ sentenceFinalX="false"
  ruleSampleSize="200"  ruleSampleSize="200"
  maxNonterminals="2"  maxNonterminals="2"

[ Back to the navigation ] [ Back to the content ]