Differences
This shows you the differences between two versions of the page.
Both sides previous revision Previous revision Next revision | Previous revision Next revision Both sides next revision | ||
user:hladka:vladimir-rovensky [2008/05/19 10:24] hladka |
user:hladka:vladimir-rovensky [2008/09/29 14:45] vladimir.rovensky |
||
---|---|---|---|
Line 1: | Line 1: | ||
- | ====== | + | ====== |
- | | + | [[external: |
- | *[[http:// | + | |
+ | |||
+ | |||
+ | |||
+ | ====== Dokumentace, | ||
+ | *Zadání ([[http:// | ||
+ | * Specifikace [[http:// | ||
+ | * Dokumentace pilotní verze [[http:// | ||
* **Co vše má obsahovat pilotní verze?** | * **Co vše má obsahovat pilotní verze?** | ||
* **Rešerše** - provést rešerši, jestli se podobným problémem již někdo zabýval; pokud ano, tak pro jaké jazyky a jakou metodologií. Rešerši zpracovat písemně v samostatném souboru. | * **Rešerše** - provést rešerši, jestli se podobným problémem již někdo zabýval; pokud ano, tak pro jaké jazyky a jakou metodologií. Rešerši zpracovat písemně v samostatném souboru. | ||
- | * **Kód** S dostatečným počtem | + | * **Kód** S dostatečným počtem |
* **Dokumentace** | * **Dokumentace** | ||
* **Uživatelská** - specifikace softwarových a hardwarových požadavků; | * **Uživatelská** - specifikace softwarových a hardwarových požadavků; | ||
- | * **Programátorská** - popis struktury programu, implementační platformy, použitých technologií, | + | * **Programátorská** - popis struktury programu, implementační platformy |
+ | * **Testovací data** Věty z Českého akademického korpusu 2.0 | ||
+ | * Smysluplné věty [[http:// | ||
+ | * Nesmysluplné věty [[http:// | ||
Line 14: | Line 24: | ||
* 3/3/2008 | * 3/3/2008 | ||
* **navrhuji schuzku 15/5/2008 nekdy dopoledne (je mi to jedno)** | * **navrhuji schuzku 15/5/2008 nekdy dopoledne (je mi to jedno)** | ||
+ | |||
+ | |||
====== Vzkazy ====== | ====== Vzkazy ====== | ||
* 16/3/2008 U mě v kaslíku na sekretariátu ÚFAL (MS, místnost č. 408) máte nachystané CD-ROM (píše se o něm v zadání) a popis morfologických značek. | * 16/3/2008 U mě v kaslíku na sekretariátu ÚFAL (MS, místnost č. 408) máte nachystané CD-ROM (píše se o něm v zadání) a popis morfologických značek. | ||
+ | * 27/5/2008 Nová verze morfologické analýzy, jakožto součást skriptu '' | ||
+ | |||
+ | |||
Line 34: | Line 49: | ||
* Co by mela splnovat specifikace programu(delka, | * Co by mela splnovat specifikace programu(delka, | ||
| | ||
+ | * pri testovani ruznych vstupu jsem narazil na nektere hodnoty na pozici 2 morfologickeho tagu, ktere jsem nenasel v dokumentaci (konkretne hodnota 2), da se nekde sehnat aktualizovany popis znacek? | ||
+ | * tool_chain spravne nerozeznava tvary sloves koncici na -li (budu-li, chcete-li) | ||
+ | |||
==Prvni naznak algoritmu== | ==Prvni naznak algoritmu== | ||
- Rozparsovat vstup z tool-chainu - pravdepodobne staci chytat tagy <f> a v nich <t>, mozna by se hodily i <r> a <g> (id tokenu + ukazatel na nadrazeny token) ale asi to nespada do morfologie. __tool_chain na vystupu nevydava <t>, pokud je v datech <t>, tak obsahuje znacku doplnenou rucne, tedy lidmi. tool_chain dava na vystupu < | - Rozparsovat vstup z tool-chainu - pravdepodobne staci chytat tagy <f> a v nich <t>, mozna by se hodily i <r> a <g> (id tokenu + ukazatel na nadrazeny token) ale asi to nespada do morfologie. __tool_chain na vystupu nevydava <t>, pokud je v datech <t>, tak obsahuje znacku doplnenou rucne, tedy lidmi. tool_chain dava na vystupu < | ||
Line 62: | Line 80: | ||
* Kod : zakladni chodici a odvsivena verze, rozchozeno na Linuxu (aspon myslim :o) | * Kod : zakladni chodici a odvsivena verze, rozchozeno na Linuxu (aspon myslim :o) | ||
* rozsiren soubor s podminkami(aktualizovan i odkaz) | * rozsiren soubor s podminkami(aktualizovan i odkaz) | ||
- | * par vystupu programu v jeho soucasne podobe je k nahlednuti [[http:// | + | * par vystupu programu v jeho soucasne podobe je k nahlednuti [[http:// |
+ | = 2008/2009 = | ||
+ | * neustale rozsirovan soubor s podminkami | ||
+ | * pridana podpora davkoveho zpracovani | ||
+ | * pridany parametry pro spusteni programu - ignorovani nerozpoznanych tokenu, vyzadovani slovesa, minimalni delka vety atp. | ||
+ | * pridana utilita na editaci souboru s podminkami (java) | ||
+ | * pridana moznost vytvaret skupiny podminek, ktere jsou ve smysluplne vete vyzadovany | ||
==Dale== | ==Dale== | ||
- | Vymyslet zapojeni spojek, castic, citoslovci, pripadne podrobnejsi rozdeleni vety na casti (podmetna, prisudkova, | + | **22/9/08** |
- | Zda se ze smysluplnost program vetsinou rozezna, trochu horsi je to s nesmyslnymi vetami - domyslim. | + | * vypisovani kolizi |
- | + | * SENSE jako webova aplikace | |
- | + | * PREZENTACE | |
- | + | * slides | |
- | + | * formulace ulohy | |
- | + | * smysluplnost vzhledem | |
- | + | * vstupni data - tool_chain (CAK 2.0) | |
- | + | * algoritmus - vyvojovy diagram | |
- | + | * vypocetni slozitost | |
+ | * evaluace - data od Seznamu, ' | ||
+ | * ukazka | ||
+ | * 13. rijna nanecisto | ||
====== Otázky ====== | ====== Otázky ====== |