Differences
This shows you the differences between two versions of the page.
Both sides previous revision Previous revision Next revision | Previous revision Next revision Both sides next revision | ||
draft [2009/07/15 12:44] ptacek |
draft [2009/09/01 11:46] ptacek |
||
---|---|---|---|
Line 1: | Line 1: | ||
====== Progress Report ====== | ====== Progress Report ====== | ||
+ | [[Progress Report]] - dal jsem to na zvlastni stranku, abysme si nelezli do zeli | ||
- | Hi Marc, | ||
- | ... | + | [[http://72.55.153.148/ |
- | Re: progress: there is progress in the following: | + | ====== Scenario Brief ====== |
- | - speech re-training for the collected dialogue data | + | C1 Dobrý den, jak se jmenujete? (intro-daf-based) |
- | - additional dialogue transription for ASR is ongoing (WP52.? T5.2.1) | + | H1 Marie. |
- | - DM has been transferred from USFD to Prague | + | |
- | being extensively tested | + | |
- | - DAF editor transfer is complete (WP5.3) | + | |
- | - Sample dialogues (specifically aimed at the demo) | + | |
- | are ready - issues are being resolved between CU/ZCU | + | |
- | - DAFs are being prepared for the SC-CZ scenario AND | + | |
- | the sample dialogues | + | |
- | - DA set is being prepared, also based on the sample dialogues (WP5.2) | + | |
- | - preliminary DA tagger (on std DAMSL-SWBD tagset) working (~35% error rate) (WP5.2) | + | |
- | - integration work is ongoing (CU/ZCU, internally at CU) | + | |
- | but no functioning full demo yet (beyond what we've presented in Madrid) | + | |
- | I hope this is OK for the progress report. Pavel (I.) might add more specifics regarding the ASR and especially TTS progress. | + | C2 Těší mě. Já jsem Pavla a chtěla bych Vás blíž poznat. Jsem ráda, že mi ukážete Vaše fotografie. |
- | Best, | + | C2 Co je tohle? (photo_maintenance) |
+ | H2 To je moje rodina, rodiče, sestra, její manžel, moje dvě děti a její dvě děti. | ||
+ | H2 Byli u mě na Vánoce na návštěvě. | ||
- | -- Jan | + | C3 Trávíte Vánoce takhle pohromadě? |
+ | H3 Teď už ne. | ||
+ | H3 Teď už všechny moje dětičky vylétaly z hnízda. | ||
- | ====== Description of Czech Companion November Prototype ====== | + | C4 Jak se jmenuje váš manžel? |
+ | H4 Manžel už nežije, jmenoval se Karel Šístek. | ||
- | The Czech version of Companion deals with the Reminiscing about User's Photos scenario. | + | C5 Máte ráda Vánoce? |
- | photopal domena, nahranej korpus, ze na to sou dafy (reusing SHEFF DM intergrated through Inamode Relayer (TID)) vhodny, moreover reusable for expected pomdp DM from UOX (reuse states, let pomdp' | + | H5 Teď už ne. |
- | typy odpovedi a zpusob jejich implementace, | + | H5 Měla jsem je ráda, když byly děti malé. |
- | NLP server s tectomt, ASR/TTS/SR client, connected over network | + | H5 Teď už to ale není ono. |
- | XXX JPta | + | |
- | advances in Czech NLU (on reconstructed spoken data): 300-500vet(?) rucne anotovat pos, a-tree, t-tree, IE predicates, Named Entities, DA pro eval in-domain testy after Nov. | + | C6 Takže teď trávíte Vánoce sama? (ask_on_detail-daf-based) |
- | pos ? analyzovat, generovat a kontrolovat ' | + | H6 Nejsem úplně sama, chodím každé Vánoce k dceři, ale už to není, jak to bývalo, když byly doma malé děti. |
+ | C7 Jak děti vyrostou, tak má člověk najednou příliš mnoho času. | ||
+ | C7 Kdo je kdo na té fotce? | ||
+ | H7 U stromečku je můj synovec, ta holčička vedle je moje dcera, chlapeček s hračkou je můj syn, vedle je sestra, její manžel a nad ním je můj otec. | ||
- | ===== Speech Reconstruction ===== | + | C8 To jste ale velká rodina. |
- | features: omit filler phrases, irrelevant speech events, false starts, repetitions, | + | C8 Jak se jmenuje vaše sestra? |
- | imlementation(zahrnout tuhle info?): moses natrenovany na korpusu | + | H8 Sestra se jmenuje Marie Havlová, její manžel je Vladimír, ten bohužel nedávno zemřel. |
- | performance indicator: BLEU score (overall scoring of all features) to annotated corpora from T5.2.1., nejaka baseline | + | |
- | XXX Mirek | + | |
- | ===== Morphology Analyzer and POS tagging ===== | + | C9 To je smutné. |
- | features: XXX Mirek/ | + | C9 Znala jste ho dobře? |
- | performance indicator: accuracy | + | H9 Velmi dobře, trávili jsme obě rodiny společně hodně času. |
- | ===== Syntactic Parsing ===== | + | C10 Máte už nějaká vnoučata? |
- | features: induce dependencies and labels | + | H10 Mám vnučku Natálku. |
- | performance indicator: f-measure | + | H10 Ona je takové živé děťátko, taková neposeda. |
- | v tipu je natrenovat MacDonnalda na dialog datech, ten task je do M42, ted ne. | + | |
+ | C11 Takže Natálka je neposeda. repeat-rephrase | ||
+ | C11 Máte ještě nějaké další vnučky nebo vnuky? | ||
+ | H11 Čekáme ještě další přírustek. | ||
+ | C12 Hlídáte je někdy? | ||
+ | H12 Hlídám dost často. | ||
+ | H12 Já mám děti ráda a jsem s nimi moc ráda. | ||
- | ===== Semantic Parsing ===== | + | C13 To je fajn. |
- | features: meaning representation with semantic roles (69 roles), coordinations, | + | C13 S dětmi je legrace. |
- | performance indicator: f-measure | + | H13 Ano. |
- | ===== Information Extraction ===== | + | C Podíváme se na další fotku? |
- | features: template based identification of predicates | + | |
- | covering predicates from before-mentioned set of DAFs. | + | |
- | performance indicator: accuracy | + | |
+ | ====== Scenario Brief 2 ====== | ||
- | ===== Named Entities Recognition ===== | + | C1 Dobrý den, jak se jmenujete? intro |
- | features: detect person names, geographical locations (organizations myslim nepotrebne) | + | H1 Jindra. |
- | performance indicator: f-measure | + | |
- | ===== Dialog Act Tagging ===== | + | C2 Já jsem Pavla a budu si s Vámi povídat o Vašich fotkách. intro |
- | features: tagset derived from DAMSL-SWBD, DA is a key feature driving the decision, what to say next. | + | C2 Hned se můžeme podívat na první. photo_maintenance |
- | performance indicator: accuracy | + | C2 Co je na téhle fotce? |
+ | H2 Tak to je moje dcerka Jana, když se narodila. Ta je druhá, staršího jsem měla chlapce Jirku. Jana měla nevyvinutý | ||
+ | C3 A dneska je z ní pěkná mladá slečna. komentující věta | ||
+ | C3 Kdy se Jana narodila ? ask_on_detail | ||
+ | H3 Jana se narodila v roce 1957. To už jsem neměla ani tatínka. | ||
- | ===== Sentiment Analysis ===== | + | C4 To mě mrzí. hodnotící_obecná |
- | features: za tohle bych vydaval klasifikator, | + | H4 Tatínek zemřel v roce 1956 a Jana se potom narodila v červnu 1957. Dneska už je to máma od dvou dospělých děvčat. |
- | performance indicator: f-measure | + | |
+ | C5 Kolik vnoučat vlastně máte? | ||
+ | H5 Vnoučat mám teďka pět, Jirka má dva kluky a nyní, na staré kolena, holčičku. | ||
+ | C6 A co vlastně dělá váš syn? ask_on_detail dafclovek_30, | ||
+ | H6 Můj syn je teďka v hospodě. | ||
- | ===== Complete System Evaluation ===== | + | C7 Takže Jirka je nyní v hospodě? repeat_rephrase |
- | T5.2.7 tohle zminuje, nick webb to pro nas asi neudela | + | H7 Na staré kolena, vždyť už je mu taky 52, si vzal na starost hospodu. |
- | performance indicator: pocet slov ve vypovedich uzivatele, dotazniky | + | |
+ | C8 To je ale šikovný. hodnotící_zacílená topic: | ||
+ | C8 A kde pracuje Jana? skip_to_associated_topic daf: | ||
+ | H8 Je lékařka a dělá tady v Plzni. | ||
+ | H8 Je ředitelka v kojeneckém ústavu. | ||
+ | C9 Bydlí v Plzni? ask_on_detail daf: | ||
+ | H9 Ano, v Plzni. Jsou tady kousíček, na Klatovské třídě. | ||
+ | C10 Vzpomínáte si u téhle fotky ještě na něco? ask_for_more | ||
+ | H10 Už je to asi vše. | ||
- | ===== Dialog Manager | + | C Tak se podíváme na další snímek. |
- | features: reply types, using (language independed) predicates (prakticky to znamena, ze pojmenuju testy na prechodech | + | C Co na něm můžeme vidět? |
- | performance indicator: rucni hodnoceni prijatelnosti vybrane akce | + | |
+ | |||
+ | ====== Scenario Brief 3 ====== | ||
+ | |||
+ | C1 Dobrý den Marie, už jsem se těšila na Vaše další fotky. intro, na základě loginu | ||
+ | C1 Co na té první můžeme vidět? | ||
+ | | ||
+ | H1 To jsme byli prvně s novým autem na Šumavě. | ||
+ | |||
+ | H1 Sice trochu pršelo, ale na lyže se muselo. | ||
+ | |||
+ | |||
+ | C2 Jak často jste na Šumavu jezdili? | ||
+ | | ||
+ | H2 Dost, ne tak často, ale aspoň asi dvakrát, třikrát za zimu. | ||
+ | |||
+ | |||
+ | C3 Jezdili jste jenom na lyže? | ||
+ | | ||
+ | H3 Byli jsme se tam podívat na chaloupku pana Wericha a také jsme byli v kostele. | ||
+ | |||
+ | H3 Kostel byl plný lidu, což u nás ve Štěnovicích není. | ||
+ | |||
+ | |||
+ | C4 To je zajímavé. | ||
+ | | ||
+ | H4 Já jsem sice z Útušic, ale chodíme do kostela do Štěnovic. | ||
+ | |||
+ | H4 Spadáme tam jak k doktoru, tak i pod matriku. | ||
+ | |||
+ | |||
+ | C5 Rozumím. | ||
+ | | ||
+ | C5 Jezdili jste i na víc dní, nebo jen na jednodenní výlety? | ||
+ | | ||
+ | H5 S dětmi, když byly malé, to byly jednodenní výlety. | ||
+ | |||
+ | |||
+ | C6 Lyžujete ráda? | ||
+ | | ||
+ | H6 Lyžovala jsem, ale teď už vůbec ne, protože mám operované koleno i kyčel. | ||
+ | |||
+ | |||
+ | C7 Člověk už na sebe musí dávat víc pozor. | ||
+ | | ||
+ | C7 Máte to na Šumavu daleko? ask_on_detail daf:vylet | ||
+ | H7 Je to od nás z Útušic přes 30 kilometrů. | ||
+ | |||
+ | C8 Takže jste jezdili na Šumavu na lyže autem. | ||
+ | C8 Děti také baví lyžovat? skip_to_associated_topic | ||
+ | H8 Syn rád jezdí na běžkách. A dnes je moderní ten snowboard, tak to zkouší. | ||
+ | |||
+ | C9 To je šikovný. hodnotící_zacílená | ||
+ | C9 A dcera? ask_on_detail | ||
+ | H9 Ta moc nesportuje. | ||
+ | |||
+ | C Řeknete mi ještě něco k téhle fotce? ask_for_more | ||
+ | C A kdo je na téhle? photo_maintenance | ||
- | ===== Natural Language Generation ===== | ||
- | features: variations, underspecified input (dott format), emotional markup (natvrdo v dafech a templatech u hodnoticich vet) | ||
- | performance indicator: BLEU score |