Differences
This shows you the differences between two versions of the page.
Both sides previous revision Previous revision Next revision | Previous revision Next revision Both sides next revision | ||
treex:api-implementation [2015/12/09 15:04] popel |
treex:api-implementation [2015/12/11 12:29] popel |
||
---|---|---|---|
Line 21: | Line 21: | ||
V Perlu zabírá string (o 0-15 jednobajtových znacích) 56 bajtů, ale když dám stringy do pole, tak se to zaokrouhlí na 64 bajtů. | V Perlu zabírá string (o 0-15 jednobajtových znacích) 56 bajtů, ale když dám stringy do pole, tak se to zaokrouhlí na 64 bajtů. | ||
Int zabírá 24 bajtů a v poli 32 bajtů. | Int zabírá 24 bajtů a v poli 32 bajtů. | ||
- | Když dám stringy/ | + | Když dám stringy/ |
perl -MDevel:: | perl -MDevel:: | ||
Line 27: | Line 27: | ||
perl -MDevel:: | perl -MDevel:: | ||
- | Reference zabírá stejně jako int. | + | Reference |
+ | (V Céčku na 64bitech má typicky pointer 8 bajtů, int 4 bajty a long long int 8 bajtů, v poli to zůstává stejné, v hashi přibude režie dle míry naplnění tabulky, ale v Céčku se objekty nedávají do hashe, leda snad wild atributy.) | ||
Z hlediska rychlosti by bylo lepší ukládat přímo referenci na string (místo intu, kterým by se pak muselo indexovat pole). | Z hlediska rychlosti by bylo lepší ukládat přímo referenci na string (místo intu, kterým by se pak muselo indexovat pole). | ||
Ušetřil bych 32 bajtů na každém stringovém atributu (a pokud by měl ten string víc než 15 znaků, tak ještě víc) a navíc bych potřeboval paměť pro slovník, která je ale (díky zipfovskému rozdělení lemmat, na větších dokumentech) zanedbatelná. | Ušetřil bych 32 bajtů na každém stringovém atributu (a pokud by měl ten string víc než 15 znaků, tak ještě víc) a navíc bych potřeboval paměť pro slovník, která je ale (díky zipfovskému rozdělení lemmat, na větších dokumentech) zanedbatelná. | ||
Line 44: | Line 45: | ||
==== Benchmark Perlích accessorů ==== | ==== Benchmark Perlích accessorů ==== | ||
- | LV V::Magic H 61697/s | + | |
- | LV V::Magic A 68770/s | + | |
- | LV Sentinel H 163699/s | + | LV V::Magic A 74 649/s |
- | LV Sentinel A 168137/s | + | LV Sentinel H 169 605/s |
- | Moose | + | LV Sentinel A 170 267/s |
- | object H 1219345/s | + | Moose |
- | object A 1237085/s | + | object H 1 193 837/s |
- | LV C:: | + | object A 1 233 004/s |
- | LV C:: | + | LV C:: |
- | | + | Mouse 3 111 529/s |
- | Moo 3698192/s | + | LV C:: |
- | Moops | + | |
- | | + | Moops |
- | O:: | + | |
- | C:: | + | O:: |
- | hash 5248761/s | + | C:: |
- | array | + | hash 4 969 215/s |
+ | array | ||
+ | Zápis atributu | ||
+ | H-lv-check-sentinel | ||
+ | A-lv-check-sentinel | ||
+ | A-set-check-perl | ||
+ | H-set-check-perl | ||
+ | --- | ||
+ | H-set-lemma-perl | ||
+ | A-set-lemma-perl | ||
+ | A-lv-lemma-perl | ||
+ | H-lv-lemma-perl | ||
+ | --- | ||
+ | A-set-lemma-xs | ||
+ | H-set-lemma-xs | ||
+ | H-lv-lemma-xs | ||
+ | A-lv-lemma-xs | ||
+ | --- | ||
+ | H-direct | ||
+ | A-direct | ||
+ | |||
+ | Čtení atributu: | ||
+ | h-lv_check_sentinel | ||
+ | a-lv_check_sentinel | ||
+ | --- | ||
+ | h-get_lemma_perl | ||
+ | a-get_lemma_perl | ||
+ | h-lv_lemma_perl | ||
+ | a-lv_lemma_perl | ||
+ | --- | ||
+ | h-lv_lemma_xs | ||
+ | a-lv_lemma_xs | ||
+ | h-get_lemma_xs | ||
+ | a-get_lemma_xs | ||
+ | --- | ||
+ | h-direct | ||
+ | a-direct | ||
+ | |||
+ | Co z toho plyne? | ||
+ | * Všechny čtení i zápisy přístupy jsou zřejmě " | ||
+ | * Pole jsou jen o málo rychlejší než hashe. Možná by se rozdíl zvětšil, kdybych měl v objektu více atributů než jeden, ale víc než 16 jich asi mít nechceme ('' | ||
+ | * Čtení je podobně rychlé jako zápis atributu obdobnou metodou. | ||
+ | * Nejrychlejší je přímý přístup do hashe/pole (tedy '' | ||
+ | * XS implementace jsou asi dvakrát rychlejší než perlové (a to v těch perlových dělám, '' | ||
+ | * Největší otázka z hlediska API je, zda povolit **lvalue accessory**, | ||
+ | * Obzvlášť užitečné je použití typu '' | ||
+ | * V Perlu to není moc zvykem (byť to byla jedna z hlavních motivací uživatelských lvalue funkcí). | ||
+ | * Dokud při zápisu nechci dělat nic jiného (kontroly, logování, | ||
+ | * Jakmile chci nějakou kontrolu v setteru (třeba že ord je kladný integer nebo deprel je jen z těch povolených), | ||
+ | * Pokud chci dělat kontroly (či logování atd.) u lvalue accessoru, musím použít (něco jako) [[https:// | ||
+ | * Hlavní problém vidím v tom, že se mi pak zpomaluje i čtení atributu, při jehož zápisu je lvalue-check. Celé to dělám proto, aby se to " | ||
+ | * Když bych tedy v Perlu používal lvalue accessory, tak jakmile se rozhodnu přidat nějakou kontrolu/ | ||
+ | * Přidáním kontroly/ | ||
+ | * To 3x zpomalení při zápisu by mi nevadilo. Ale to 5x násobné zpomalení při čtení je nepříjemné, |