[ Skip to the content ]

Institute of Formal and Applied Linguistics Wiki


[ Back to the navigation ]

Table of Contents

Stopwords

Stopwords (česky bych přeložil jako nezajímavá slova) je poměrně vágně definovaný koncept, který má uplatnění v získávání informací a příbuzných oborech. Jde o slova, která nemá smysl považovat za klíčová při indexování nebo vyhledávání dokumentů, protože tato slova jsou v daném jazyce příliš běžná, takže nemůžeme říct, že charakterizují téma daného dokumentu nebo jeho části. Typicky sem patří funkční slova z uzavřených tříd, např. zájmena, číslovky, předložky, spojky a částice, ale i tvary pomocných a způsobových sloves.

Čeština

Seznam od Zdeňka Žabokrtského asi z roku 2004. Prošel tektogramatickou rovinu, vybral funkční slova ve skrytých uzlech (vedl na ně odkaz typu aux.rf), výsledný seznam ještě ručně opravil.

a
v
na
je
že
o
z
s
i
by
do
to
k
ve
pro
za
ale
po
jsou
jako
podle
od
však
bude
při
jen
u
aby
byl

nebo
než
být
se
ze
před
není
bylo
mezi
co
jsme
když
byla
jsem
ani
či
proti
tím
budou
bez
tom
ke
asi
nás
této
proto
pokud
protože
tomu
nad
byly
tento
li
toho
nám
tohoto
pod
což
kdo
ovšem
zda
tato
těchto
mu
tyto
přes
ji
ne
ho
kolem
bychom
jim
ten
tomto
nejen
mi
byli
během
tuto
prý
kdyby
bych
kromě
ty
neboť
nejsou
nebude
jak
zatímco
toto
mimo
takže
tak
jež
vůči
takové
jej
ta

jste
díky
vzhledem

ti


jestliže
nebyl
jich
my
těch
nebylo
vedle
kvůli
budeme
jenom
místo
buď
tj
jehož
de

nebyla
přestože
takový
avšak
vám
nicméně
tímto
čím
vás
anebo
přičemž
on
včetně
tu
jenž
mne
nebudou
ano
nýbrž
jenže
byť
tomuto
jednak
nebyly
jestli
taková
okolo
bohužel
aniž
vždyť
takových
takového
touto
byste
takovou
oproti
tudíž
těm
ačkoliv
námi
oni
čem
ačkoli
ona
jím
těmito
budu
mně
těmto
zato
jakmile
jemuž
totéž
pozor
čímž
tito
takovém
naproti
téhož
vy
čili
čeho
ode
koho
nejsem
komu

těmi
jímž
tohle
nejsme
neboli
tou
ono
jimž
jimi
téže
nechť
nebyli
ba
leč
budete
ony
nebudeme
krát
jimiž
jest
beze
nežli
dle
čemu
takovým
takovému
jelikož
jakožto
coby
aneb
oněch
onoho
ad
poněvadž
namísto
jichž
ku
jíž
buďte
ohledně
takovéto
onen
oné
jakož
vstříc
týž
nebudu
mnou
jemu
versus
vámi
podél
poblíž
nebýt
kdežto
již
onu
jenomže
takovými
kým
copak
zdali
třebaže
skrze
natož
uvnitř
takovýto
jsi
témže
téhle

plus
no
nehledě
čemž
van
tentýž
takovýchto
jeho
čemuž
čehož
takříkajíc
budiž
tuhle
tenhle
takoví
ovšemže
kontra
buďto
takováto
onomu
onom
nejste
jejž
tytéž
tomtéž
oním
narozdíl
kdoví
jakoby
budeš
vyjma
tyhle
nade
býti
zpoza
vně
týchž
tímhle
takovouto
takovémto
tahle
skrz
nuže
nebudete
neb
kéž
jo
tutéž
titíž
tatáž
takovýmto
takovéhoto
leda
krom
kdož
bys
žel
týmž
tož
tomhle
tímtéž
tihle
témž
tebe
takovýhle
tací
sbohem
přede
onou
nu
nejenomže
nebudeš
ledaže
blízko
zpod
zaplaťpánbu
zadruhé
vzdor
viďte
via
uprostřed
týmiž
tyhlety
tomuhle
tíž
témuž
těma
těchže
takých
takovémhle
takovéhle
sic
přese
pakliže
onyno
oněmi
oněm
ni
neřkuli
nebuďte
napospas
naneštěstí
mnohem
kterážto
kráte
kohopak
kdopak
ježto
cožpak
cože
bysme
bůhví
buďme
budem

Čeština jinak

Seznam slov z uzavřených tříd, vytvořen ručně bez konzultace s korpusem.

já mne mě mně mi mnou
ty tebe tě tobě ti tebou tys
on jeho něho ho jemu němu mu jej něj něm jím ním
ona jí ní ji ni
ono
my nás nám námi
vy vás vám vámi
oni ony ona jich nich jim nim je ně jimi nimi
sebe se sobě si sebou
můj mého mému mém mým moje má mojí mé moji mou mí mých mými
tvůj tvého tvému tvém tvým tvoje tvá tvojí tvé tvoji tvou tví tvých tvými
svůj svého svému svém svým svoje svá svojí své svoji svou sví svých svými
jeho její jejího jejímu jejím jejích jejími
náš našeho našemu našem naším naše naší naši našich našim našimi
váš vašeho vašemu vašem vaším vaše vaší vaši vašich vašim vašimi
jejich
ten toho tomu tom tím ta té tu tou to ti těch těm ty těmi
tento tohoto tomuto tomto tímto tato této tuto touto toto tito těchto těmto tyto těmito
tenhle tohohle tomuhle tomhle tímhle tahle téhle tuhle touhle tohle tihle těchhle těmhle tyhle těmihle
onen onoho onomu onom oním ona oné onu onou ono oni oněch oněm ony oněmi
takový takového takovému takovém takovým taková takové takovou takoví takových takovými
týž téhož témuž tomž tímž táž též touž tož tiž těchž těmž těmiž
tentýž tomtéž tatáž toutéž titíž těchtýž těmtýž těmitýž tytéž
sám samého sama samému samém samým samé samou samo sami samých samými
kdo koho komu kom kým
co čeho čemu čem čím
jaký jakého jakému jakém jakým jaká jaké jakou jací jakých jakými
který kterého kterému kterém kterým která které kterou kteří kterých kterými
čí čího čímu čím čích čími
jenž jehož něhož jemuž němuž němž jímž nímž jež něž již niž
kdož což
jehož jejíž jejíhož jejímuž jejímž jejíchž jejímiž jejichž
někdo někoho někomu někom někým
něco něčeho něčemu něčem něčím
nějaký nějakého nějakému nějakém nějakým nějaká nějaké nějakou nějací nějakých nějakými
některý některého některému některém některým některá některé některou někteří některých některými
něčí něčího něčímu něčím něčích něčími
leckdo leckoho leckomu leckom leckým
lecco leccos lecčeho lecčehos lecčemu lecčemus lecčem lecčems lecčím lecčíms
lecjaký lecjakého lecjakému lecjakém lecjakým lecjaká lecjaké lecjakou lecjací lecjakých lecjakými
leckterý leckterého leckterému leckterém leckterým leckterá leckteré leckterou leckteří leckterých leckterými
lecčí lecčího lecčímu lecčím lecčích lecčími
málokdo málokoho málokomu málokom málokým
máloco máločeho máločemu máločem máločím
málokterý málokterého málokterému málokterém málokterým málokterá málokteré málokterou málokteří málokterých málokterými
kdokoli kdokoliv kohokoli kohokoliv komukoli komukoliv komkoli komkoliv kýmkoli kýmkoliv
cokoli cokoliv čehokoli čehokoliv čemukoli čemukoliv čemkoli čemkoliv čímkoli čímkoliv
jakýkoli jakýkoliv jakéhokoli jakéhokoliv jakémukoli jakémukoliv jakémkoli jakémkoliv jakýmkoli jakýmkoliv jakákoli jakákoliv jakékoli jakékoliv jakoukoli jakoukoliv jacíkoli jacíkoliv jakýchkoli jakýchkoliv jakýmikoli jakýmikoliv
kterýkoli kterýkoliv kteréhokoli kteréhokoliv kterémukoli kterémukoliv kterémkoli kterémkoliv kterýmkoli kterýmkoliv kterákoli kterákoliv kterékoli kterékoliv kteroukoli kteroukoliv kteříkoli kteříkoliv kterýchkoli kterýchkoliv kterýmikoli kterýmikoliv
číkoli číkoliv číhokoli číhokoliv čímukoli čímukoliv čímkoli čímkoliv číchkoli číchkoliv čímikoli čímikoliv
každý každého každému každém každým každá každé každou každých každými
všechen všechnoho všechnomu všechnom všechnem všechna všechno všechnu všichni všechny všechněch všechněmi
nikdo nikoho nikomu nikom nikým
nic ničeho ničemu ničem ničím
nijaký nijakého nijakému nijakém nijakým nijaká nijaké nijakou nijací nijakých nijakými
ničí ničího ničímu ničím ničích ničími
žádný žádného žádnému žádném žádným žádná žádné žádnou žádní žádných žádnými
oba obou oběma obě
mnoho mnohý mnohého mnohému mnohém mnohým mnohá mnohé mnohou mnohých mnohými
nemnoho nemnohý nemnohého nemnohému nemnohém nemnohým nemnohé nemnohou nemnohých nemnohými
málo nemálo
málokrát mnohokrát nemálokrát nemnohokrát
kolik kolikrát pokolikáté
kolikátý kolikátého kolikátému kolikátém kolikátým kolikátá kolikáté kolikátou kolikátí kolikátých kolikátými
kolikerý kolikerého kolikerému kolikerém kolikerým kolikerá kolikeré kolikerou kolikeří kolikerých kolikerými
kolikero kolikera kolikeru kolikerem
kolikery
tolik tolikrát potolikáté
tolikátý tolikátého tolikátému tolikátém tolikátým tolikátá tolikáté tolikátou tolikátí tolikátých tolikátými
tolikerý tolikerého tolikerému tolikerém tolikerým tolikerá tolikeré tolikerou tolikeří tolikerých tolikerými
tolikero tolikera tolikeru tolikerem
tolikery
několik několikrát poněkolikáté
několikátý několikátého několikátému několikátém několikátým několikátá několikáté několikátou několikátí několikátých několikátými
několikerý několikerého několikerému několikerém několikerým několikerá několikeré několikerou několikeří několikerých několikerými
několikero několikera několikeru několikerem
několikery
nula jeden jednoho jednomu jednom jedním jedna jedné jednu jednou jedno jedni jedněch jedněm jedněmi jedny
dva dvou dvěma dvě tři třech třem třemi čtyři čtyř čtyřem čtyřech čtyřmi
pět pěti šest šesti sedm sedmi osm osmi devět devíti deset deseti
jedenáct jedenácti dvanáct dvanácti třináct třinácti čtrnáct čtrnácti patnáct patnácti šestnáct šestnácti sedmnáct sedmnácti osmnáct osmnácti devatenáct devatenácti
dvacet dvaceti třicet třiceti čtyřicet čtyřiceti padesát padesáti šedesát šedesáti sedmdesát sedmdesáti osmdesát osmdesáti devadesát devadesáti
sto sta stu stem stě set stům sty stech
tisíc tisíce tisíci tisícem tisíce tisíců tisícům tisících tisíci
milión milion miliónu milionu miliónem milionem milióny miliony miliónů milionů miliónům milionům miliónech milionech
miliarda miliardy miliardě miliardu miliardou miliard miliardám miliardách miliardami
první prvního prvnímu prvním prvních prvními
druhý druhého druhému druhém druhým druhá druhé druhou druzí druhých druhými
třetí třetího třetímu třetím třetích třetími
čtvrtý čtvrtého čtvrtému čtvrtém čtvrtým čtvrtá čtvrté čtvrtou čtvrtí čtvrtých čtvrtými
pátý pátého pátému pátém pátým pátá páté pátou pátí pátých pátými

stý stého stému stém stým stá sté stou stí stých stými
tisící tisícího tisícímu tisícím tisících tisícími
milióntý milióntého milióntému milióntém milióntým milióntá miliónté milióntou milióntí milióntých milióntými
poprvé podruhé potřetí počtvrté popáté pošesté posedmé poosmé podeváté podesáté
pojedenácté podvanácté potřinácté počtrnácté popatnácté pošestnácté posedmnácté poosmnácté podevatenácté
podvacáté potřicáté počtyřicáté popadesáté pošedesáté posedmdesáté poosmdesáté podevadesáté
posté potisící pomiliónté pomilionté
nulakrát jednou jedenkrát dvakrát třikrát čtyřikrát pětkrát šestkrát sedmkrát osmkrát devětkrát desetkrát
jedenáctkrát dvanáctkrát třináctkrát čtrnáctkrát patnáctkrát šestnáctkrát sedmnáctkrát osmnáctkrát devatenáctkrát
dvacetkrát třicetkrát čtyřicetkrát padesátkrát šedesátkrát sedmdesátkrát osmdesátkrát devadesátkrát
stokrát tisíckrát miliónkrát milionkrát
dvojí dvojího dvojímu dvojím dvojích dvojími dvoje
trojí trojího trojímu trojím trojích trojími troje
čtvery patery šestery sedmery osmery devatery desatery
jedenáctery dvanáctery třináctery čtrnáctery patnáctery šestnáctery sedmnáctery osmnáctery devatenáctery
dvacatery třicatery čtyřicatery padesátery šedesátery sedmdesátery osmdesátery devadesátery
stery tisícery tisíceré
čtvero patero šestero sedmero osmero devatero desatero
jedenáctero dvanáctero třináctero čtrnáctero patnáctero šestnáctero sedmnáctero osmnáctero devatenáctero
dvacatero třicatero čtyřicatero padesátero šedesátero sedmdesátero osmdesátero devadesátero
stero tisícero
být býti jsem jsi je jsme jste jsou byl byla bylo byli byly bych bys by bychom byste budu budeš bude budeme budem budete budou buď buďme buďte budiž buďtež nebýt nebýti nejsem nejsi není nejsme nejste nejsou nebyl nebyla nebylo nebyli nebyly nebudu nebudeš nebude nebudeme nebudem nebudete nebudou nebuď nebuďme nebuďte
mít míti mám máš má máme máte mají měl měla mělo měli měly měj mějme mějte nemít nemíti nemám nemáš nemá nemáme nemáte nemají neměl neměla nemělo neměli neměly neměj nemějme nemějte
moci moct mohu můžu můžeš může můžeme můžem můžete mohou můžou mohl mohla mohlo mohli mohly nemoci nemoct nemohu nemůžu nemůžeš nemůže nemůžeme nemůžem nemůžete nemohou nemůžou nemohl nemohla nemohlo nemohli nemohly
smět směti smím smíš smí smíme smíte směl směla smělo směli směly nesmět nesměti nesmím nesmíš nesmí nesmíme nesmíte nesměl nesměla nesmělo nesměli nesměly
chtít chtíti chci chceš chce chceme chcem chcete chtějí chtěl chtěla chtělo chtěli chtěly chtěn chtěna chtěno chtěni chtěny chtěj chtějme chtějte nechtít nechtíti nechci nechceš nechce nechceme nechcem nechcete nechtějí nechtěl nechtěla nechtělo nechtěli nechtěly nechtěn nechtěna nechtěno nechtěni nechtěny nechtěj nechtějme nechtějte
umět uměti umím umíš umí umíme umíte uměl uměla umělo uměli uměly neumět neuměti neumím neumíš neumí neumíme neumíte neuměl neuměla neumělo neuměli neuměly
muset musiti musím musíš musí musíme musíte musel musela muselo museli musely nemuset nemusiti nemusím nemusíš nemusí nemusíme nemusíte nemusel nemusela nemuselo nemuseli nemusely
dělat dělati dělám děláš dělá děláme děláte dělají dělal dělala dělalo dělali dělaly dělán dělána děláno děláni dělány dělej dělejme dělejte nedělat nedělati nedělám neděláš nedělá neděláme neděláte nedělají nedělal nedělala nedělalo nedělali nedělaly nedělán nedělána neděláno neděláni nedělány nedělej nedělejme nedělejte
zde tu tady tadyhle tam tamhle teď nyní dříve předtím později potom tak proto
kde kdy jak proč nač zač oč
někde někdy nějak
leckde leckdy lecjak
málokde málokdy
kdekoli kdekoliv kdykoli kdykoliv jakkoli jakkoliv
všude vždy
nikde nikdy nijak
bez do k ke ku kolem kromě kvůli mezi mimo na nad nade naproti o ob od ode okolo oproti po pod pode pro proti při před přede přes přese s se skrz skrze u v ve vedle z ze za
a i ani nebo ale buď anebo avšak však až také dokonce či
že jestliže zda jestli aby abych abychom abyste kdyby kdybych kdybychom kdybyste protože poněvadž jelikož přestože aniž
ano ne ať kéž nechť snad možná

Angličtina

Můj seznam slov z uzavřených tříd, který jsem s pomocí Penn Treebanku vyráběl pro výuku Morfologické a syntaktické analýzy.

I me you he him she her it we us they them
one
myself yourself himself herself itself ourselves yourselves themselves oneself
my mine your yours his her hers its our ours their theirs
this these that those
a an the
who whom whose what which
some somebody someone something
any anybody anyone anything
every everybody everyone everything each all both
many much more most too enough
few little fewer less least
no nobody nothing none
zero one two three four five six seven eight nine ten
eleven twelve thirteen fourteen fifteen sixteen seventeen eighteen nineteen
twenty thirty forty fifty sixty seventy eighty ninety
hundred thousand million billion
first second third fourth fifth sixth seventh eighth ninth tenth
eleventh twelfth thirteenth fourteenth fifteenth sixteenth seventeenth eighteenth nineteenth
twentieth thirtieth fortieth fiftieth sixtieth seventieth eightieth ninetieth
hundredth thousandth millionth billionth
be am are is was were been being
have has had having
will would (willing)
can cannot could
shall should
may might
must
do does did done doing
here there now then
where when how why
somewhere sometime somehow
anywhere anytime anyhow anyway
everywhere always
nowhere never
aboard about above across after against ago along alongside amid among amongst around as astride at atop before behind below beneath beside besides between beyond by despite de down during en except for from in inside into lest like minus near next notwithstanding of off on onto opposite out outside over par past per plus post since through throughout 'til till to toward towards under underneath unlike until unto up upon versus via vs. with within without worth
& and both but either et less minus 'n 'n' neither nor or plus so times v. versus vs. yet
albeit although because 'cause if neither since so than that though 'til till unless until whereas whether which while
yes no not to

Němčina

Můj seznam slov z uzavřených tříd, sestavený obdobně jako výše uvedený anglický seznam, ale bez Penn Treebanku :-). Pozor, některé skupiny slov nemám rozepsané, protože jsou dlouhé a říkalo by si to spíš o nějaké automatické rozgenerování (zejména základní a řadové číslovky).

ich mir mich du dir dich er ihm ihn sie ihr es wir uns euch ihnen
sich
mein meiner meine meines meinem meinen
dein deiner deine deines deinem deinen
sein seiner seine seines seinem seinen
ihr ihrer ihre ihres ihrem ihren
unser unserer unsere unseres unserem unseren
euer euerer euere eueres euerem eueren
dies dieser diese dieses diesem diesen
ein eine der die das dem den
wer wem wen wessen was welcher welche welches welchem welchen
jemand jemandem jemanden etwas einiges
irgendwas irgendwo irgendwann
jeder jede jedes jedem jeden alles beide
viel vieler viele vieles vielem vielen mehr meist meisten zu genug
wenig weniger wenige weniges wenigem wenigen wenigst wenigsten
kein keiner keine keines keinem keinen kaum nichts
null ein einer eine eines einem einen zwei drei vier fünf sechs sieben acht neun zehn
elf zwölf dreizehn vierzehn fünfzehn sechzehn siebzehn achtzehn neunzehn
zwanzig dreizig vierzig fünfzig sechzig siebzig achtzig neunzig
einundzwanzig zweiundzwanzig dreiundzwanzig vierundzwanzig … neunundneunzig
hundert tausend million milliarde
erster erstes erste erstem ersten
zweiter zweites zweite zweitem zweiten
dritter … vierter fünfter sechster siebter achter neunter zehnter
elfter zwölfter dreizehnter vierzehnter fünfzehnter sechzehnter siebzehnter achtzehnter neunzehnter
zwanzigster dreizigster vierzigster fünfzigster sechzigster siebzigster achtzigster neunzigster
sein bin bist is sind seid war warst waren wart gewesen sei seien wäre wären
haben habe hast hat habt hatte hattest hatten hattet gehabt hätte hätten
werden werde wirst wird werdet wurde wurdest wurden wurdet geworden würde würden
dürfen darf darfst darf dürft durfte durftest durften durftet dürfte dürften
können könne kannst kannt könnt konnte konntest konnten konntet könnte könntest könnten könntet
mögen mag magst möget mochte mochtest mochten mochtet möchte möchtest möchten möchtet
müssen muss musst müsst musste musstest mussten musstet müsste müssten
sollen soll sollst sollt sollte solltest sollten solltet sölle söllen
wollen will willst wollt wollte wolltest wollten wolltet
wissen weiss weisst wisst wusste wusstest wussten wusstet gewusst wüsste wüssten
hier dort jetzt nun damals so darum soviel
wo wann wie warum wieviel
irgendwo irgendwann irgendwie
nirgendwo nie niemals
aus bei beim mit nach von vom zu zum zur
durch für fürs gegen ohne um ums
über zusammen zwischen rund als in im ins auf aufs vor hinter unter trotz trotzdem während statt nur ausser innerhalb ausserhalb wie nah seit seitdem ab bis anstatt
& und aber entweder oder auch weder noch mal
trotzdem weil ob dass
ja nein nicht zu

Ruština

я меня мне мной ты тебя тебе тобой он его него ему нему ем нем она ее нее её неё ей ней оно мы нас нам нами вы вас вам вами они их них им ним ими ними
мой моя мое моё мои моего моей моих моему моим моем моём моими
твой твоя твое твоё твои твоего твоей твоих твоему твоим твоем твоём твоими
свой своя свое своё свои своего своей своих своему своим своем своём своими
наш наша наше наши нашего нашей наших нашему нашим нашем нашими
ваш ваша ваше ваши вашего вашей ваших вашему вашим вашем вашими
этот эта это эти этого этой этих этому этим этом этими
кто кого кому ком кем что чего чему чем
какой какая какое какие какого каких какому каким какою какими
каторый каторая каторое каторые каторого каторых каторому каторым каторою каторыми
чей чья
кто-нибудь кого-нибудь кому-нибудь ком-нибудь кем-нибудь что-нибудь чего-нибудь чему-нибудь чем-нибудь
какой-нибудь какая-нибудь какое-нибудь какие-нибудь какого-нибудь каких-нибудь какому-нибудь каким-нибудь какою-нибудь какими-нибудь
каторый-нибудь каторая-нибудь каторое-нибудь каторые-нибудь каторого-нибудь каторых-нибудь каторому-нибудь каторым-нибудь каторою-нибудь каторыми-нибудь
каждый каждая каждое каждого каждой каждому каждою каждом каждым
все всё
оба обе
много многие многих многим многими более
мало немного немножко немногие немногих немногим немногими меньше
никто никого никому ником никем ничто ничего ничему ничем
никакой никакая никакое никакие никакого никаких никакому никаким никакою никакими
никаторый никаторая никаторое никаторые никаторого никаторых никаторому никаторым никаторою никаторыми
ноль один одна одно одного одной одному одну одном одним два две три четыре пять шесть семь восемь девять десять
одиннадцать двенадцать тринадцать четырнадцать пятнадцать шестнадцать семнадцать восемнадцать девятнадцать
двадцать тридцать сорок пятьдесят шестьдесят семьдесят восемьдесят девяносто
сто двести пятьсот тысяча миллион миллиард
первый второй третий …
быть есть бы был была было были буду будешь будет будем будете будут
мочь могу можешь может можем можете могут моги мог могла могло могли могущий могший
должен должна должно должны надо
хотеть хочу хочешь хочет хотим хотите хотят хотел хотела хотело хотели хоти хотите хотящий хотевший хотя хотев
здесь там сейчас потом вот вон так потому только
где когда как почему сколько
где-нибудь когда-нибудь как-нибудь несколько
где-то когда-то
нигде никогда никак
без у до от из кроме против среди к по про за перед о в во на над под между с со рядом
и или ни а даже тоже
что если чтобы хотя
да нет пусть

Další zdroje


[ Back to the navigation ] [ Back to the content ]