[ Skip to the content ]

Institute of Formal and Applied Linguistics Wiki


[ Back to the navigation ]

Autorské právo

Tato stránka obsahuje naše otázky na právníky ohledně toho, co si můžeme a nemůžeme dovolit při získávání a šíření dat, softwaru atd.

Pro snazší porozumění otázek

Takto označené odpovědi jsou moje (MP) osobní interpretace odpovědí, jak zazněly na semináři (čili se mohu mýlit, klidně to prosím upravte).

Otázky

Pokud model obsahuje jen “čísla a statistiky” (navíc je to výstup počítačového programu, nikoli člověka), nejspíš se vůbec nejedná o autorské dílo (a nevztahuje se na něj tedy žádná ochrana z autorského zákona, obchodní tajemství to zřejmě také není). Pokud model obsahuje n-gramy původního textu, může to být složitější (trigram “Upeč třeba zeď” parodující Svěráka použitý v reklamě byl soudem brán jako autorské dílo). Nicméně pokud ty n-gramy nebudou unikátním autorským výtvorem (tedy budou mít více výskytů v různých dokumentech), tak by to mělo být bezpečné. Měli bychom samozřejmě respektovat licenci, pod kterou jsme dostali původní korpus (pokud by tam např. bylo explicitně zakázané budování modelů na základě toho korpusu).
Ano, můžeme. Měli bychom splnit i podmínku BY, tedy uvést autory, což je v případě Wikipedie snadné – jsou uvedeni na dané stránce Wikipedie. (Takže asi stačí přidat odkaz na všechny stránky Wikipedie, které jsme použili?).
To, že uživatel prohlásí (odklikne), že má práva na cosi, nás nijak právně nechrání. Lepší by bylo vyjednat si smlouvu (licenci s možností podlicencování) s vlastníkem práv původního korpusu (zde PennTB).
Musíme mít předně právo distribuovat původní korpusy (a asi by to neměla být non-derivative licence). Ve smlouvě s Googlem se dále požaduje, že musíme u překladů uvést, že byly vytvořeny pomocí Google Translate.
Když si fyzická osoba stáhne text (nikoli však software či noty) a čte si ho, tak se ještě nejedná o užití díla (webový dokument v cache počítače se pokládá za dočasnou rozmnoženinu, pro kterou platí výjimka). Když to udělá právnická osoba (Univerzita Karlova), tak už se jedná o užití díla. To, že někdo dává něco na web, neznamená, že k tomu je nějaká implicitní licence. Jako Univerzita bychom možná mohli využít výjimky pro knihovny a akademické využití. Stejně nám to ale nedává právo korpus (nebo texty stažené z webu) dále šířit.
Pokud byla díla vytvořena po roku 2000 v rámci pracovních povinností, tak se jedná o díla zaměstnanecká. Nositelem práv je pak zaměstnavatel (třeba UK) a ten je může libovolně používat. Pro starší díla platil starší zákon, který by se musel prostudovat, ale asi z něho taktéž vyplývá, že zaměstnavatel může díla využívat k jejich předpokládanému účelu.
Otázka místní působnosti práva je v době Internetu složitá. Obecně v EU (dle posledních judikatur) ale rozhodování záleží hlavně na tom, kde dochází k užití díla, tedy komu je stránka určena, v které zemi si ji lidé stahují. O to, kde je umístěn server prý nejde.
Není přesná shoda na tom, jak široce chápat podmínku non-commercial. Dle nedávného průzkumu Creative Commons prý většina vydavatelů NC děl preferuje širší vymezení, tedy povolují využití i pro takovéto účely, které mohou nepřímo vést k zisku. Asi by ale bylo možné zkusit žalovat firmu i za nepřímý zisk, pokud bychom k tomu měli nějaké důkazy.
Na jednu stranu samotné zamíchání dat může být vnímáno jen jako jiná forma rozšiřování autorského díla (a na formě nezáleží, při soudu by stačilo dokázat jen, že část díla byla dostupná a předpokládá se, že zbytek též). Na druhou stranu, pokud ze zamíchaného textu není poznat, odkud je, tak by to nemělo být problematické. A samozřejmě, kde není žalobce, není soudce. Mohli bychom zkusit zamíchat do poskytovaného korpusu také volná díla z archivů knihoven.
Obvykle (v CC licencích vždy) zkratka ND znamená non-derivative. Tato podmínka nebrání zpřístupnění dat přes nějakou službu. V původním dotazu však bylo “no distribution”, což by samozřejmě zpřístupňování dat přes web odporovalo. Otázka se ale neptá na zpřístupnění těch původních dat. Jde o to, že uživatel zadá do naší webové služby vlastní text k přeložení, ale automatický překlad obsahuje fráze z původních trénovacích dat. Provozování takovéto služby by mělo být v pořádku, i kdyby původní data byly no-distribution. Nejedná se totiž o užití díla (tj. těch původních dat).
Tato hranice není přesně vymezena.
V podstatě ano. V situaci 1 by se měl přidat ještě “třístupňový test” (nemohu třeba jako citaci uvést celou povídku, to bych pak musel vlastníkovi majetkových práv zaplatit dvojnásobek ušlého zisku). K situaci 3 (školní dílo) by šlo dodat: Univerzita má právo na získání licence od studenta (lze to prý vymáhat i soudně). Univerzita to může i bez licence interně využívat. Pokud by na tom student hodně vydělal, může univerzita žádat o uhrazení části nákladů.
Ne. Mohu poskytnout odkazy na url Amazonu, kde se ty obrázky nachází. Nemohu ale ty obrázky stáhnout a distribuovat dál (byť třeba rozmazané či zmenšené), aniž bych k tomu měl licenci od Amazonu.

[ Back to the navigation ] [ Back to the content ]