[ Skip to the content ]

Institute of Formal and Applied Linguistics Wiki


[ Back to the navigation ]

Differences

This shows you the differences between two versions of the page.

Link to this comparison view

Next revision
Previous revision
Next revision Both sides next revision
external:autorske_pravo:autorske-pravo-a-souvisejici-otazky [2014/03/10 15:50]
stranak created
external:autorske_pravo:autorske-pravo-a-souvisejici-otazky [2014/05/19 15:33]
ufal
Line 1: Line 1:
 ====== Autorské právo ====== ====== Autorské právo ======
  
-Tato stránka slouží jako skladiště našich případných otázek na právníky ohledně toho, co si můžeme a nemůžeme dovolit při získávání a šíření dat, softwaru atd. +Tato stránka obsahuje naše otázky na právníky ohledně toho, co si můžeme a nemůžeme dovolit při získávání a šíření dat, softwaru atd.
-Možná si někdy pozveme odborníky na digitální autorské právo na přednášku, pak se tyto otázky mohou hodit jako náměty k diskuzi. +
- +
-**Vysvětlení** (aktualizováno: 17/2/2014) +
-//Právní seminář je na spadnutí. Proto níže uvedené okruhy otázek doplňujeme tak, aby jim právníci rozuměli (tj. například doplníme vysvětlení, co je anotovaný korpus). Pokud máte další otázky, pište je prosím na konec seznamu s datem, kdy otázku vkládáte.// (Bára at hladka@ufal.mff.cuni.cz)+
  
  
Line 25: Line 21:
       * Konkrétní příklad: z webu jde volně stáhnout [[http://nlp.stanford.edu/software/tagger.shtml|Stanford tagger]] a [[http://nlp.stanford.edu/software/lex-parser.shtml#Download|Stanford parser]], oba nástroje jsou pod licencí GNU GPL a obsahují i modely natrénované na anotovaném korpusu PennTB. Můžeme udělat to samé s našimi taggery a parsery?       * Konkrétní příklad: z webu jde volně stáhnout [[http://nlp.stanford.edu/software/tagger.shtml|Stanford tagger]] a [[http://nlp.stanford.edu/software/lex-parser.shtml#Download|Stanford parser]], oba nástroje jsou pod licencí GNU GPL a obsahují i modely natrénované na anotovaném korpusu PennTB. Můžeme udělat to samé s našimi taggery a parsery?
   - **Rekonstrukce anotovaného korpusu.** Pomocí parseru (natrénovaného na modelu popsaném výše) zpracujeme texty z Wikipedie. Můžeme takto vzniklý anotovaný korpus dát volně ke stažení (pod licencí, pod jakou je daná Wikipedie, většinou CC-BY-SA)?   - **Rekonstrukce anotovaného korpusu.** Pomocí parseru (natrénovaného na modelu popsaném výše) zpracujeme texty z Wikipedie. Můžeme takto vzniklý anotovaný korpus dát volně ke stažení (pod licencí, pod jakou je daná Wikipedie, většinou CC-BY-SA)?
-  - **HamleDT.** Aktuálně je možné od nás [[http://quest.ms.mff.cuni.cz/corp-lic/hamledt10f-reg.html|stáhnout]] harmonizované verze pouze několika korpusů (tj. těch, kterým to jejich licence dovoluje). Pro jiné korpusy, např. anglický PennTB, stačí, když uživatel odklikne ve webovém formuláři, že má práva na původní korpusy, a mi mu pak nabídneme ke stažení jejich harmonizované verze? +  - **HamleDT.** Aktuálně je možné od nás [[http://quest.ms.mff.cuni.cz/corp-lic/hamledt10f-reg.html|stáhnout]] harmonizované verze pouze několika korpusů (tj. těch, kterým to jejich licence dovoluje). Pro jiné korpusy, např. anglický PennTB, stačí, když uživatel odklikne ve webovém formuláři, že má práva na původní korpusy, a my mu pak nabídneme ke stažení jejich harmonizované verze? 
   - **Google Translate** Přeložili jsme všechny korpusy z HamleDT pomocí [[http://research.google.com/university/translate/|akademické verze Google Translate]]. Můžeme takto vzniklé překlady zveřejnit?   - **Google Translate** Přeložili jsme všechny korpusy z HamleDT pomocí [[http://research.google.com/university/translate/|akademické verze Google Translate]]. Můžeme takto vzniklé překlady zveřejnit?
   - **Data bez licence** Co je možné dělat s korpusem, který člověk najde někde polo-anonymně na webu a nemá žádnou přiloženou licenci?   - **Data bez licence** Co je možné dělat s korpusem, který člověk najde někde polo-anonymně na webu a nemá žádnou přiloženou licenci?
Line 34: Line 30:
   - **Zamíchání korpusu** Je možné zveřejnit korpus, ve kterém jsou texty "znečitelněny" tím, že jsou proházeny odstavce (napříč obrovským množstvím textu, takže není prakticky možno text vrátit zpět), věty, nebo dokonce menší části (kousky vět)? Jakou licenci je možno takovým datům dát?   - **Zamíchání korpusu** Je možné zveřejnit korpus, ve kterém jsou texty "znečitelněny" tím, že jsou proházeny odstavce (napříč obrovským množstvím textu, takže není prakticky možno text vrátit zpět), věty, nebo dokonce menší části (kousky vět)? Jakou licenci je možno takovým datům dát?
      * Konkrétní příklad: česko-anglický anotovaný korpus [[https://ufal.mff.cuni.cz/czeng/|CzEng]] obsahuje mimo jiné texty stažené z webu. Při stahování jsme respektovali soubory robots.txt, ale nekontrolovali jsme, zda je na stránkách uvedena nějaká licence.      * Konkrétní příklad: česko-anglický anotovaný korpus [[https://ufal.mff.cuni.cz/czeng/|CzEng]] obsahuje mimo jiné texty stažené z webu. Při stahování jsme respektovali soubory robots.txt, ale nekontrolovali jsme, zda je na stránkách uvedena nějaká licence.
-     <del>Konkrétní příklad: zamíchané části Českého národního korpusu jde [[https://lindat.mff.cuni.cz/repository/xmlui/handle/11858/00-097C-0000-0023-1359-1|stáhnout]] pod [[http://ucnk.ff.cuni.cz/doc/CNC_license.php|licencí]], která nedovoluje redistribuci odvozených děl.</del> Zajímalo by nás, zda by to bylo možné vydat třeba pod nějakou volnější licencí CC-BY-NC, ale to asi nejde říct, když neznáme smlouvu, kterou ČNK podepsalo s jednotlivými poskytovateli textů (na webu tu smlouvu nemohu najít). Další otázka je, zda to zamíchání z právního hlediska něco mění. +     * Zajímalo by nás, zda by to bylo možné vydat třeba pod nějakou volnější licencí CC-BY-NC, ale to asi nejde říct, když neznáme smlouvu, kterou vydavatel korpusu podepsal s jednotlivými poskytovateli textů. Další otázka je, zda to zamíchání z právního hlediska něco mění. 
   - **Webové aplikace a služby** Pokud máme data s ND (no distribution) podmínkou, smíme zpřístupňovat tato data na webu v aplikaci (např. webové prohlížení)? Smíme tato data použít např. v systému strojového překladu, který je pak na webu přístupný jako služba?   - **Webové aplikace a služby** Pokud máme data s ND (no distribution) podmínkou, smíme zpřístupňovat tato data na webu v aplikaci (např. webové prohlížení)? Smíme tato data použít např. v systému strojového překladu, který je pak na webu přístupný jako služba?
   - **Model podruhé**. Pokud budeme statisticky vytěžovat korpus nebo jiná autorská díla, lze nalézt nějakou prakticky definovatelnou hranici, za kterou už je zaručeno, že se toto užití nijak nedotýká autorských práv k původním dílům? (tato otázka je pokusem o zobecnění několika předchozích otázek, zejm. 1,2,10). Zřejmě bude existovat nějaká škála, kde na jednom konci je získaný statistický model tak obecný, že autorská práva k původním dílům zjevně dotčena nejsou (např. pokud zveřejním počet textů v mém souboru, nebo jejich nejobecnější charakteristicky jako např. frekvence užití jednotlivých písmen). Na druhém konci škály je pak např. model, který obsahuje celý původní text, a zveřejnění takového modelu je tedy zjevně užitím ve smyslu AZ. Lze např. tuto hranici definovat podmínkou, že původní dílo ani jeho podstatnější části nelze z modelu technickými prostředky zrekonstruovat? Anebo podmínkou, že model popisuje jen tak malé jednotky (např. slova nebo krátké posloupnosti slov), které se běžně vyskytují i v dalších dílech a tudíž nejsou samy o sobě výsledkem jedinečné tvůrčí činnosti ve smyslu § 2 odst. 1 AZ?    - **Model podruhé**. Pokud budeme statisticky vytěžovat korpus nebo jiná autorská díla, lze nalézt nějakou prakticky definovatelnou hranici, za kterou už je zaručeno, že se toto užití nijak nedotýká autorských práv k původním dílům? (tato otázka je pokusem o zobecnění několika předchozích otázek, zejm. 1,2,10). Zřejmě bude existovat nějaká škála, kde na jednom konci je získaný statistický model tak obecný, že autorská práva k původním dílům zjevně dotčena nejsou (např. pokud zveřejním počet textů v mém souboru, nebo jejich nejobecnější charakteristicky jako např. frekvence užití jednotlivých písmen). Na druhém konci škály je pak např. model, který obsahuje celý původní text, a zveřejnění takového modelu je tedy zjevně užitím ve smyslu AZ. Lze např. tuto hranici definovat podmínkou, že původní dílo ani jeho podstatnější části nelze z modelu technickými prostředky zrekonstruovat? Anebo podmínkou, že model popisuje jen tak malé jednotky (např. slova nebo krátké posloupnosti slov), které se běžně vyskytují i v dalších dílech a tudíž nejsou samy o sobě výsledkem jedinečné tvůrčí činnosti ve smyslu § 2 odst. 1 AZ? 
Line 40: Line 36:
   - **NC a úspora nákladů ** Je použití vedoucí k úspoře nákladů ještě NC? Pokud organizace použije náš produkt licencovaný jako CC NC a sice jí z toho neplyne žádný příjem (např. nemá v té souvislosti žádného platícího zákazníka), ale ušetří jí to náklady (např. potřebuje něco otestovat a bez našich dat by to musela dělat pracněji ručně nebo koupit řešení odjinud), je to OK? Toto se týká také státních institucí, které žádný zisk z principu negenerují, ale úspora u nich nastat může - je to NC?   - **NC a úspora nákladů ** Je použití vedoucí k úspoře nákladů ještě NC? Pokud organizace použije náš produkt licencovaný jako CC NC a sice jí z toho neplyne žádný příjem (např. nemá v té souvislosti žádného platícího zákazníka), ale ušetří jí to náklady (např. potřebuje něco otestovat a bez našich dat by to musela dělat pracněji ručně nebo koupit řešení odjinud), je to OK? Toto se týká také státních institucí, které žádný zisk z principu negenerují, ale úspora u nich nastat může - je to NC?
   - **NC a firmy ** (souvisí s bodem 9) Je vůbec možné, aby firma deklarovala, že nějaký náš produkt používá pod nekomerční licencí, když smyslem firmy je z principu vytváření zisku?   - **NC a firmy ** (souvisí s bodem 9) Je vůbec možné, aby firma deklarovala, že nějaký náš produkt používá pod nekomerční licencí, když smyslem firmy je z principu vytváření zisku?
 +  - ** Obrazová data ** Liší se nějak autorská práva k textovým a obrazovým datům? Pokud mohu stáhnout velké mmnožství textu z webu, rozsekat je na věty, náhodně je zamíchat a potom distribuovat (viz výše CzEng), mohu něco podobného udělat s obrázky (které samozřejmě nemůžu rozsekat a náhodně zamíchat, ale můžu je např. zmenšit). Příklad: Zabývám se analýzou obsahu přebalů knih, stáhnul jsem 50 tis. obrázků z Amazomu a chci je dát k dispozici ostatním (nekomerčně). Mohu to udělat?

[ Back to the navigation ] [ Back to the content ]