[ Skip to the content ]

Institute of Formal and Applied Linguistics Wiki


[ Back to the navigation ]

Differences

This shows you the differences between two versions of the page.

Link to this comparison view

Both sides previous revision Previous revision
Next revision
Previous revision
Next revision Both sides next revision
external:autorske_pravo:autorske-pravo-a-souvisejici-otazky [2014/03/10 21:44]
ufal
external:autorske_pravo:autorske-pravo-a-souvisejici-otazky [2014/05/07 15:50]
ufal
Line 30: Line 30:
   - **Zamíchání korpusu** Je možné zveřejnit korpus, ve kterém jsou texty "znečitelněny" tím, že jsou proházeny odstavce (napříč obrovským množstvím textu, takže není prakticky možno text vrátit zpět), věty, nebo dokonce menší části (kousky vět)? Jakou licenci je možno takovým datům dát?   - **Zamíchání korpusu** Je možné zveřejnit korpus, ve kterém jsou texty "znečitelněny" tím, že jsou proházeny odstavce (napříč obrovským množstvím textu, takže není prakticky možno text vrátit zpět), věty, nebo dokonce menší části (kousky vět)? Jakou licenci je možno takovým datům dát?
      * Konkrétní příklad: česko-anglický anotovaný korpus [[https://ufal.mff.cuni.cz/czeng/|CzEng]] obsahuje mimo jiné texty stažené z webu. Při stahování jsme respektovali soubory robots.txt, ale nekontrolovali jsme, zda je na stránkách uvedena nějaká licence.      * Konkrétní příklad: česko-anglický anotovaný korpus [[https://ufal.mff.cuni.cz/czeng/|CzEng]] obsahuje mimo jiné texty stažené z webu. Při stahování jsme respektovali soubory robots.txt, ale nekontrolovali jsme, zda je na stránkách uvedena nějaká licence.
-     <del>Konkrétní příklad: zamíchané části Českého národního korpusu jde [[https://lindat.mff.cuni.cz/repository/xmlui/handle/11858/00-097C-0000-0023-1359-1|stáhnout]] pod [[http://ucnk.ff.cuni.cz/doc/CNC_license.php|licencí]], která nedovoluje redistribuci odvozených děl.</del> Zajímalo by nás, zda by to bylo možné vydat třeba pod nějakou volnější licencí CC-BY-NC, ale to asi nejde říct, když neznáme smlouvu, kterou ČNK podepsalo s jednotlivými poskytovateli textů (na webu tu smlouvu nemohu najít). Další otázka je, zda to zamíchání z právního hlediska něco mění. +     * Zajímalo by nás, zda by to bylo možné vydat třeba pod nějakou volnější licencí CC-BY-NC, ale to asi nejde říct, když neznáme smlouvu, kterou vydavatel korpusu podepsal s jednotlivými poskytovateli textů. Další otázka je, zda to zamíchání z právního hlediska něco mění. 
   - **Webové aplikace a služby** Pokud máme data s ND (no distribution) podmínkou, smíme zpřístupňovat tato data na webu v aplikaci (např. webové prohlížení)? Smíme tato data použít např. v systému strojového překladu, který je pak na webu přístupný jako služba?   - **Webové aplikace a služby** Pokud máme data s ND (no distribution) podmínkou, smíme zpřístupňovat tato data na webu v aplikaci (např. webové prohlížení)? Smíme tato data použít např. v systému strojového překladu, který je pak na webu přístupný jako služba?
   - **Model podruhé**. Pokud budeme statisticky vytěžovat korpus nebo jiná autorská díla, lze nalézt nějakou prakticky definovatelnou hranici, za kterou už je zaručeno, že se toto užití nijak nedotýká autorských práv k původním dílům? (tato otázka je pokusem o zobecnění několika předchozích otázek, zejm. 1,2,10). Zřejmě bude existovat nějaká škála, kde na jednom konci je získaný statistický model tak obecný, že autorská práva k původním dílům zjevně dotčena nejsou (např. pokud zveřejním počet textů v mém souboru, nebo jejich nejobecnější charakteristicky jako např. frekvence užití jednotlivých písmen). Na druhém konci škály je pak např. model, který obsahuje celý původní text, a zveřejnění takového modelu je tedy zjevně užitím ve smyslu AZ. Lze např. tuto hranici definovat podmínkou, že původní dílo ani jeho podstatnější části nelze z modelu technickými prostředky zrekonstruovat? Anebo podmínkou, že model popisuje jen tak malé jednotky (např. slova nebo krátké posloupnosti slov), které se běžně vyskytují i v dalších dílech a tudíž nejsou samy o sobě výsledkem jedinečné tvůrčí činnosti ve smyslu § 2 odst. 1 AZ?    - **Model podruhé**. Pokud budeme statisticky vytěžovat korpus nebo jiná autorská díla, lze nalézt nějakou prakticky definovatelnou hranici, za kterou už je zaručeno, že se toto užití nijak nedotýká autorských práv k původním dílům? (tato otázka je pokusem o zobecnění několika předchozích otázek, zejm. 1,2,10). Zřejmě bude existovat nějaká škála, kde na jednom konci je získaný statistický model tak obecný, že autorská práva k původním dílům zjevně dotčena nejsou (např. pokud zveřejním počet textů v mém souboru, nebo jejich nejobecnější charakteristicky jako např. frekvence užití jednotlivých písmen). Na druhém konci škály je pak např. model, který obsahuje celý původní text, a zveřejnění takového modelu je tedy zjevně užitím ve smyslu AZ. Lze např. tuto hranici definovat podmínkou, že původní dílo ani jeho podstatnější části nelze z modelu technickými prostředky zrekonstruovat? Anebo podmínkou, že model popisuje jen tak malé jednotky (např. slova nebo krátké posloupnosti slov), které se běžně vyskytují i v dalších dílech a tudíž nejsou samy o sobě výsledkem jedinečné tvůrčí činnosti ve smyslu § 2 odst. 1 AZ? 

[ Back to the navigation ] [ Back to the content ]