სასამართლო პრაქტიკა
AI & Copyright
LAION-5B (Large-scale Artificial Intelligence Open Network 5B)
AI ტრენინგის მონაცემთა ბაზის დავა
მიმოხილვა
LAION-5B არის ერთ-ერთი ყველაზე დიდი საჯაროდ ხელმისაწვდომი AI ტრენინგის მონაცემთა ბაზა, რომელიც შეიცავს დაახლოებით 5.85 მილიარდ სურათ-ტექსტის წყვილს ინტერნეტიდან და გამოყენებულია Stable Diffusion-ის მსგავსი სისტემების გასაწვრთნელად.
ფაქტები
- LAION, გერმანულმა არასამთავრობო ორგანიზაციამ, LAION-5B გამოაქვეყნა 2022 წელს.
- მონაცემები შეგროვდა Common Crawl-ის მეშვეობით.
- ბაზა შეიცავს URL-ებსა და მეტამონაცემებს, არა თვითონ სურათებს.
- ფართოდ გამოიყენება დიდი მასშტაბის გენერაციული AI მოდელების ტრენინგისთვის.
- კრიტიკოსები ამტკიცებენ, რომ ბაზაში მოხვედრილია საავტორო უფლებებით დაცული ნამუშევრები და პერსონალური მონაცემები ნებართვის გარეშე.
სამართლებრივი საკითხი
წარმოადგენს თუ არა საავტორო უფლებებით დაცული ნამუშევრების გამოყენება LAION-5B-ის მსგავს ბაზებში AI-ის ტრენინგისთვის უფლების დარღვევას, თუ ის ნებართვის გარეშე იქნა შეგროვებული?
არგუმენტები - უფლების მფლობელები
საავტორო ნამუშევრები გამოყენებულია ნებართვის გარეშე; AI-ის ტრენინგი მოითხოვს დაცული ნამუშევრების კოპირებას; ეს აზიანებს ავტორების ეკონომიკურ ინტერესებსა და ლიცენზირების შესაძლებლობებს.
არგუმენტები - LAION / დეველოპერები
LAION გვაწვდის მხოლოდ URL-ებსა და მეტამონაცემებს, არა ჰოსტირებულ სურათებს; ბაზა შექმნილია კვლევითი მიზნებისთვის; AI-ის ტრენინგი შესაძლოა ჩაითვალოს ტრანსფორმაციულ გამოყენებად ან მოექცეს fair use-ის / ტექსტისა და მონაცემთა მოპოვების (TDM) გამონაკლისების ფარგლებში იურისდიქციის მიხედვით.
დაკავშირებული დავები
Andersen v. Stability AI; Getty Images v. Stability AI - მოსარჩელეები ამტკიცებენ, რომ მათი ნამუშევრები გამოყენებულია LAION-5B-ის მეშვეობით ნებართვის გარეშე.
მნიშვნელობა
აყენებს ფუნდამენტურ კითხვებს: შესაძლებელია თუ არა საჯაროდ ხელმისაწვდომი ონლაინ კონტენტის გამოყენება AI-ის ტრენინგისთვის თანხმობის გარეშე; ბალანსი ინოვაციასა და ინტელექტუალური საკუთრების უფლებებს შორის; ვებ სკრეიპინგის კანონიერება; და ურთიერთობა AI-ის ტრენინგს, საავტორო კანონს, GDPR-სა და EU AI Act-ს შორის.
აკადემიური მიმოხილვა
LAION-5B არის ფართო მასშტაბის მონაცემთა ბაზა, რომელიც შეიცავს დაახლოებით 5.85 მილიარდ სურათ-ტექსტის წყვილს, შეგროვებულს საჯაროდ ხელმისაწვდომი ინტერნეტ წყაროებიდან. ის ფართოდ გამოიყენება გენერაციული AI სისტემების ტრენინგისთვის, მათ შორის Stable Diffusion-ის. ბაზა გახდა მნიშვნელოვანი სამართლებრივი და აკადემიური დებატის საგანი, რადგან ვარაუდით შეიცავს საავტორო უფლებებით დაცულ ნამუშევრებსა და პერსონალურ მონაცემებს ნებართვის გარეშე. ცენტრალური სამართლებრივი კითხვაა, წარმოადგენს თუ არა ასეთი მასალის გამოყენება AI-ის ტრენინგისთვის საავტორო უფლების დარღვევას, თუ ის ხვდება არსებული გამონაკლისების ფარგლებში. LAION-5B გახდა ერთ-ერთი ყველაზე მნიშვნელოვანი მაგალითი თანამედროვე დებატებში AI-ის რეგულირების, საავტორო კანონისა და მონაცემთა მართვის შესახებ.