სასამართლო პრაქტიკა
AI & Copyright

LAION-5B (Large-scale Artificial Intelligence Open Network 5B)

AI ტრენინგის მონაცემთა ბაზის დავა

მიმოხილვა

LAION-5B არის ერთ-ერთი ყველაზე დიდი საჯაროდ ხელმისაწვდომი AI ტრენინგის მონაცემთა ბაზა, რომელიც შეიცავს დაახლოებით 5.85 მილიარდ სურათ-ტექსტის წყვილს ინტერნეტიდან და გამოყენებულია Stable Diffusion-ის მსგავსი სისტემების გასაწვრთნელად.

ფაქტები

  1. LAION, გერმანულმა არასამთავრობო ორგანიზაციამ, LAION-5B გამოაქვეყნა 2022 წელს.
  2. მონაცემები შეგროვდა Common Crawl-ის მეშვეობით.
  3. ბაზა შეიცავს URL-ებსა და მეტამონაცემებს, არა თვითონ სურათებს.
  4. ფართოდ გამოიყენება დიდი მასშტაბის გენერაციული AI მოდელების ტრენინგისთვის.
  5. კრიტიკოსები ამტკიცებენ, რომ ბაზაში მოხვედრილია საავტორო უფლებებით დაცული ნამუშევრები და პერსონალური მონაცემები ნებართვის გარეშე.

სამართლებრივი საკითხი

წარმოადგენს თუ არა საავტორო უფლებებით დაცული ნამუშევრების გამოყენება LAION-5B-ის მსგავს ბაზებში AI-ის ტრენინგისთვის უფლების დარღვევას, თუ ის ნებართვის გარეშე იქნა შეგროვებული?

არგუმენტები - უფლების მფლობელები

საავტორო ნამუშევრები გამოყენებულია ნებართვის გარეშე; AI-ის ტრენინგი მოითხოვს დაცული ნამუშევრების კოპირებას; ეს აზიანებს ავტორების ეკონომიკურ ინტერესებსა და ლიცენზირების შესაძლებლობებს.

არგუმენტები - LAION / დეველოპერები

LAION გვაწვდის მხოლოდ URL-ებსა და მეტამონაცემებს, არა ჰოსტირებულ სურათებს; ბაზა შექმნილია კვლევითი მიზნებისთვის; AI-ის ტრენინგი შესაძლოა ჩაითვალოს ტრანსფორმაციულ გამოყენებად ან მოექცეს fair use-ის / ტექსტისა და მონაცემთა მოპოვების (TDM) გამონაკლისების ფარგლებში იურისდიქციის მიხედვით.

დაკავშირებული დავები

Andersen v. Stability AI; Getty Images v. Stability AI - მოსარჩელეები ამტკიცებენ, რომ მათი ნამუშევრები გამოყენებულია LAION-5B-ის მეშვეობით ნებართვის გარეშე.

მნიშვნელობა

აყენებს ფუნდამენტურ კითხვებს: შესაძლებელია თუ არა საჯაროდ ხელმისაწვდომი ონლაინ კონტენტის გამოყენება AI-ის ტრენინგისთვის თანხმობის გარეშე; ბალანსი ინოვაციასა და ინტელექტუალური საკუთრების უფლებებს შორის; ვებ სკრეიპინგის კანონიერება; და ურთიერთობა AI-ის ტრენინგს, საავტორო კანონს, GDPR-სა და EU AI Act-ს შორის.

აკადემიური მიმოხილვა

LAION-5B არის ფართო მასშტაბის მონაცემთა ბაზა, რომელიც შეიცავს დაახლოებით 5.85 მილიარდ სურათ-ტექსტის წყვილს, შეგროვებულს საჯაროდ ხელმისაწვდომი ინტერნეტ წყაროებიდან. ის ფართოდ გამოიყენება გენერაციული AI სისტემების ტრენინგისთვის, მათ შორის Stable Diffusion-ის. ბაზა გახდა მნიშვნელოვანი სამართლებრივი და აკადემიური დებატის საგანი, რადგან ვარაუდით შეიცავს საავტორო უფლებებით დაცულ ნამუშევრებსა და პერსონალურ მონაცემებს ნებართვის გარეშე. ცენტრალური სამართლებრივი კითხვაა, წარმოადგენს თუ არა ასეთი მასალის გამოყენება AI-ის ტრენინგისთვის საავტორო უფლების დარღვევას, თუ ის ხვდება არსებული გამონაკლისების ფარგლებში. LAION-5B გახდა ერთ-ერთი ყველაზე მნიშვნელოვანი მაგალითი თანამედროვე დებატებში AI-ის რეგულირების, საავტორო კანონისა და მონაცემთა მართვის შესახებ.