Федеральний суд у США відмовив компанії Nvidia у спробі закрити судову справу, яку подали письменники. Автори звинувачують технологічного гіганта у незаконному використанні піратських книг для навчання своїх мовних моделей штучного інтелекту. Це рішення може стати прецедентом для всієї галузі, визначивши межі допустимого використання чужих творів без дозволу авторів.

Позов подали відомі письменники Браян Кін, Абді Наземян та Стюарт О'Нан. Вони стверджують, що Nvidia тренувала свої системи на великих наборах даних, які містили незаконно скопійовані книги. У центрі конфлікту знаходиться великий набір даних «The Pile», до якого входить база Books3. Ця колекція нараховує майже 200 тисяч піратських книг, взятих із так званої «тіньової бібліотеки» Bibliotik.

Компанія заперечувала звинувачення, стверджуючи, що одна з її моделей — Megatron 345M — навчалася лише на «чистій» частині даних, без піратського контенту. Однак федеральний суддя Джон Тайгер не погодився закривати справу на цьому етапі. Він зазначив, що автори надали достатньо аргументів для продовження розгляду, оскільки Books3 становила приблизно 12% загального набору даних.

Суд також зобов'язав перевірити роль Nvidia у поширенні піратських матеріалів. Письменники стверджують, що компанія надавала клієнтам інструменти для автоматичного завантаження та обробки «The Pile». Серед згаданих у позові компаній — Amazon, Writer та Persimmon AI Labs. Суддя визнав, що автори достатньо обґрунтували можливу обізнаність Nvidia про використання її інструментів клієнтами.

Водночас суд відхилив одну з вимог позивачів щодо твердження, що Nvidia повністю контролювала дії своїх клієнтів. На думку судді, доказів такого повного контролю наразі недостатньо. Однак основна частина позову залишається в силі, і розгляд справи триватиме далі.

Рішення суду може мати значні наслідки для розвитку штучного інтелекту в усьому світі. Воно визначить, чи зможуть технологічні компанії надалі використовувати чужі твори для навчання алгоритмів без отримання дозволу від авторів. Справа Nvidia є однією з найважливіших у сфері авторського права в епоху цифрових технологій.