Для написания, проведения рекламных кампаний и поддержки побочных проектов ИИ необходимы учебные материалы. ChatGPT понадобилось около 300 миллиардов слов, чтобы начать работу, и он продолжает обучаться на основе взаимодействия с пользователями. Однако люди не получают признания или компенсации за создание контента, который ИИ поглощает. Авторы, художники и новостные организации уже подали бесчисленные иски о нарушении авторских прав против таких гигантов ИИ, как OpenAI и Microsoft, поскольку обнаружили, что ИИ-боты могут говорить о их защищенных авторским правом работах “слишком точно”, что указывает на то, что эти работы находятся в учебных данных ИИ.
Ответ Сулеймана
Именно поэтому генерального директора Microsoft по вопросам ИИ Мустафу Сулеймана спросили на фестивале Aspen Ideas в конце июня, украли ли компании ИИ интеллектуальную собственность мира.
Ответ Сулеймана? Почти весь контент в Интернете, за одним возможным исключением, является допустимым для обучения ИИ. Связано: Стартап по ИИ, сотрудничающий с Microsoft, судится с крупнейшими звукозаписывающими компаниями мира.
“Я думаю, что в отношении контента, который уже находится в открытом доступе в Интернете, социальный контракт этого контента с 90-х годов заключается в том, что это допустимое использование,” сказал Сулейман. Сулейман заявил, что “любой” может копировать или воссоздавать контент в открытом Интернете. “Это была свободная дорога,” сказал он. “Таково было понимание.” Однако некоторые новостные сайты и издатели попросили не сканировать или не индексировать их. “Это серая зона, и я думаю, что это будет решаться через суды,” сказал Сулейман. Мустафа Сулейман. Фотограф: Стефан Вермут/Блумберг через Getty Images
Сулейман возглавляет Microsoft AI в то время, когда Microsoft инвестировала миллиарды в эту технологию. Его позиция по вопросу допустимого использования и недопустимого использования проясняет, как компании ИИ могут защищать обвинения в нарушении интеллектуальной собственности в суде. Например, OpenAI якобы использовала более миллиона часов видео на YouTube для обучения ChatGPT. Когда ее спросили, использовались ли видео с YouTube или социальных сетей для создания видеогенератора Sora от OpenAI, технический директор компании Мира Муратти сказала: “Мы использовали общедоступные данные и лицензированные данные” и не уточнила дальше.
ИИ также, по-видимому, поглощает работы, созданные другими ИИ, что приводит к снижению качества выходного материала. Эксперты оценивают, что 90% онлайн-контента будет создано ИИ в течение следующих двух лет. Связано: Самое загружаемое новостное приложение в США могло опубликовать десятки поддельных историй, написанных ИИ.