OpenAI у липні 2024 року запускає тестову версію своєї пошукової системи SearchGPT. Інструмент цитуватиме контент від видавців-партнерів, із якими компанія уклала ліцензійні угоди. Більше інформації про SearchGPT опублікував The Wall Street Journal.

Як працюватиме SearchGPT?

Пошукова система SearchGPT узагальнюватиме інформацію, знайдену на вебсайтах, зокрема новинних, і даватиме змогу користувачам ставити додаткові запитання, так само як у ChatGPT. Інструмент вказуватиме покликання на джерела в кінці кожної відповіді в круглих дужках. OpenAI також створила бічну панель, де користувачі можуть бачити більше результатів і джерел з відповідною інформацією.

Станом на липень 2024 року SearchGPT тестуватимуть як окремий продукт, але з часом OpenAI планує інтегрувати його у свій основний сервіс ChatGPT. Журналісти будуть серед перших кількох тестувальників. Також OpenAI створить список очікування, в якому американські користувачі зможуть зареєструватися, щоб протестувати інструмент.

Як SearchGPT вплине на видавців?

Протягом останніх місяців представники OpenAI демонстрували макети нового інструменту видавцям. Станом на липень не зрозуміло, скільки трафіку може принести видавцям SearchGPT.

Компанія провела багато дискусій з видавцями щодо того, який їхній новинний контент використовуватимуть у відповідях на запити. Видавці занепокоєні тим, що пошукові інструменти на основі штучного інтелекту від OpenAI або Google, що належить Alphabet, надаватимуть повні відповіді на основі новинного контенту, усуваючи необхідність переходити за покликання на статтю. Тобто ШІ може позбавити видавців інтернет-трафіку й доходів від реклами. Їхні побоювання ще більше посилилися, коли в червні чат-бот Perplexity без дозволу використав матеріали видання Forbes.

Видавці зможуть керувати тим, як їхній контент з’являється в SearchGPT. Як зазначає OpenAI, SearchGPT стосується пошуку й не пов’язаний із навчанням ШІ-моделей. Сайти можуть з’являтися в результатах пошуку, навіть якщо вони відмовилися від навчання генеративного ШІ. OpenAI використовує вебсканери й боти для виконання дій для своїх продуктів, автоматично або за запитом користувача. За допомогою файлу robots.txt вебмайстери можуть керувати, як ШІ взаємодіятиме з їхніми сайтами й контентом. Кожен параметр не залежить від інших — наприклад, вебмайстер може дозволити OAI-SearchBot (бот для покликань і показу вебсайтів) сканувати сайт, щоб той з’являвся в результатах SearchGPT, але заборонити GPTbot (бот, який сканує контент для навчання ШІ-моделей), щоби контент не використовувався для навчання базових моделей генеративного ШІ OpenAI.

У компанії додають: видавці, які хочуть зрозуміти, як краще взаємодіяти з пошуковими продуктами зі штучним інтелектом, можуть звертатися на пошту publishers-feedback@openai.com.

З якими видавцями співпрацює OpenAI?

Серед видавничих угод, які уклав OpenAI, — трирічна угода з Axel Springer, яка передбачає використання контенту як для навчання, так і для демонстрації, вартістю щонайменше $25–30 млн.

Вартість угоди компанії з Financial Times оцінюють від $5 до 10 млн на рік. Згідно з умовами, FT надасть ліцензію на свої матеріали OpenAI, щоб допомогти розробити ШІ-технологію, яка генеруватиме текст, зображення й код, подібні до створених людьми. Співпраця з AP також обчислюється мільйонами на рік, вона більше зосереджена на використанні текстових архівів для навчання. У межах угоди OpenAI ліцензує частину текстового архіву AP з 1985 року.

Також у березні 2023 року компанія підписала контракти із французьким медіа Le Monde й іспанською компанією Prisa Media щодо використання новин у відповідях ChatGPT і для тренування нових моделей. На початку травня 2024 року американська цифрова медіакомпанія Dotdash Meredith уклала угоду з OpenAI щодо ліцензування свого контенту для навчання алгоритмів моделей штучного інтелекту.

У травні компанія News Corp — власниця Wall Street Journal — уклала угоду про ліцензування контенту з OpenAI. ШІ-розробник використовуватиме контент із новинних видань, зокрема архіви, щоб відповідати на запити користувачів і тренувати технологію.

У травні 2024 року видання The Atlantic і цифровий медіахолдинг Vox Media уклали окремі ліцензійні угоди з компанією.

У червні стало відомо про угоду компанії з Time щодо ліцензування контенту та стратегічне партнерство. Співпраця є частиною зусиль Time для розширення доступу до свого контенту для молодої авдиторії в усьому світі.

У деяких з цих угод OpenAI надала видавцям мільйони доларів й хмарні кредити в обмін на право навчати свої ШІ-моделі на їхньому контенті.

Водночас The New York Times із грудня 2023 року судиться з OpenAI та Microsoft. Видання стверджує, що їхній контент використали без дозволу для навчання інструментів штучного інтелекту й відповідей для користувачів. А 30 квітня 2024 року одразу вісім американських газет, що належать компанії Alden Global Capital подали до суду аналогічний позов на OpenAI й Microsoft за порушення авторських прав. У липні Center for Investigative Reporting (Центр журналістських розслідувань), який є видавцем Mother Jones і Reveal, подав до федерального суду США позов проти корпорації OpenAI та її найбільшого акціонера Microsoft за використання їхнього контенту без дозволу й без компенсації.

Як вважає The Wall Street Journal, SearchGPT — найбільш виклик OpenAI домінуванню Google у пошуку. Нагадаємо, що в травні Google розгорнув власну пошукову функцію зі штучним інтелектом, яка синтезує інформацію з різних вебджерел. У липні 2024 року в пошуковику Bing від Microsoft став доступний генеративний пошук. Він виводить відповіді, згенеровані штучним інтелектом, відсуваючи на другий план традиційні результати пошуку з покликаннями.

Джерело: Медіамейкер