Фальшивые лягушки и пицца с клеем: все больше и больше чепухи, созданной искусственным интеллектом, наводняют Google и Amazon
Если вы ищете что-то в Интернете, вам приходится просматривать все больше и больше спама с искусственным интеллектом.
Платформы на самом деле должны были отфильтровывать качество. Но последняя инновация Google на самом деле активно способствует дезинформации с помощью искусственного интеллекта.
Изображения животных из Средневековья сами по себе являются жанром: кошки, козы и собаки на иллюстрациях этого периода часто имеют довольно причудливую мимику, по крайней мере, для сегодняшнего зрителя.
Поэтому в интернете «странные средневековые лягушки» имеют культовый статус.
Но если вы хотите посмотреть на картинки напрямую, имейте в виду: если вы введете в Google «средневековая лягушка», появятся не только изображения из старых книг.
Из первых десяти изображений, которые показывает Google, шесть были созданы искусственным интеллектом (ИИ) в нашем эксперименте.
Средневековые лягушки, созданные искусственным интеллектом, являются примером гораздо более серьезной проблемы: засорения Интернета, вызванного искусственным интеллектом.
Обещание таких платформ, как Google и Amazon, заключается в том, чтобы разобраться в богатстве информации и предложений в Интернете значимым для нас способом. Но обещание они уже не выполняют. Будь то в результатах поиска, в социальных сетях или в интернет-магазинах: аутентичные тексты и изображения, созданные искусственным интеллектом, красочно смешиваются.
Часто вы только постепенно (не сразу) осознаете, что имеете дело с контентом ИИ: обзоры продуктов, которые звучат как-то пусто, предполагаемые блоги о путешествиях со странно общими советами, влиятельные лица, которые выглядят слишком идеально.
Если вы не будете осторожны, вы купите книги о грибах, созданные искусственным интеллектом
На Amazon читатели узнали о книгах по сбору грибов, которые выглядели рукотворными, включая фотографии и биографии авторов. Но знатоки заметили, что содержание было запутанным и вводящим в заблуждение. Оказалось, что они были сгенерированы с помощью искусственного интеллекта. Авторы не реальные люди, их портретные фото поступают из автомата.
Технический блог «404» уже сообщал об этом явлении прошлым летом.
Помимо книг о грибах, также появились книги о путешествиях и рецептах от ИИ. И даже если вы ищете бестселлеры, такие как «Burn Book» технического журналиста Кары Суишер, вам нужно быть осторожным, чтобы случайно не купить резюме, созданное искусственным интеллектом, вместо оригинала на Amazon.
Amazon постоянно удаляет такие подделки, но появляются новые. Распознать их сложно. Если вы хотите быть в безопасности, тщательно проверьте автора и издателя перед заказом.
Насколько Amazon перегружен этим вопросом, показывают меры против него. Пресс-секретарь говорит, что у Amazon есть «надежный набор процедур», которые будут активно обнаруживать контент, нарушающий политику компании.
Руководящие принципы обязывают пользователей идентифицировать контент, созданный искусственным интеллектом, как таковой при загрузке произведений, таких как книги. Но если автор воздерживается от объявления своей книги продуктом искусственного интеллекта, это слишком часто остается без последствий.
Другими словами, у Amazon не так много возможностей для противодействия обману ИИ на своей платформе.
На самом деле, единственная внешне понятная реакция Amazon на поток искусственного интеллекта кажется совершенно беспомощной: с осени 2023 года количество книг, которые один пользователь может загрузить в виде электронной книги, ограничено тремя в день.
Google также не обращает внимания на конкретные меры по борьбе со спамом.
Объяснение феномена средневековых лягушек, созданных искусственным интеллектом, недоступно, когда мы спрашиваем.
SEO-эксперт говорит, что человеческий контент по-прежнему вознаграждается
Чинция Германн неоднократно сталкивалась в результатах поиска Google с веб-сайтами с искусственно сгенерированным текстом. Она является профессиональным оптимизатором поисковых систем, т.е. человеком, который помогает операторам сайтов быть найденными в сети.
Будучи экспертом в области SEO, Чинция Германн знает, что нужно, чтобы ее нашли в Google: например, правильные ключевые слова и четко структурированный, удобный для пользователя сайт.
Но генераторы текста с искусственным интеллектом также особенно хороши в написании структурированного текста с ключевыми словами. Поэтому год назад Германн провела эксперимент.
Когда клиент из сферы здравоохранения обратился к ней за помощью, она не только создала созданную человеком версию веб-сайта, но и параллельно создала полноценный контент, сгенерированный искусственным интеллектом.
В течение двух-трех недель Google отображал страницу ИИ очень высоко, а затем она рухнула.
«Конечно, нам было приятно это видеть. Судя по всему, рукотворное все еще вознаграждается», — говорит Германн.
Еще до появления Chat-GPT спам-сайты были широко распространены
С момента эксперимента Германн алгоритм Google адаптировался как минимум три раза.
Заявленная цель состоит в том, чтобы держать некачественный, неоригинальный и бесполезный контент подальше от пользователя.
Google говорит, что уже очень преуспел в этом. «Наши системы на 99 процентов свободны от спама в результатах поиска», — говорят в компании. Более подробной информации о том, каково именно происхождение этого числа, нет.
Если вы спросите исследователя Янека Бевендорфа об этой цифре, он ответит: «Со стороны, конечно, мы видим только конечный результат, а не то, что уже отфильтровано. Возможно, системы хорошо работают в сравнении. Но с точки зрения пользователя этого недостаточно».
Янек Бевендорф входит в исследовательскую группу, которая пыталась провести статистическое исследование качества поисковых систем. Исследователи из Веймара и Лейпцига с января публикуют свое новое исследование по всему миру. Его название переводится как: «Становится ли Google хуже? Долгосрочное исследование SEO-спама в поисковых системах».
Исследователи изучили, как часто спам-страницы появляются в поисковой выдаче. Например, те, которые притворяются тестовыми порталами, хотя на самом деле никто никогда не держал в руках ни одного из оцененных на сайте продуктов. Цель таких страниц — заставить сбитых с толку посетителей переходить по ссылкам, которые ведут на Amazon или другие интернет-магазины. С каждым кликом операторы сайта зарабатывают немного денег. Если такая страница появится высоко в Google, с ее помощью можно неплохо заработать.
Исследователи автоматически вводили поисковые запросы, такие как «лучший фен» или «лучший пылесос» в Google, Bing и DuckDuckGo в течение нескольких месяцев и сохраняли результаты. Исследование проводилось с октября 2022 года по сентябрь 2023 года, поэтому оно началось сразу после публикации Chat-GPT.
В исследовании не выяснялось, стоит ли за спам-сообщениями искусственный интеллект. Это также сложно оценить, говорит Бевендорф: «Эти тексты представляют собой типичный рекламный стиль, преувеличенный и лишенный содержания. Трудно сказать, написал ли их редактор быстро за пять евро или для этого был использован искусственный интеллект».
Исследование показало, что спам-сайты довольно хорошо используют поисковые системы, причем Google справляется даже лучше, чем Bing и DuckDuckGo. Исследователи не замечают ухудшения ситуации с течением времени, а скорее играют в кошки-мышки: когда Google пересматривает свой алгоритм, результаты в течение нескольких недель становятся более качественными, а затем производители спама снова вступают в игру. Возможно, в будущем искусственный интеллект еще больше ужесточит эту конкуренцию.
Эти результаты не являются ошеломляющими. Тем не менее, очень большой отклик в СМИ и множество личных писем Бевендорфу показывают, что он не одинок в своем убеждении, что несколько лет назад Интернет был еще более аутентичным.
ИИ искажает котировки Reddit и рекомендует пиццу с клеем
Это признал даже начальник отдела поиска Google. Он упомянул, что многие пользователи добавляют ключевое слово «Reddit» в свой поиск Google. Reddit — это интернет-форум, где реальные люди высказывают индивидуальное мнение о самых разных вещах, более доверительное для многих пользователей, чем мягкий PR-контент. В то же время, Google часто показывает страницы Reddit очень высоко в своих результатах, даже если вы не ищете их явно.
Однако, если вы находитесь в Соединенных Штатах, самым первым результатом с середины мая является последняя инновация Google: сгенерированный искусственным интеллектом ответ на поисковый запрос.
Это влечет за собой проблемы. На вопрос, что делать, если начинка соскальзывает с пиццы, искусственный интеллект Google предложил подмешать в соус 30 мл клея. Причиной тому является старая шутка, которая циркулировала на Reddit, в том числе и явно несерьезный рецепт пиццы на клею. ИИ не понял шутки.
Даже после нескольких сообщений в СМИ ошибка остается. Стало даже хуже: тем временем ИИ даже ссылается на новые газетные сообщения в качестве источника сомнительного рецепта пиццы. Ложное знание, кажется, становится все более и более укоренившимся.
Когда-то крупные платформы обещали разобраться с ложной информацией. В то же время, Google вносит свой вклад в общую неразбериху.
Last Updated on 04.08.2024 by iskova