Исследование NYT: ответы в ИИ-сводках от Google верны примерно в 91% случаев — при этом 56% из них «необоснованные»

Исследования

Речь о случаях, когда источники, на которые ссылается ИИ, «не полностью подтверждают» информацию в ответах.

Источник: Bloomberg

The New York Times вместе со стартапом Oumi проанализировали ИИ-сводки от Google. Они использовали тест SimpleQA, который, по словам издания, «широко применяется» в отрасли для измерения точности ИИ-систем. Для исследования отобрали 4 тысяч одинаковых поисковых запросов.

Первый раз ИИ-сводки протестировали в октябре 2025 года, когда система работала на базе Gemini 2. Второй раз — в феврале 2026-го, после перехода на Gemini 3. За это время точность ответов выросла, отмечает NYT. В 2025-м правильные ответы в ИИ-сводках были в 86% случаев — в 2026 году этот показатель вырос до 91%.

При этом систему «трудно» анализировать, потому что Google может выдавать разные ответы на одинаковые запросы, отправленные с разницей в несколько секунд, отмечает издание. Учитывая, что Google обрабатывает более 5 трлн поисковых запросов в год, каждый час пользователи видят в ИИ-сводках «десятки миллионов» ошибочных ответов, подчёркивает NYT.

После перехода на Gemini 3 количество «необоснованных» ответов выросло с 37% до 56%. Речь о случаях, когда источники, на которые ссылается ИИ, «не полностью подтверждают» информацию в ответах.

Опрошенные NYT эксперты отметили, что сводки от Google «достаточно точны и улучшились за последние месяцы». При этом они призывают пользователей самостоятельно перепроверять информацию.

После массового внедрения поисковых на ИИ-сводки в мае 2024 года издатели сообщили о снижении трафика на свои сайты и раскритиковали Google за «скрытие» ссылок в сгенерированных ответах. В феврале 2026-го компания сделала ссылки на сайты в ИИ-сводках «более заметными».

Источник: vc.ru