
Новые данные показывают разрыв между рейтингами Google и цитированием в крупных языковых моделях
Крупные языковые модели (LLM) цитируют источники иначе, чем их ранжирует Google. Компания Search Atlas, специализирующаяся на SEO-инструментах, провела сравнение цитирований от GPT от OpenAI, Gemini от Google и Perplexity с результатами поиска Google.
Методология исследования
Анализ охватил 18 377 семантически схожих запросов. Совпадения определялись по порогу схожести 82% с использованием эмбеддинговой модели OpenAI. Исследование охватывало двухмесячный период и выявило существенные различия в том, как разные платформы ссылаются на источники по сравнению с традиционным поисковым ранжированием.
Perplexity ближе всего к Google
Perplexity использует активный поиск по вебу в реальном времени, что делает его цитирования наиболее схожими с результатами Google. В исследовании выявлено:
- Медианный пересекающийся набор доменов — около 25–30%
- Медианный пересекающийся набор URL — около 20%
- Всего Perplexity поделился с Google 18 549 доменами, что составляет примерно 43% от всех доменов, которые он цитировал
ChatGPT и Gemini более избирательны
ChatGPT продемонстрировал значительно меньшее совпадение с Google:
- Медианный пересекающийся набор доменов — 10–15%
- Всего 1 503 домена совпадают с Google, что составляет около 21% от всех цитируемых им доменов
- Совпадения на уровне URL обычно ниже 10%
Поведение Gemini оказалось менее предсказуемым:
- В некоторых ответах почти отсутствовало совпадение с Google
- В других — наблюдалась более тесная корреляция
- Всего Gemini совместно использовал с Google лишь 160 доменов, что составляет около 4% от всех доменов в результатах Google, но при этом эти домены составляли 28% от всех цитирований Gemini
Что это значит для видимости сайтов
Высокое позиционирование в Google не гарантирует цитирования в ответах LLM. Системы по-разному извлекают информацию из веба:
- Perplexity, как система с активным поиском, больше зависит от традиционных SEO-факторов и силы домена
- ChatGPT и Gemini опираются в большей степени на предварительно обученные знания и выборочное извлечение, что делает их менее привязанными к текущим поисковым позициям
Ограничения исследования
Набор данных был несбалансирован: Perplexity составил 89% совпадающих запросов, OpenAI — 8%, а Gemini — всего 3%. Кроме того, исследование отражает лишь недавнюю картину и не учитывает долгосрочные тенденции.
Перспективы
Для систем, основанных на извлечении информации (например, Perplexity), традиционные SEO-сигналы, такие как авторитетность домена и качество контента, остаются важными. Для моделей, ориентированных на рассуждение (ChatGPT, Gemini), эти факторы могут оказывать значительно меньшее влияние на выбор цитируемых источников.