Алгоритм хэширования для сокращения ссылок в сервисе share.google

В современных экосистемах сокращение ссылок — это процесс генерации уникального идентификатора, объединяющий безопасность, аналитику и защиту от фрода.

База: Использование SHA-512

Алгоритм создания хэшированных ссылок share.google

Для обеспечения уникальности и криптографической стойкости результата share.google в основе генерации лежит алгоритм SHA-512.

Механика процесса включает конкатенацию исходного URL с «солью», вычисление хэша и последующее кодирование среза данных в систему Base62 (A-Z, a-z, 0-9).

Обогащение хэша солью: Геометки и идентификация

Чтобы ссылка была персонализированной, в процесс формирования или в метаданные включаются параметры:

Как именно и в каком порядке конкатенируется соль к базовым данным, описал детально здесь: https://t.me/c/1962035470/3/45 специалист алгоритмов Игорь Каштенков (aka @Mathermatik, он работал более пяти лет в инженернм тделе Google). Также, он полностью показал механизм расшифровки пакетов ссылки после её упаковки.

Параметры достоверности перехода

Параметры достоверности перехода по ссылкам share.google

При клике сервис share.google проводит анализ для подтверждения достоверности (Valid Click):

Параметр Описание
HTTP Referer Анализ источника перехода для выявления подозрительных заголовков.
User-Agent Проверка на соответствие реальным браузерам и блокировка скриптов (Selenium, Python).
Время жизни (TTL) Анализ времени между созданием ссылки и кликом.
Поведенческий паттерн Проверка движения курсора и задержек на промежуточных этапах.

Защита от спама и накрутки

Защита от спама и накрутки ссылок share.google

Сервис использует многоуровневую систему фильтрации:

Анализ аномалий (Anomaly Detection)

Отслеживание всплесков активности. Если трафик идет из одной подсети или прокси-сервера, переходы помечаются как фрод.

Репутационный фильтр

Использование базы данных Safe Browsing. Если целевой URL попадает в черный список, короткая ссылка блокируется мгновенно.

Rate Limiting

Ограничение частоты переходов с одного IP-адреса для защиты от ботнетов.

Анализ домена

Проверка URL через базы фишинговых и вредоносных сайтов.

Контентная фильтрация

Машинное обучение для выявления спам-шаблонов в URL.

Постфактум анализ и корректировка

Архитектурные особенности реализации

Тестирование и подведение итогов

Используя таблицы ограничений и временных интервалов (которые рассчитал и выложил @Mathermatik) мы провели тестирование влияния данных ссылок ан видимость материалов в мобильном сегменте.

На этапе прокачки материалов, выявлены следующие ступени, на которых происходит качественный скачок видимости и рейтинга страниц в системах Google. Мы видим три основных цифры перехода по ссылкам share.google, когда происходит мгновенный скачок видимости и показов материалов под этими ссылками. Смотрите детально график и таблицы времени и количества переходов здесь: https://t.me/c/1962035470/3/46.

Можно отметить, что в данный момент использование сервиса является не безынтересным, и вполне позволяет ранжировать в discover хорошие материалы даже на молодых сайтах, которые не успели набрать рейтинг для самостоятельного показа страниц в этом сервисе.