Как определить фейковые отзывы

Опубликовано: 01.09.2018

Данная статья рассматривает вопрос с технической точки зрения и предназначена для веб-мастеров, а также спаммеров тех, кто хочет оставить комментарии с разных аккаунтов, но с одного устройства.

Что знает о нас любой сайт?

Часть параметров передаёт браузер при обращении к серверу, а другую часть можно определить с помощью яваскрипта и передать аяксом.

IP-адрес название и версию ОС название и версию браузера разрешение экрана и размер окна браузера прочие параметры...

Айпи можно скрыть с помощью специальных сервисов или плагинов. Про остальное обычно забывают. Однако этих данных достаточно, чтобы с большой вероятностью вычислить спам-комментарии на одном и том же сайте (или на сетке своих сайтов, или в сообществе сайтов одной тематики).

Пример расчёта

Для упрощения будем считать, что распределение параметров равномерное. В реальности это не так: есть рейтинг браузеров, гаджетов, а браузеры обычно последней версии. Это увеличивает погрешность.

С другой стороны, мы берём только 5 параметров. Если добавить больше параметров, это увеличит точность расчётов.

Особенно эффективны поведенческие параметры, например, скорость печатания пользователя внутри текстовых форм.

Возьмём минимальные округлённые цифры:

Количество ОС 5
Версий каждой ОС 5
Количество браузеров 5
Версий браузеров 5
Разрешения экрана 10

Итого различных комбинаций: 5×5×5×5×10 = 6250.

Будем считать, что окно развёрнуто во весь экран (например, браузер TOR не рекомендует разворачивать окно, ведь это дополнительный признак, снижающий вашу анонимность).

Допустим, в ветке 20 комментариев от разных реальных людей, и мы добавляем ещё 3 ответа — от Маши, Васи и Пети — с одного компьютера, но меняя IP-адрес. Значит, все параметры у нас одинаковые, кроме подставного IP.

Поставим себя на место владельца сайта, который хочет вычислить спамеров или нечестные отзывы. Какая вероятность, что Маша, Вася и Петя — реальные люди? Иными словами, какая вероятность, что у 3 из 23 случайных посетителей сайта совпадут все параметры?

Формулу для данного случая не нашёл. Решил, что быстрее и надёжнее написать программу для оценки вероятности, чем выводить формулу. Программа выдала вероятность: 0,0004. Проверить результат и попробовать другие цифры можно здесь: Калькулятор вероятности .

С вероятностью 99,96% наши 3 отзыва — фейковые.

Изначально я не предполагал, что получится так близко к 100%.

Выводы делайте сами :)

Смотрите также

Следующая заметка

Финансовый аналитик: новая профессия для новой экономики


Профессия будущего: Системный аналитик - профессия будущего, системный аналитик - Trend Club
Будущее - уже определено сегодня, остается только его реализовать. Что делать сегодняшнему студенту или ученику для того, чтобы получить интересную, захватывающую работу, которая будет приносить

Политический анализ и политическое прогнозирование
Под прогнозом в науке понимается вероятностное, научно обоснованное суждение о будущем. Именно вероятностный характер прогноза и его научная обоснованность отличает данный вид знания от других форм предвидения.

Политический анализ и политическое прогнозирование
Под прогнозом в науке понимается вероятностное, научно обоснованное суждение о будущем. Именно вероятностный характер прогноза и его научная обоснованность отличает данный вид знания от других форм предвидения.

Маркетинговые исследования - это... Этапы, результаты, пример маркетингового исследования
Маркетинговые исследования - это поиск, сбор, систематизация и анализ информации о ситуации на рынке с целью принятия управленческих решений в сфере производства и сбыта продукции. Стоит четко понимать,

Форекс брокер Альпари отзывы и обзор услуг и сервисов компании
Проголосовали: 902 За 88 %, Против 12 % За Против

Разница между науками о финансах и экономике. Экономическая статья на английском с переводом
Сайт Деловой английский www.delo-angl.ru Опубликовано: 14.04.2016 Хотя зачастую они изучаются и представляются как совершенно раздельные дисциплины, экономика и финансы, как науки, взаимосвязаны, разделяют

12 лучших сервисов для веб-аналитики
В статье вы узнаете о самых популярных инструментах для веб-аналитики, их функциональности и стоимости. И начнём мы с двух самых известных сервисов – Google Analytics и Яндекс.метрика. Вероятно, что каждый

Big Data – технология, рождающая новый тип бизнеса::БИТ 03.2014
Big Data – технология, рождающая новый тип бизнеса Главная / Архив номеров / 2014 / Выпуск №3 (36) / Big Data – технология, рождающая новый тип бизнеса Рубрика: Тема номера /  Системы хранения

Big Data и блокчейн — прорыв в области анализа данных
Постоянное ускорение роста объема данных является неотъемлемым элементом современных реалий. Социальные сети, мобильные устройства, данные с измерительных устройств, бизнес-информация

Добро пожаловать , Гость !

Мы настоятельно рекомендуем Вам зарегистрироваться, если вы ещё этого не сделали. регистрация откроет Вам новые функции.

Войти или Зарегистрироваться

www.silvio-berluskoni.ru © Все права защищены © 2016.
rss