Математика по отпечаткам в общей базе FingerPrintSwitcher



  • В этой теме попытаюсь объяснить логику по отпечаткам в общей базе.

    Итак: Как известно отпечатки в базу попадают с этого форума и главной страницы. Так давайте посчитаем сколько всего, как много людей их использует, сколько из них нормальных и т.д.

    Начнем
    1 ) Сначала надо посчитать весь трафик, для этого используем ссылку - https://www.similarweb.com/ru/website/bablosoft.com/#overview
    Как видно 194.5K посещений за март, но это вовсе не значит что упало столько отпечатков за март :) Сколько конкретно - подсчитать сложно. Поскольку здесь роль играет много факторов, такие как повторные посещения, небольшое количество времени нахождения на сайте, еще нужно учитывать посетителей с браузерами других движков - Firefox, Safari. Использовать эти отпечатки на движке Chromium крайне не рекомендуется. А ведь есть еще боты, просто говнобраузеры типо Brave, UC Browser или браузеры встроенные в приложения для мобилок... И это не всё, есть люди у которых тоже плохие отпечатки - например браузер открыт в маленьком окошке типо 100x100 и т.д. А еще версии браузеров устаревают - их надо обновлять. Надо это всё фильтрануть правильно?

    2 ) Так как всё таки правильно посчитать? Я подключил кастом базу и повесил сборщик на сайт с трафиком ~55к в месяц.
    Получилось так: Приблизительно собиралось 700 отпечатков день (это без фильтров с ботами и всеми браузерами), с фильтрами и без ботов (небольшой скрипт JS) который проверяет одно больное место где палится BAS и Зенка. Итого получилось 300 день.
    Итак мы получили ~300 отпечатков, но это для всех браузеров на хромиуме движке (Опера, Яндекс браузер, Edge и т.д.) + много мобильных версий.
    Теперь что надо сделать? Отсеять только Chrome фингеры. После отсева из этих ~300 получилось 112 декстоп хром и 85 мобильных. Итого по тегу хроме только 197 отпечатков. Плюс надо учитывать, что это ВСЕ операционные системы (Windows, Android, Mac OS и IOS).

    3)Итак давайте математику из пункта 2 перенесем на пункт 1. Конечно это сравнение будет иметь погрешность (~25%), но всю равно приблизительную общую картинку будет видно. Поскольку из 55к в месяц отпечатков получилось только 197 отпечатков в день именно хром браузеров, то сколько получится из 194.5K?

    55к - 197
    194к - 194:55*197 = 694 фингеров.

    4 ) Итак мы получили 694 нормальных отпечатков, которые в теории дает этот форум по тегам хром за 1 день. Однако это не всё - ведь надо еще учитывать повторные заходы и дубли.. Ладно пропустим этот момент... Период обновления браузера хром составляет 30 дней, поэтому актуальность отпечатков постоянно убывает и надо собирать новые. Итого давайте помножим 694*30 = 20820 отпечатков в месяц.

    5)И теперь наконецто мы получили приблизительную цифру сколько нормальных отпечатков приходится на всех юзеров BAS в месяц. Теперь вопрос сколько всего людей, которые имеют ключ FingerPrintSwithcer? Я не знаю, но могу только предположить. Согласно очереди которая образуется в сборщике PerfectCanvas она достигает в некоторые пиковые периоды до 15-20 (Сегодня там видел 11) это скорее всего 11 ключей в очереди ждут отпечаток :) Но ведь есть еще люди кто не использует канвас, а просто получает отпечатки из базы? А ведь еще гуляет по ТГ каналам текстовик с фингерами и т.д.

    Давайте грубо возьмем цифру - 50 ключей. Итак получается 50 ключей (человек?) юзают одну базу на 20к фингеров (да-да это именно актуальная база, а не то количество которое показано на странице FingerPrintSwithcer, т.к там все отпечатки, о которых я говорил в пункте 1. Эти 20к отпечатков может убить 1 человек в много потоков)) итого сколько всего отпечатков на человека? (20820/50) - 416 отпечатков на человека в месяц. Это все операционные системы (винда, мак, андройд и айфоны) Это крайне мало. Это число становится ещё более скудным, если вы получаете например только Windows отпечатки.

    UPD: Написало 2 человека. У одного только 60 клиентов FingerPrintSwithcer , у другого 27. Мои подсчеты оказались слишком оптимистичны. Ситуация гораздо хуже, фактически отпечатки гоняется в кучи рук просто много раз.

    Вывод какой? Только кастом база. Отпечатки по качеству оттуда значительно выше, если их фильтровать и прогнать через минимальный антифрод.

    P.S
    Цифры могут отличаются и я допускаю погрешность. Например человек может подключить бесплатную кастом версию базы и делить 50/50 с общей базы отпечатки. Сколько людей подключило бесплатную базу? Я тоже не знаю.
    Не всем сайтам требуется отпечатки, не все сайты плохо относятся к множеству заходов с одинаковых отпечатков.



  • @FastSpace said in Математика по отпечаткам в общей базе FingerPrintSwitcher:

    если их фильтровать и прогнать через минимальный антифрод

    Отписать разработчику эти проблемы как часть программы по улучшению анонимности: нет, не слышали...



  • @DoctorKrolic said in Математика по отпечаткам в общей базе FingerPrintSwitcher:

    @FastSpace said in Математика по отпечаткам в общей базе FingerPrintSwitcher:

    если их фильтровать и прогнать через минимальный антифрод

    Отписать разработчику эти проблемы как часть программы по улучшению анонимности: нет, не слышали...

    Он знает об этом прекрасно, и даже кое-какие фильтры добавил по web gl 2, у него нет времени тянуть всё это одному.

    Поэтому есть кастом база, там можешь всё это сделать сам.



  • @FastSpace said in Математика по отпечаткам в общей базе FingerPrintSwitcher:

    приобретайте Custom Baze

    Тут разве не нужен свой ресурс с трафиком?



  • @DoctorKrolic said in Математика по отпечаткам в общей базе FingerPrintSwitcher:

    @FastSpace said in Математика по отпечаткам в общей базе FingerPrintSwitcher:

    если их фильтровать и прогнать через минимальный антифрод

    Отписать разработчику эти проблемы как часть программы по улучшению анонимности: нет, не слышали...

    Основная проблема в необходимости большого и качественно трафика, если он просто поставит хорошие фильтры, то боюсь отпечатков будет совсем мало ))



  • @Daniel said in Математика по отпечаткам в общей базе FingerPrintSwitcher:

    @FastSpace said in Математика по отпечаткам в общей базе FingerPrintSwitcher:

    приобретайте Custom Baze

    Тут разве не нужен свой ресурс с трафиком?

    Нужен конечно :) Однако это стоит того, проверял регу забугор почтовика.
    Если номер нормальный пускает без каптчи и даже доп. формы проверки фингера. На общей базе у меня такого никогда не было :)



  • Всем, Добра!
    Новичок в теме отпечатков. Может кто вкратце объяснить: почему нельзя использовать грубо-говоря генератор отпечатков? Есть к примеру 100 оригинальных отпечатков Chrome, почему нельзя перебирая собранные параметры из одного отпечатка не заменить на собранные из второго и т.д., что в итоге даст из 100 отпечатков 10000?



  • @Nomad88 said in Математика по отпечаткам в общей базе FingerPrintSwitcher:

    Всем, Добра!
    Новичок в теме отпечатков. Может кто вкратце объяснить: почему нельзя использовать грубо-говоря генератор отпечатков? Есть к примеру 100 оригинальных отпечатков Chrome, почему нельзя перебирая собранные параметры из одного отпечатка не заменить на собранные из второго и т.д., что в итоге даст из 100 отпечатков 10000?

    Часть параметров зависят друг от друга и их нельзя просто перемешать. А некоторые такие как canvas, webGL могут проверять сами по себе



  • UPD:
    Написало 2 человека. У одного только 60 клиентов FingerPrintSwithcer , у другого 27. **
    Мои подсчеты оказались слишком оптимистичны. Фактически 1 отпечаток просто в хлам юзается нон стопом где только это возможно :)



  • @Nomad88 said in Математика по отпечаткам в общей базе FingerPrintSwitcher:

    Всем, Добра!
    Новичок в теме отпечатков. Может кто вкратце объяснить: почему нельзя использовать грубо-говоря генератор отпечатков? Есть к примеру 100 оригинальных отпечатков Chrome, почему нельзя перебирая собранные параметры из одного отпечатка не заменить на собранные из второго и т.д., что в итоге даст из 100 отпечатков 10000?

    Много вариантов:
    1)Сложно составить довольно не противоречащий друг другу генератор )
    2)Есть разновидность отпечатков - они статичны. Например одинаковые модели ноутбуков, иметь в 100% случаев уникальный отпечаток тоже такое себе :)
    3)Есть вообще отпечатки где в названии UserAgent - имя устройства. Например так со смартфонами, тут тоже сгенерить не получится, т.к отпечаток статичен :) Только собирать базу таких фингеров заранее если.

    А вообще после трастовых фингеров собранных не из ботов из кастом базы переходить обратно на общую базу не особо хочется.



  • @FastSpace Рассматривается вариант с ломанным ресурсом и аккуратно вшитым скриптом для сбора фингерпринтов ? С обязательным фильтром ботов.



  • @cyxap said in Математика по отпечаткам в общей базе FingerPrintSwitcher:

    @FastSpace Рассматривается вариант с ломанным ресурсом и аккуратно вшитым скриптом для сбора фингерпринтов ? С обязательным фильтром ботов.

    Насколько мне известно скрипт можно повесить только на свой сайт :)



  • @cyxap said in Математика по отпечаткам в общей базе FingerPrintSwitcher:

    @FastSpace Рассматривается вариант с ломанным ресурсом и аккуратно вшитым скриптом для сбора фингерпринтов ? С обязательным фильтром ботов.

    А вы всегда спрашиваете разрешение или одобрение, когда собираетесь сделать, что-то не очень хорошее? xD



  • @UserTrue Я подвожу к тому чтобы выдача скрипта отправлялась на свой сервер чтобы не привлекать внимание к басу, чтобы собрать много конфигов это неизбежно.Если главный гуру проэкта будет вкурсе проблемы он может поспособствовать в решении или наоборот не препятсвовать.



  • @cyxap said in Математика по отпечаткам в общей базе FingerPrintSwitcher:

    @UserTrue Я подвожу к тому чтобы выдача скрипта отправлялась на свой сервер чтобы не привлекать внимание к басу, чтобы собрать много конфигов это неизбежно.Если главный гуру проэкта будет вкурсе проблемы он может поспособствовать в решении или наоборот не препятсвовать.

    В обход сервера bablosoft не получить фингеры, я сам переливаю из базы в базу. Костыль жесткий.



  • @cyxap проксируйте трафик через свой сервер, делов то..



  • @UserTrue А есть пример скрипта который будет проксиком?



  • @cyxap said in Математика по отпечаткам в общей базе FingerPrintSwitcher:

    @UserTrue А есть пример скрипта который будет проксиком?

    nginx в помощь



  • многие браузеры, особенно мобильные, блокируют внешние скрипты, и трекеры. Например обычный яндекс браузер для мобил.
    Кроме того могут быть задержки по сети. По этому лучше размещать сам скрипт у себя на сайте, но не забывать его обновлять с каждым билдом.



  • а как проверить сайт на требования отпечатков канваса или ВебДжл?
    Я хотел бы исп канвас инспектор но он почему то не запускаетсья
    Логи: debug.txt


Log in to reply