В этой теме попытаюсь объяснить логику по отпечаткам в общей базе.
Итак: Как известно отпечатки в базу попадают с этого форума и главной страницы. Так давайте посчитаем сколько всего, как много людей их использует, сколько из них нормальных и т.д.
Начнем
1 ) Сначала надо посчитать весь трафик, для этого используем ссылку - https://www.similarweb.com/ru/website/bablosoft.com/#overview
Как видно 194.5K посещений за март, но это вовсе не значит что упало столько отпечатков за март :) Сколько конкретно - подсчитать сложно. Поскольку здесь роль играет много факторов, такие как повторные посещения, небольшое количество времени нахождения на сайте, еще нужно учитывать посетителей с браузерами других движков - Firefox, Safari. Использовать эти отпечатки на движке Chromium крайне не рекомендуется. А ведь есть еще боты, просто говнобраузеры типо Brave, UC Browser или браузеры встроенные в приложения для мобилок... И это не всё, есть люди у которых тоже плохие отпечатки - например браузер открыт в маленьком окошке типо 100x100 и т.д. А еще версии браузеров устаревают - их надо обновлять. Надо это всё фильтрануть правильно?
2 ) Так как всё таки правильно посчитать? Я подключил кастом базу и повесил сборщик на сайт с трафиком ~55к в месяц.
Получилось так: Приблизительно собиралось 700 отпечатков день (это без фильтров с ботами и всеми браузерами), с фильтрами и без ботов (небольшой скрипт JS) который проверяет одно больное место где палится BAS и Зенка. Итого получилось 300 день.
Итак мы получили ~300 отпечатков, но это для всех браузеров на хромиуме движке (Опера, Яндекс браузер, Edge и т.д.) + много мобильных версий.
Теперь что надо сделать? Отсеять только Chrome фингеры. После отсева из этих ~300 получилось 112 декстоп хром и 85 мобильных. Итого по тегу хроме только 197 отпечатков. Плюс надо учитывать, что это ВСЕ операционные системы (Windows, Android, Mac OS и IOS).
3)Итак давайте математику из пункта 2 перенесем на пункт 1. Конечно это сравнение будет иметь погрешность (~25%), но всю равно приблизительную общую картинку будет видно. Поскольку из 55к в месяц отпечатков получилось только 197 отпечатков в день именно хром браузеров, то сколько получится из 194.5K?
55к - 197
194к - 194:55*197 = 694 фингеров.
4 ) Итак мы получили 694 нормальных отпечатков, которые в теории дает этот форум по тегам хром за 1 день. Однако это не всё - ведь надо еще учитывать повторные заходы и дубли.. Ладно пропустим этот момент... Период обновления браузера хром составляет 30 дней, поэтому актуальность отпечатков постоянно убывает и надо собирать новые. Итого давайте помножим 694*30 = 20820 отпечатков в месяц.
5)И теперь наконецто мы получили приблизительную цифру сколько нормальных отпечатков приходится на всех юзеров BAS в месяц. Теперь вопрос сколько всего людей, которые имеют ключ FingerPrintSwithcer? Я не знаю, но могу только предположить. Согласно очереди которая образуется в сборщике PerfectCanvas она достигает в некоторые пиковые периоды до 15-20 (Сегодня там видел 11) это скорее всего 11 ключей в очереди ждут отпечаток :) Но ведь есть еще люди кто не использует канвас, а просто получает отпечатки из базы? А ведь еще гуляет по ТГ каналам текстовик с фингерами и т.д.
Давайте грубо возьмем цифру - 50 ключей. Итак получается 50 ключей (человек?) юзают одну базу на 20к фингеров (да-да это именно актуальная база, а не то количество которое показано на странице FingerPrintSwithcer, т.к там все отпечатки, о которых я говорил в пункте 1. Эти 20к отпечатков может убить 1 человек в много потоков)) итого сколько всего отпечатков на человека? (20820/50) - 416 отпечатков на человека в месяц. Это все операционные системы (винда, мак, андройд и айфоны) Это крайне мало. Это число становится ещё более скудным, если вы получаете например только Windows отпечатки.
UPD: Написало 2 человека. У одного только 60 клиентов FingerPrintSwithcer , у другого 27. Мои подсчеты оказались слишком оптимистичны. Ситуация гораздо хуже, фактически отпечатки гоняется в кучи рук просто много раз.
Вывод какой? Только кастом база. Отпечатки по качеству оттуда значительно выше, если их фильтровать и прогнать через минимальный антифрод.
P.S
Цифры могут отличаются и я допускаю погрешность. Например человек может подключить бесплатную кастом версию базы и делить 50/50 с общей базы отпечатки. Сколько людей подключило бесплатную базу? Я тоже не знаю.
Не всем сайтам требуется отпечатки, не все сайты плохо относятся к множеству заходов с одинаковых отпечатков.