@tartaria said in Анализ профилей для ПФ Yandex (BAS, бд на PostgreSQL):
Буду рад знакомству и обмену опытом.
Сам также ставлю понемногу эксперименты.
Как я подхожу к тестированию: моя методика сложная, но она позволяет достигать результатов даже в самых непростых условиях и противостоять монстрам вроде Google.
Исходя из личного опыта, я заметил, что разработчики часто испытывают неприязнь к тестированию или вовсе игнорируют такие задачи.
Это вполне объяснимо, поскольку основная задача разработчика - писать код, а не проводить исследования.
Общая методология тестирования:
Исходные требования:
Чтобы гарантировать надежность тестов, необходимо использовать только материалы высочайшего качества. Это особенно важно для исключения искажений в результатах, вызванных использованием некачественных прокси. Предпочтение отдается реальным мобильным прокси с физических устройств реальных людей, в то время как прокси с серверных ферм исключаются из-за особенностей, которые здесь не рассматриваются.
Браузер должен быть оригинальным, без маскировки отпечатков и антидетект систем, чтобы полностью исключить их влияние на алгоритм.
Для предотвращения обнаружения мультиаккаунтов без использования антидетект браузеров могут быть применены:
- ферма виртуальных машин;
- ферма эмуляторов Android;
- другие соответствующие инструменты.
Строим список гипотез
Как строить гипотезы выходят за рамки этого поста.
- список гипотез сформирован здесь
Метрики успешного алгоритма
Необходимо точно определить метрики, которые будут использоваться для оценки эффективности алгоритма, а также установить количество аккаунтов/профилей и т.д., чтобы уменьшить вероятность статистических искажений.
Количество:
- создание минимум 50 аккаунтов на целевой платформе для тестирования каждой гипотезы;
- для оценки эффективности продвижения выбираем не менее 20 различных сайтов из разных ниш, отобранных из результатов поиска. Анализируем ключевые слова, мониторим позиции, фиксируем изменения(вариант топикастера).
Метрика успешности:
- аккаунты не подвергаются блокировке в течение как минимум одной недели;
- с зарегистрированными аккаунтами можно осуществлять все запланированные действия;
- в процессе продвижения сайтов фиксируется улучшение позиций по ключевым словам, собранным на предварительном этапе(вариант топикастера).
Снижение затрат
После подтверждения эффективности рабочих гипотез можно переходить к этапу снижения затрат на их внедрение.
Каждое вносимое изменение должно подвергаться индивидуальному тестированию для точной оценки его влияния на конечный результат.
Примеры изменений:
- использование BAS как антидетект и для автоматизации процессов;
- переход на более дешевые прокси-серверы;
- прочие оптимизации.
P.S.
В моей практике еще не было ни одного ресурса, который нельзя было бы победить. Вопрос всегда исключительно в бюджете и времени.
Я бы даже сказал часто вопрос в невозможности прогнозирования и бюджета и времени.
И многие разработчики просто отказываются от задач, которые они не понимают как решать. Потому что за поиск путей решения никто не хочет платить.
И к тому же поиск решения занимает часто сил значительно больше, чем его имплементация(написание кода).