@tartaria said in Анализ профилей для ПФ Yandex (BAS, бд на PostgreSQL):
Буду рад знакомству и обмену опытом.
Сам также ставлю понемногу эксперименты.
Как я подхожу к тестированию: моя методика сложная, но она позволяет достигать результатов даже в самых непростых условиях и противостоять монстрам вроде Google.
Исходя из личного опыта, я заметил, что разработчики часто испытывают неприязнь к тестированию или вовсе игнорируют такие задачи.
Это вполне объяснимо, поскольку основная задача разработчика - писать код, а не проводить исследования.
Общая методология тестирования:
Исходные требования:
Чтобы гарантировать надежность тестов, необходимо использовать только материалы высочайшего качества. Это особенно важно для исключения искажений в результатах, вызванных использованием некачественных прокси. Предпочтение отдается реальным мобильным прокси с физических устройств реальных людей, в то время как прокси с серверных ферм исключаются из-за особенностей, которые здесь не рассматриваются.
Браузер должен быть оригинальным, без маскировки отпечатков и антидетект систем, чтобы полностью исключить их влияние на алгоритм.
Для предотвращения обнаружения мультиаккаунтов без использования антидетект браузеров могут быть применены:
ферма виртуальных машин;
ферма эмуляторов Android;
другие соответствующие инструменты.
Строим список гипотез
Как строить гипотезы выходят за рамки этого поста.
список гипотез сформирован здесь
Метрики успешного алгоритма
Необходимо точно определить метрики, которые будут использоваться для оценки эффективности алгоритма, а также установить количество аккаунтов/профилей и т.д., чтобы уменьшить вероятность статистических искажений.
Количество:
создание минимум 50 аккаунтов на целевой платформе для тестирования каждой гипотезы;
для оценки эффективности продвижения выбираем не менее 20 различных сайтов из разных ниш, отобранных из результатов поиска. Анализируем ключевые слова, мониторим позиции, фиксируем изменения(вариант топикастера).
Метрика успешности:
аккаунты не подвергаются блокировке в течение как минимум одной недели;
с зарегистрированными аккаунтами можно осуществлять все запланированные действия;
в процессе продвижения сайтов фиксируется улучшение позиций по ключевым словам, собранным на предварительном этапе(вариант топикастера).
Снижение затрат
После подтверждения эффективности рабочих гипотез можно переходить к этапу снижения затрат на их внедрение.
Каждое вносимое изменение должно подвергаться индивидуальному тестированию для точной оценки его влияния на конечный результат.
Примеры изменений:
использование BAS как антидетект и для автоматизации процессов;
переход на более дешевые прокси-серверы;
прочие оптимизации.
P.S.
В моей практике еще не было ни одного ресурса, который нельзя было бы победить. Вопрос всегда исключительно в бюджете и времени.
Я бы даже сказал часто вопрос в невозможности прогнозирования и бюджета и времени.
И многие разработчики просто отказываются от задач, которые они не понимают как решать. Потому что за поиск путей решения никто не хочет платить.
И к тому же поиск решения занимает часто сил значительно больше, чем его имплементация(написание кода).