У меня был очень похожий опыт, но я остановился на другом решении.
Я тоже тестировал скрипт на 8 ядерном 32 гб дедике с широким каналом и там еле еле 10 потоков шло.
Работающими решением оказалось взять 32 ядерный локальный сервер с 64 оперативки, на не очень быстром канале, с сокс5, на нем 100+ потоков запускалось.
Скрипт тот же, никаких оптимизаций не делалось.
Стоит конечно побольше, чем аренда дедика но тут уж зависит от окупаемости твоей темы, стоит ли оно того или нет.
Но соксы могут быть узким местом, по возможности нужно делать свои соксы. Для этого, можно брать дешевые VPS и установить сокс через опенсурсный софт microsocks для линукса (в инете полно инструкций по установке, занимает не более 5 минут вручную, и можно установку через БАС автоматизировать также на случай если нужны сотни соксов).
Объединение БД нескольких сайтов по общему параметру
-
Доброго времени суток.
Есть 2 сайта.
С каждого сайта парсю компании, получаю контактные данные.Суть - получить общую таблицу без пустых полей (в теории) после получения данных с нескольких сайтов.
Вот допустим после парсинга 2 сайтов получаю 2 таблицы (50 строк в 1 и 80 во 2ой), надо объединить их без дубликатов в случае совпадения 1 или 2 параметров (сайт или название).
![0_1511007233230_NVC8s[1].jpg](https://i.imgur.com/xPHTnJ3.jpg)
Заранее спасибо