2-3 часа это много...для 500
У меня парсер собирает инфу с 25 000 стр. и по времени 1.5 часа.
Правда в 20 потоков и все на гет.
У Вас скорее всего работа через браузер и в 1 поток
Кстати если вы собираете нопремер) tessdata то png/жпыгы необяз. да. BAS прекрасно умеет сразу tiff/ .tif
Дальше training
Для 4 LTSM тоже можно курите тут Текст ссылки