@ellano Делаете скриншот элемента, потом уменьшаете его в нужной пропорциональности, чтобы мелкие детали не имели значения. Извлекаете хеш из полученного изображения, и сохраняете его (хеш) вместе с ответом на картинку в базе. Когда вам надо будет решить капчу, вы также скриншотете каждую картинку, уменьшаете её, извлекаете хеш, но на этот раз по полученному хешу ищите ответ в базе. Минус в том, что если такого хеша в базе нет, то капчу вы можете только угадать. В данном случае, когда картинки не зашумлены и достаточно чёткие, будет лучше на питоне нейросеть подключить для распознавания. Думаю, найти уже обученную под ваши типы картинок модель в интернете будет не так сложно