Yolo проблема с координатами.

Поддержка
  • Я решаю задачу распознавания reCAPTCHA с помощью YOLO v5. После того как YOLO находит объекты на капче, оно сохраняет координаты в текстовый файл в формате:
    0.173679 0.572027 0.0812133 0.139028 (x y w h).

    Чтобы получить реальные координаты, нужно умножить разрешение изображения на соответствующие координаты. У меня получается следующее (размер изображения: 1022×597):

    • x: 177.5 px
    • y: 341.5 px
    • ширина: 83.0 px
    • высота: 83.0 px

    Я делаю скриншот всего элемента body страницы, и мне кажется, что я захватываю весь браузер. Однако, когда я подставляю полученные координаты, скрипт кликает мимо нужных мест.

    Возможно, у BAS другое разрешение. Как можно исправить эту ситуацию и что может влиять на несовпадение координат?
    Пробовал смотреть на сайтах разрешение экрана, но там пишет 1920*1080, а на самом деле оно не такое

  • Есть разрешение экрана, и есть активная область браузера, без учета панели вкладок, ввода url и т.п. В бас есть действие которое возвращает размеры браузера и т.п.

  • @DrPrime спасибо большое! Но есть еще одна проблемка. К примеру область капчи которой я делаю скриншот 377x377. А разрешение браузера 1024599. Есть идеи как расчитать координаты для уже разрешения 1024599. Потому что chat gpt не очень помогает.

  • Ты можешь получить координаты капчи, и просто добавить. Например получишь координаты x:100 y:150 . Это левый верхний угол. Просто добавишь координаты внутри самой капчи и получишь нужные