Как (чем) выполнить Сбор данных с таблицы если расположение данных меняется?



  • Есть такая вот таблица. Из неё нужно взять такие значения как Название компании, Телефон, Веб-сайт. Расположения Компании не меняется ( Остается всегда в первом столбце tr) А значения телефон и вебсайт всегда меняются в расположениях по столбцам. Чем можно обработать такую таблицу для сбора данных?

    <table class="table table-responsive table-sm tableoptim">
    <tbody>
                          <tr>
                            <td>Компания</td>
                            <td>Микрон-К, ООО</td>
                          </tr>
                          <tr>
                            <td>ИНН</td>
                            <td>7715992275</td>
                          </tr>
                          <tr>
                            <td>Описание</td>
                            <td>Оптово-розничные продажи строительных и отделочных материалов. Комплектация строительных объектов.</td>
                          </tr>
                          <tr>
                            <td>Адрес</td>
                            <td>127576, Москва, Новгородская улица, дом 1<br/>офис Б413</td>
                          </tr>
                          <tr>
                            <td>Метро</td>
                            <td>Алтуфьево</td>
                          </tr>
                          <tr>
                            <td>Телефон</td>
                            <td>(495) 107-03-28</td>
                          </tr>
                          <tr>
                            <td>Веб-адрес</td>
                            <td><span class="oi oi-external-link" aria-hidden="true"/>   <a href="http://www.russiacompany.ru/recent/index.htm?url=www.micron-k.ru" target="_blank">Откроется в новом окне</a></td>
                          </tr>
                          <tr>
                            <td>Часы работы</td>
                            <td>пн-пт: 9:00-18:00</td>
                          </tr>
                          <tr>
                            <td>Регион</td>
                            <td><a href="http://www.russiacompany.ru/">Москва</a> и <a href="http://www.russiacompany.ru/">Московская область</a></td>
                          </tr>
                          <tr>
                            <td>Раздел</td>
                            <td><a href="http://www.russiacompany.ru/reg1/rub19/index.htm">Строительство</a>. <a href="http://www.russiacompany.ru/reg1/rub19/index.htm">Ремонт</a></td>
                          </tr>
                          <tr>
                            <td>Рубрики</td>
                            <td><a href="http://www.russiacompany.ru/reg1/rub1388/index.htm">Строительные материалы</a> — <a href="http://www.russiacompany.ru/reg1/rub1388/index.htm">комплектация объектов</a><br/><a href="http://www.russiacompany.ru/reg1/rub1390/index.htm">Строительные материалы</a> — <a href="http://www.russiacompany.ru/reg1/rub1390/index.htm">продажа</a></td>
                          </tr>
                          <tr>
                            <td>Добавлено</td>
                            <td>21 октября 2015 года</td>
                          </tr>
                        </tbody>
    </table>
    
    


  • @hamov Составить рег выражания, хотя у столбца с линком, вообще свой класс есть



  • @usertrue есть <table class="table table-responsive table-sm tableoptim">



  • Реализовал на основе этого топика парсер проксей https://community.bablosoft.com/topic/3798/как-правильно-парсить-таблицу/3#


Log in to reply
 

  • 16
  • 5
  • 4
  • 4
  • 23
  • 2
  • 15
  • 4