Каким образом спарсить информацию с интернет магазина



  • Имеется сайт japandostavka.ru, С него необходимо спарсить информацию по товарам.
    Артикул, наименование, описание, изображение, цена и все это в формате CSV.
    Возник вопрос, как парсить изображения и добавить его в базу, чтобы потом выгрузить в CSV.



  • @Alexx5l6 вам необходимо именно изображение или его id или что там? если само изображение бас их кодирует в base64 поэтому составить строку можно и без базы. скриншот и вуаля если это браузер, если клиент, то запрос сохранить в base64 есть такая галка. база тут нужна лишь если вы собираете БАЗУ иначе вы и сразу ваши csv можете делать.

    Вот так это будет для клиента
    2020-01-31_133142.png
    Сссылка на ваше изображение
    2020-01-31_133225.png
    получение изображения в формате base64 это становится строкой, но длинной строкой



  • @f0cus id его в коде страницы не нашел (может не правильно понимаю, термин id). Base64 сохранял изображение по ссылке. выдает непонятный код, что с ним дальше делать я не знаю.
    Базу собираю, чтобы получилось:
    Артикул (запись в переменную), Наименование(запись в переменную), описание(запись в переменную), изображение(хз как), цена(запись в переменную) и потом конвертирую в CSV формат или так нельзя.
    Я только начал осваивать БАС, кроме как с базой больше не работал. Еще пробовал таблицы создавать через файл тхт.



  • @Alexx5l6 Что делать? Ну это вам решать. Это изображение. Только в доступной вам кодировке, если оно будет в dat вы совсем удивитесь. Хотите его посмотреть? а вы к этой строке вначале добавьте

    data:image/png;base64, // сюда добавьте эту вашу длинную строку все целиком
    

    У вас там png если это jpg то лучше изменить

    data:image/jpeg;base64,
    

    И откройте его в браузере. Вы его увидите.
    Если вы хотите сохранить его то сохраните но Укажите басу что оно в base64 там есть галка и ставьте желаемый формат изображения т.е расширение какое хотите. Но лучше не заигрывать и оставлять какое в оригинале.

    Почему нельзя? И зачем конвертировать? Составляете строку с разделителями, ну допустим с запятой. И в нее через запятую эти ваши
    артикулызапятая описаниезапятая изображениезапятая в base64запятая и еще что тозапятая и еще
    Но запятая это просто пример, можете использовать другой разделитель. Затем в список добавляете элемент эту вашу сформированную строку, и так далее
    На выходе имеете список который формате csv как бэ, и сохраняете в файл ваш список а в конце ставите не txt а csv например что бы машина сразу понимала что это таблица и открывала соответствующим редактором libre или open офисом. Или например vscode тож могет


Log in to reply
 

  • 8
  • 7
  • 2
  • 5
  • 3
  • 7
  • 12
  • 9