Проблемы с кодировкой



  • Всем привет! Написал скрипт для одного известного форума, собирающий халяву. Почти в каждой теме одним из условий раздачи - написать что-то типо фразы спасибо_автору_темы. Изначально я писал без использования http запросов, смог найти и распарсить фразу благодарности, но не смог скопировать(в фразе не только текст но и ссылки и другие бывает другие данные). Сейчас я переписал отправку на http. По итогу тело POST запроса с отправкой выглядит примерно так

    md5check=410bd9c395e6480971e5add5d560170d&Post=%253Cp%253E%255Bspoiler%255D%252B1234%255B%2Fspoiler%255D%253C%2Fp%253E%250A%253Cp%253E%25u0421%25u043F%25u0430%25u0441%25u0438%25u0431%25u043E%253C%2Fp%253E%250A&isRte=1&noSmilies=0. Делаются пост запросы с предварительным чтением из файла где в каждой строчке записано ссылка_на_тему;закодированное_тело;время_отправки_поста т.е. по сути в полуавтоматическом режиме, так как мне каждый раз когда есть новая тема приходится руками вписывать ее в файл, поймав в фидлере.

    Если перевести на русский в теле после Post= написано
    [spoiler]1234[/spoiler] // тут моя ссылка, номер киви, любая моя инфа
    Спасибо // тут благодарочка автору, которую я могу распарсить, но не могу перекодировать.
    Подскажите куда копать с этой кодировкой, онлайн декодеры ее не едят и вообще не могу определить формат кодировки





  • @uraabk Благодарю конечно, но это вполне логично было) Просто я привел самый банальный пример, где написано одно слово спасибо. А там где ссылки есть или фраза из слов 7-8 состоит этот превращается в шифр на пол экрана моего ноута. Хотя ваш ответ подтолкнул меня на мысль создания своего словаря)) Я правильно понимаю, что это никому неизвестная кодировка и возможно так же самописная создателями форума?



  • @j0hnyb нет, немного извращенная кончено, но вполне публичная кодировка. Мне было лень каждую букву в слову "спасибо" расписывать... главное - это понять суть.



  • @uraabk Так если она публичная может мне название ее подскажите?) я ради это и тему создавал, так как обегал все известные мне онлайн декодеры и не получил результат



  • @j0hnyb вы будете смеяться, но это стандартное url-кодирование + немного извращения, из-за которого онлайн декодеры и не могут понять что делать.

    P.S. а нет, там даже извращения особого нет, просто дважды закодировали...



  • @uraabk said in Проблемы с кодировкой:

    @j0hnyb вы будете смеяться, но это стандартное url-кодирование + немного извращения, из-за которого онлайн декодеры и не могут понять что делать.

    P.S. а нет, там даже извращения особого нет, просто дважды закодировали...

    Интересный ход :D

    [[ENCODE_TEXT]] = "md5check=410bd9c395e6480971e5add5d560170d&Post=%253Cp%253E%255Bspoiler%255D%252B1234%255B%2Fspoiler%255D%253C%2Fp%253E%250A%253Cp%253E%25u0421%25u043F%25u0430%25u0441%25u0438%25u0431%25u043E%253C%2Fp%253E%250A&isRte=1&noSmilies=0"
    [[DECODE_TEXT]] = unescape(unescape([[ENCODE_TEXT]]))
    log([[DECODE_TEXT]])
    

Log in to reply
 

  • 5
  • 5
  • 5
  • 14
  • 4
  • 11
  • 1
  • 25