sairon 386 Posted February 8, 2019 Report Share Posted February 8, 2019 Есть куча html файлов (200) на локалке. Подскажите, есть ли какой-нибудь парсер, который сможет вытащить title, description, фото и контент из каждой страницы и автоматом залить на вордпресс в виде отдельных страниц? Link to post Share on other sites
Модератор files 2844 Posted February 8, 2019 Модератор Report Share Posted February 8, 2019 textkit (textkit.ru) (даже free) легко справится sairon 1 Link to post Share on other sites
sairon 386 Posted February 8, 2019 Author Report Share Posted February 8, 2019 13 минуты назад, files сказал: textkit (textkit.ru) (даже free) легко справится Спасибо, но это немного не то. Все эти файлы (200) - содержат кучу ненужного мусора, мне нужно, чтоб как граббер, вычленил из них только текстовый контент, title, description, фото. Сейчас объясню для чего это мне. Эти файлы - скачанные файлы кеша гугла и яндекса одного сайта. Я собираюсь его восстановить на том же домене. Я сначала установлю WP, И хочу, чтоб не вручную создавать записи и копипастить - прогнать это программно, вытащив из этих файлов нужный мне контент. Вашу программу посмотрел, но нужный функционал не обнаружил (мож, канеш чего-то не догнал) Link to post Share on other sites
VIP vituson 675 Posted February 8, 2019 VIP Report Share Posted February 8, 2019 Есть платная достаточно универсальная программа Datacol, если покупать лицензию на месяц, выйдет недорого. Тренироваться можно на бесплатной версии, она полностью функциональна, только результат ограничен 25 позициями (страницами парсинга). Файлы залить на Денвер, в Датакол загрузить список страниц для парсинга. sairon 1 Link to post Share on other sites
Модератор files 2844 Posted February 8, 2019 Модератор Report Share Posted February 8, 2019 Content downloader через Денвер тоже пойдет. sairon 1 Link to post Share on other sites
animal_x 0 Posted February 25, 2019 Report Share Posted February 25, 2019 В 08.02.2019 в 11:38 PM, sairon сказал: Спасибо, но это немного не то. Все эти файлы (200) - содержат кучу ненужного мусора, мне нужно, чтоб как граббер, вычленил из них только текстовый контент, title, description, фото. Сейчас объясню для чего это мне. Эти файлы - скачанные файлы кеша гугла и яндекса одного сайта. Я собираюсь его восстановить на том же домене. Я сначала установлю WP, И хочу, чтоб не вручную создавать записи и копипастить - прогнать это программно, вытащив из этих файлов нужный мне контент. Вашу программу посмотрел, но нужный функционал не обнаружил (мож, канеш чего-то не догнал) Такое можно через Датакол сделать без проблем. Вырезать ненужное/замемнить и даже можно напрямую залить как записи в WP. Или импортировать вручную из СЫМю Как писали Выше можете купить на месяц и сделать, также я Вам могу помочь, давно занимаюсь Датакол, есть свой блог по нему, также могу предоставить скидку на покупку Датакол. Link to post Share on other sites
VIP seo-net 2346 Posted February 25, 2019 VIP Report Share Posted February 25, 2019 Опять же zennoposter если умеете писать шаблоны Link to post Share on other sites
Recommended Posts
Please sign in to comment
You will be able to leave a comment after signing in
Sign In Now