Sign in to follow this  
Followers 0
sairon

Нужен парсер, скрипт, программа... Помогите автоматизировать процесс!

7 posts in this topic

Есть куча html файлов (200) на локалке. Подскажите, есть ли какой-нибудь парсер, который сможет вытащить title, description, фото и контент из каждой страницы и автоматом залить на вордпресс в виде отдельных страниц?

Share this post


Link to post
Share on other sites
13 минуты назад, files сказал:

textkit (textkit.ru) (даже free) легко справится

Спасибо, но это немного не то. Все эти файлы (200) - содержат кучу ненужного мусора, мне нужно, чтоб как граббер, вычленил из них только текстовый контент, title, description, фото. Сейчас объясню для чего это мне. Эти файлы - скачанные файлы кеша гугла и яндекса одного сайта. Я собираюсь его восстановить  на том же домене. Я сначала установлю WP, И хочу, чтоб не вручную создавать записи и копипастить - прогнать это программно, вытащив из этих файлов нужный мне контент.

Вашу программу посмотрел, но нужный функционал не обнаружил (мож, канеш чего-то не догнал)

Share this post


Link to post
Share on other sites

Есть платная достаточно универсальная программа Datacol, если покупать лицензию на месяц, выйдет недорого. Тренироваться можно на бесплатной версии, она полностью функциональна, только результат ограничен 25 позициями (страницами парсинга).

Файлы залить на Денвер, в Датакол загрузить список страниц для парсинга.

sairon likes this

Share this post


Link to post
Share on other sites
В 08.02.2019 в 11:38 PM, sairon сказал:

Спасибо, но это немного не то. Все эти файлы (200) - содержат кучу ненужного мусора, мне нужно, чтоб как граббер, вычленил из них только текстовый контент, title, description, фото. Сейчас объясню для чего это мне. Эти файлы - скачанные файлы кеша гугла и яндекса одного сайта. Я собираюсь его восстановить  на том же домене. Я сначала установлю WP, И хочу, чтоб не вручную создавать записи и копипастить - прогнать это программно, вытащив из этих файлов нужный мне контент.

Вашу программу посмотрел, но нужный функционал не обнаружил (мож, канеш чего-то не догнал)

Такое можно через Датакол сделать без проблем. Вырезать ненужное/замемнить и даже можно напрямую залить как записи в WP. Или импортировать вручную из СЫМю

Как писали Выше можете купить на месяц и сделать, также я Вам могу помочь, давно занимаюсь Датакол, есть свой блог по нему, также могу предоставить скидку на покупку Датакол.

Share this post


Link to post
Share on other sites

Create an account or sign in to comment

You need to be a member in order to leave a comment

Create an account

Sign up for a new account in our community. It's easy!


Register a new account

Sign in

Already have an account? Sign in here.


Sign In Now
Sign in to follow this  
Followers 0

  • Recently Browsing   0 members

    No registered users viewing this page.