Jump to content

Нужен парсер, скрипт, программа... Помогите автоматизировать процесс!


Recommended Posts

Есть куча html файлов (200) на локалке. Подскажите, есть ли какой-нибудь парсер, который сможет вытащить title, description, фото и контент из каждой страницы и автоматом залить на вордпресс в виде отдельных страниц?

Link to post
Share on other sites
13 минуты назад, files сказал:

textkit (textkit.ru) (даже free) легко справится

Спасибо, но это немного не то. Все эти файлы (200) - содержат кучу ненужного мусора, мне нужно, чтоб как граббер, вычленил из них только текстовый контент, title, description, фото. Сейчас объясню для чего это мне. Эти файлы - скачанные файлы кеша гугла и яндекса одного сайта. Я собираюсь его восстановить  на том же домене. Я сначала установлю WP, И хочу, чтоб не вручную создавать записи и копипастить - прогнать это программно, вытащив из этих файлов нужный мне контент.

Вашу программу посмотрел, но нужный функционал не обнаружил (мож, канеш чего-то не догнал)

Link to post
Share on other sites
  • VIP

Есть платная достаточно универсальная программа Datacol, если покупать лицензию на месяц, выйдет недорого. Тренироваться можно на бесплатной версии, она полностью функциональна, только результат ограничен 25 позициями (страницами парсинга).

Файлы залить на Денвер, в Датакол загрузить список страниц для парсинга.

Link to post
Share on other sites
  • 3 weeks later...
В 08.02.2019 в 11:38 PM, sairon сказал:

Спасибо, но это немного не то. Все эти файлы (200) - содержат кучу ненужного мусора, мне нужно, чтоб как граббер, вычленил из них только текстовый контент, title, description, фото. Сейчас объясню для чего это мне. Эти файлы - скачанные файлы кеша гугла и яндекса одного сайта. Я собираюсь его восстановить  на том же домене. Я сначала установлю WP, И хочу, чтоб не вручную создавать записи и копипастить - прогнать это программно, вытащив из этих файлов нужный мне контент.

Вашу программу посмотрел, но нужный функционал не обнаружил (мож, канеш чего-то не догнал)

Такое можно через Датакол сделать без проблем. Вырезать ненужное/замемнить и даже можно напрямую залить как записи в WP. Или импортировать вручную из СЫМю

Как писали Выше можете купить на месяц и сделать, также я Вам могу помочь, давно занимаюсь Датакол, есть свой блог по нему, также могу предоставить скидку на покупку Датакол.

Link to post
Share on other sites

Join the conversation

You can post now and register later. If you have an account, sign in now to post with your account.

Guest
Reply to this topic...

×   Pasted as rich text.   Paste as plain text instead

  Only 75 emoji are allowed.

×   Your link has been automatically embedded.   Display as a link instead

×   Your previous content has been restored.   Clear editor

×   You cannot paste images directly. Upload or insert images from URL.

  • Recently Browsing   0 members

    No registered users viewing this page.

×
×
  • Create New...