sairon

Нужен парсер, скрипт, программа... Помогите автоматизировать процесс!

7 сообщений в этой теме

Есть куча html файлов (200) на локалке. Подскажите, есть ли какой-нибудь парсер, который сможет вытащить title, description, фото и контент из каждой страницы и автоматом залить на вордпресс в виде отдельных страниц?

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах
13 минуты назад, files сказал:

textkit (textkit.ru) (даже free) легко справится

Спасибо, но это немного не то. Все эти файлы (200) - содержат кучу ненужного мусора, мне нужно, чтоб как граббер, вычленил из них только текстовый контент, title, description, фото. Сейчас объясню для чего это мне. Эти файлы - скачанные файлы кеша гугла и яндекса одного сайта. Я собираюсь его восстановить  на том же домене. Я сначала установлю WP, И хочу, чтоб не вручную создавать записи и копипастить - прогнать это программно, вытащив из этих файлов нужный мне контент.

Вашу программу посмотрел, но нужный функционал не обнаружил (мож, канеш чего-то не догнал)

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

Есть платная достаточно универсальная программа Datacol, если покупать лицензию на месяц, выйдет недорого. Тренироваться можно на бесплатной версии, она полностью функциональна, только результат ограничен 25 позициями (страницами парсинга).

Файлы залить на Денвер, в Датакол загрузить список страниц для парсинга.

sairon понравилось это

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах
В 08.02.2019 в 11:38 PM, sairon сказал:

Спасибо, но это немного не то. Все эти файлы (200) - содержат кучу ненужного мусора, мне нужно, чтоб как граббер, вычленил из них только текстовый контент, title, description, фото. Сейчас объясню для чего это мне. Эти файлы - скачанные файлы кеша гугла и яндекса одного сайта. Я собираюсь его восстановить  на том же домене. Я сначала установлю WP, И хочу, чтоб не вручную создавать записи и копипастить - прогнать это программно, вытащив из этих файлов нужный мне контент.

Вашу программу посмотрел, но нужный функционал не обнаружил (мож, канеш чего-то не догнал)

Такое можно через Датакол сделать без проблем. Вырезать ненужное/замемнить и даже можно напрямую залить как записи в WP. Или импортировать вручную из СЫМю

Как писали Выше можете купить на месяц и сделать, также я Вам могу помочь, давно занимаюсь Датакол, есть свой блог по нему, также могу предоставить скидку на покупку Датакол.

Поделиться сообщением


Ссылка на сообщение
Поделиться на других сайтах

Создайте аккаунт или войдите в него для комментирования

Вы должны быть пользователем, чтобы оставить комментарий

Создать аккаунт

Зарегистрируйтесь для получения аккаунта. Это просто!


Зарегистрировать аккаунт

Войти

Уже зарегистрированы? Войдите здесь.


Войти сейчас

  • Сейчас на странице   0 пользователей

    Нет пользователей, просматривающих эту страницу