Jump to content

Парсят контент.


Recommended Posts

Недавно заметил, что с сайта парсят контент, при чем нагло. Парсят неоднократно и ужа давно, просто раньше не замечал.

Некий украинский сайт (ссылка сразу на мою спарсенную)  http://kvedomosti.com/73506-sony-predstavila-bespilotnik-s-vertikalnym-vzletom.html  обнаглел.

Это моя переведенная статья. И в ней в самом начале указан мой сайт. Активные ссылки там выключены, скорее всего wpgrabber работает.

Что делать? Регистратор их домена забугорный, поддержка там не активная. Хостинг немецкий , Хетзнер.

 

Link to post
Share on other sites
  • VIP

ну так поставьте скрипт который будет добавлять сразу с текстом и ссылку на источник 

нормальному парсеру побоку все что там будет добавляться, он прежде добавления в базу очищает текст от кода

Link to post
Share on other sites

я так понимаю что кратко  это твой сайт? он ведь ссылку делает

То я у себя как пишу, так он и парсит. Активной ссылки то нет... Пассивное упоминание как мертвому припарка?

Link to post
Share on other sites

Что бы не парсили Ваш контент, перенесите сайт на localhost и проблема сразу же исчезнет, в ином случаи попросту забейте, это интернет...

Сохранил как цитаты великих людей :lol:

Link to post
Share on other sites
  • Модератор

Куями заполни и закрой от Яши и других поисковиков). как вариант можно и вирус выложить исходник в тексте.

 

Пред за мат

Link to post
Share on other sites

Ну как вариант ещё закрыть сайт от парсеров ip и прокси общественной. Htaccess вам в помощь.

Сори за "мат" сразу не замети схожесть по написанию.

Link to post
Share on other sites

У меня тоже как- то роботизированный парсер на сайт подсел, причем цеплял тыщу знаков, но это не мешало яшке принимать его за первоисточник. Хостеры ихние морозились. Платонов доставала скринами выдачи, типа что за фигня- гугл четко определяет первоисточник, у них эта помойка парсерная и не светится, а у вас в первых строках выдачи? Вы чего там, совсем дикие? Ну они стандартными отписками отмахивались, но в итоге помойку ту убрали через пару- тройку месяцев.

Link to post
Share on other sites

Я уже писал в одной из тем

 

 

можно написать плюшку которая будет подменять классы и ID у элементов ( случайная генерация )

было div class="text" стало div class="afr3645hfgj"

и так при каждой загрузке страницы

 

+ сделать вставку пустых DIV, P и SPAN

именно на все это опираются парсеры

Link to post
Share on other sites

Записывать в Оригинальные Тексты Яндекса, постить в твит что бы быстрее в индекс новости попадали.

Не работают оригинальные тексты. Этот сервис недоработан и брошен. Народ сократили и так и не наняли никого доделывать.

Link to post
Share on other sites
  • VIP

Недавно заметил, что с сайта парсят контент, при чем нагло. Парсят неоднократно и ужа давно, просто раньше не замечал.

Некий украинский сайт (ссылка сразу на мою спарсенную)  http://kvedomosti.com/73506-sony-predstavila-bespilotnik-s-vertikalnym-vzletom.html  обнаглел.

Это моя переведенная статья. И в ней в самом начале указан мой сайт. Активные ссылки там выключены, скорее всего wpgrabber работает.

Что делать? Регистратор их домена забугорный, поддержка там не активная. Хостинг немецкий , Хетзнер.

 

В статьи, которые я точно знаю, что своруют (т.е. в качественный потребный материал) я пару раз органично вставляю адрес своего сайта, прямо в текст, чтобы не выбросить, не покосив смысл статьи, без гиперссылки, типа

 

www.мойсайт.ru

http://мойсайт.ru

 

В 70% случаев текст тупо копируется, идут переходы. И кажется мне, что такие адреса Яша считает ссылками, по-крайней мере у меня несколько сайтов висит как обратные ссылки, не имея в коде гиперссылки, только http:// и www. Так же, как в вордпресс достаточно просто вставить текстовую ссылку на ютуб (без всяких фреймов), и вордпресс выдает видеоролик с ютуба на этом адресе. 

 

И переходы с них идут. Мелочь, а приятно. В остальном можно погуглить по форуму - "воруют контент" или "авторское право". 

Link to post
Share on other sites

Join the conversation

You can post now and register later. If you have an account, sign in now to post with your account.

Guest
Reply to this topic...

×   Pasted as rich text.   Paste as plain text instead

  Only 75 emoji are allowed.

×   Your link has been automatically embedded.   Display as a link instead

×   Your previous content has been restored.   Clear editor

×   You cannot paste images directly. Upload or insert images from URL.

  • Recently Browsing   0 members

    No registered users viewing this page.

×
×
  • Create New...