Jump to content

Парсят контент.


Recommended Posts

Недавно заметил, что с сайта парсят контент, при чем нагло. Парсят неоднократно и ужа давно, просто раньше не замечал.

Некий украинский сайт (ссылка сразу на мою спарсенную)  http://kvedomosti.com/73506-sony-predstavila-bespilotnik-s-vertikalnym-vzletom.html  обнаглел.

Это моя переведенная статья. И в ней в самом начале указан мой сайт. Активные ссылки там выключены, скорее всего wpgrabber работает.

Что делать? Регистратор их домена забугорный, поддержка там не активная. Хостинг немецкий , Хетзнер.

 

Link to post
Share on other sites
  • VIP

ну так поставьте скрипт который будет добавлять сразу с текстом и ссылку на источник 

нормальному парсеру побоку все что там будет добавляться, он прежде добавления в базу очищает текст от кода

Link to post
Share on other sites

я так понимаю что кратко  это твой сайт? он ведь ссылку делает

То я у себя как пишу, так он и парсит. Активной ссылки то нет... Пассивное упоминание как мертвому припарка?

Link to post
Share on other sites

Что бы не парсили Ваш контент, перенесите сайт на localhost и проблема сразу же исчезнет, в ином случаи попросту забейте, это интернет...

Сохранил как цитаты великих людей :lol:

Link to post
Share on other sites
  • Модератор

Куями заполни и закрой от Яши и других поисковиков). как вариант можно и вирус выложить исходник в тексте.

 

Пред за мат

Link to post
Share on other sites

Ну как вариант ещё закрыть сайт от парсеров ip и прокси общественной. Htaccess вам в помощь.

Сори за "мат" сразу не замети схожесть по написанию.

Link to post
Share on other sites
  • VIP

Вы серьезно думаете что роботизированный парсер сможет превзойти ваш сайт как первоисточник? Если только сами этого не захотите.

Link to post
Share on other sites

У меня тоже как- то роботизированный парсер на сайт подсел, причем цеплял тыщу знаков, но это не мешало яшке принимать его за первоисточник. Хостеры ихние морозились. Платонов доставала скринами выдачи, типа что за фигня- гугл четко определяет первоисточник, у них эта помойка парсерная и не светится, а у вас в первых строках выдачи? Вы чего там, совсем дикие? Ну они стандартными отписками отмахивались, но в итоге помойку ту убрали через пару- тройку месяцев.

Link to post
Share on other sites

Я уже писал в одной из тем

 

 

можно написать плюшку которая будет подменять классы и ID у элементов ( случайная генерация )

было div class="text" стало div class="afr3645hfgj"

и так при каждой загрузке страницы

 

+ сделать вставку пустых DIV, P и SPAN

именно на все это опираются парсеры

Link to post
Share on other sites

Записывать в Оригинальные Тексты Яндекса, постить в твит что бы быстрее в индекс новости попадали.

Не работают оригинальные тексты. Этот сервис недоработан и брошен. Народ сократили и так и не наняли никого доделывать.

Link to post
Share on other sites
  • VIP

Недавно заметил, что с сайта парсят контент, при чем нагло. Парсят неоднократно и ужа давно, просто раньше не замечал.

Некий украинский сайт (ссылка сразу на мою спарсенную)  http://kvedomosti.com/73506-sony-predstavila-bespilotnik-s-vertikalnym-vzletom.html  обнаглел.

Это моя переведенная статья. И в ней в самом начале указан мой сайт. Активные ссылки там выключены, скорее всего wpgrabber работает.

Что делать? Регистратор их домена забугорный, поддержка там не активная. Хостинг немецкий , Хетзнер.

 

В статьи, которые я точно знаю, что своруют (т.е. в качественный потребный материал) я пару раз органично вставляю адрес своего сайта, прямо в текст, чтобы не выбросить, не покосив смысл статьи, без гиперссылки, типа

 

www.мойсайт.ru

http://мойсайт.ru

 

В 70% случаев текст тупо копируется, идут переходы. И кажется мне, что такие адреса Яша считает ссылками, по-крайней мере у меня несколько сайтов висит как обратные ссылки, не имея в коде гиперссылки, только http:// и www. Так же, как в вордпресс достаточно просто вставить текстовую ссылку на ютуб (без всяких фреймов), и вордпресс выдает видеоролик с ютуба на этом адресе. 

 

И переходы с них идут. Мелочь, а приятно. В остальном можно погуглить по форуму - "воруют контент" или "авторское право". 

Link to post
Share on other sites

Please sign in to comment

You will be able to leave a comment after signing in



Sign In Now
  • Recently Browsing   0 members

    No registered users viewing this page.

×
×
  • Create New...