Jump to content
Amorale

Парсят контент.

Recommended Posts

Недавно заметил, что с сайта парсят контент, при чем нагло. Парсят неоднократно и ужа давно, просто раньше не замечал.

Некий украинский сайт (ссылка сразу на мою спарсенную)  http://kvedomosti.com/73506-sony-predstavila-bespilotnik-s-vertikalnym-vzletom.html  обнаглел.

Это моя переведенная статья. И в ней в самом начале указан мой сайт. Активные ссылки там выключены, скорее всего wpgrabber работает.

Что делать? Регистратор их домена забугорный, поддержка там не активная. Хостинг немецкий , Хетзнер.

 

Share this post


Link to post
Share on other sites

Записывать в Оригинальные Тексты Яндекса, постить в твит что бы быстрее в индекс новости попадали.

Share this post


Link to post
Share on other sites

ну так поставьте скрипт который будет добавлять сразу с текстом и ссылку на источник 

нормальному парсеру побоку все что там будет добавляться, он прежде добавления в базу очищает текст от кода

Share this post


Link to post
Share on other sites

я так понимаю что кратко  это твой сайт? он ведь ссылку делает

То я у себя как пишу, так он и парсит. Активной ссылки то нет... Пассивное упоминание как мертвому припарка?

Share this post


Link to post
Share on other sites

Что бы не парсили Ваш контент, перенесите сайт на localhost и проблема сразу же исчезнет, в ином случаи попросту забейте, это интернет...

Share this post


Link to post
Share on other sites

Что бы не парсили Ваш контент, перенесите сайт на localhost и проблема сразу же исчезнет, в ином случаи попросту забейте, это интернет...

Сохранил как цитаты великих людей :lol:

Share this post


Link to post
Share on other sites

Куями заполни и закрой от Яши и других поисковиков). как вариант можно и вирус выложить исходник в тексте.

Share this post


Link to post
Share on other sites

Куями заполни и закрой от Яши и других поисковиков). как вариант можно и вирус выложить исходник в тексте.

 

Пред за мат

Share this post


Link to post
Share on other sites

Ну как вариант ещё закрыть сайт от парсеров ip и прокси общественной. Htaccess вам в помощь.

Сори за "мат" сразу не замети схожесть по написанию.

Share this post


Link to post
Share on other sites

Вы серьезно думаете что роботизированный парсер сможет превзойти ваш сайт как первоисточник? Если только сами этого не захотите.

Share this post


Link to post
Share on other sites

А вам какая разница, если это переведенная статья, то вам от этого вообще вреда никакого не будет. Это не копия.

Share this post


Link to post
Share on other sites

У меня тоже как- то роботизированный парсер на сайт подсел, причем цеплял тыщу знаков, но это не мешало яшке принимать его за первоисточник. Хостеры ихние морозились. Платонов доставала скринами выдачи, типа что за фигня- гугл четко определяет первоисточник, у них эта помойка парсерная и не светится, а у вас в первых строках выдачи? Вы чего там, совсем дикие? Ну они стандартными отписками отмахивались, но в итоге помойку ту убрали через пару- тройку месяцев.

Share this post


Link to post
Share on other sites

Я уже писал в одной из тем

 

 

можно написать плюшку которая будет подменять классы и ID у элементов ( случайная генерация )

было div class="text" стало div class="afr3645hfgj"

и так при каждой загрузке страницы

 

+ сделать вставку пустых DIV, P и SPAN

именно на все это опираются парсеры

Share this post


Link to post
Share on other sites

Записывать в Оригинальные Тексты Яндекса, постить в твит что бы быстрее в индекс новости попадали.

Не работают оригинальные тексты. Этот сервис недоработан и брошен. Народ сократили и так и не наняли никого доделывать.

Share this post


Link to post
Share on other sites

хм  тогда можно , накрутить отказов конкуренту этот сервис поможет redsurf.ru , но если тебе не влом  ))), ну и ссылок с гс  можно )) 

Share this post


Link to post
Share on other sites

Недавно заметил, что с сайта парсят контент, при чем нагло. Парсят неоднократно и ужа давно, просто раньше не замечал.

Некий украинский сайт (ссылка сразу на мою спарсенную)  http://kvedomosti.com/73506-sony-predstavila-bespilotnik-s-vertikalnym-vzletom.html  обнаглел.

Это моя переведенная статья. И в ней в самом начале указан мой сайт. Активные ссылки там выключены, скорее всего wpgrabber работает.

Что делать? Регистратор их домена забугорный, поддержка там не активная. Хостинг немецкий , Хетзнер.

 

В статьи, которые я точно знаю, что своруют (т.е. в качественный потребный материал) я пару раз органично вставляю адрес своего сайта, прямо в текст, чтобы не выбросить, не покосив смысл статьи, без гиперссылки, типа

 

www.мойсайт.ru

http://мойсайт.ru

 

В 70% случаев текст тупо копируется, идут переходы. И кажется мне, что такие адреса Яша считает ссылками, по-крайней мере у меня несколько сайтов висит как обратные ссылки, не имея в коде гиперссылки, только http:// и www. Так же, как в вордпресс достаточно просто вставить текстовую ссылку на ютуб (без всяких фреймов), и вордпресс выдает видеоролик с ютуба на этом адресе. 

 

И переходы с них идут. Мелочь, а приятно. В остальном можно погуглить по форуму - "воруют контент" или "авторское право". 

Share this post


Link to post
Share on other sites

Join the conversation

You can post now and register later. If you have an account, sign in now to post with your account.

Guest
Reply to this topic...

×   Pasted as rich text.   Paste as plain text instead

  Only 75 emoji are allowed.

×   Your link has been automatically embedded.   Display as a link instead

×   Your previous content has been restored.   Clear editor

×   You cannot paste images directly. Upload or insert images from URL.


  • Recently Browsing   0 members

    No registered users viewing this page.

×
×
  • Create New...