Amorale 28 Posted August 26, 2015 Report Share Posted August 26, 2015 Недавно заметил, что с сайта парсят контент, при чем нагло. Парсят неоднократно и ужа давно, просто раньше не замечал. Некий украинский сайт (ссылка сразу на мою спарсенную) http://kvedomosti.com/73506-sony-predstavila-bespilotnik-s-vertikalnym-vzletom.html обнаглел. Это моя переведенная статья. И в ней в самом начале указан мой сайт. Активные ссылки там выключены, скорее всего wpgrabber работает. Что делать? Регистратор их домена забугорный, поддержка там не активная. Хостинг немецкий , Хетзнер. Quote Link to post Share on other sites
Visitor 35 Posted August 26, 2015 Report Share Posted August 26, 2015 ну так поставьте скрипт который будет добавлять сразу с текстом и ссылку на источник Quote Link to post Share on other sites
Gameer 3 Posted August 26, 2015 Report Share Posted August 26, 2015 Записывать в Оригинальные Тексты Яндекса, постить в твит что бы быстрее в индекс новости попадали. Kaliban 1 Quote Link to post Share on other sites
VIP serjin 1052 Posted August 26, 2015 VIP Report Share Posted August 26, 2015 ну так поставьте скрипт который будет добавлять сразу с текстом и ссылку на источник нормальному парсеру побоку все что там будет добавляться, он прежде добавления в базу очищает текст от кода Visitor 1 Quote Link to post Share on other sites
VIP mrak7575 348 Posted August 26, 2015 VIP Report Share Posted August 26, 2015 я так понимаю что кратко это твой сайт? он ведь ссылку делает Quote Link to post Share on other sites
Amorale 28 Posted August 26, 2015 Author Report Share Posted August 26, 2015 я так понимаю что кратко это твой сайт? он ведь ссылку делает То я у себя как пишу, так он и парсит. Активной ссылки то нет... Пассивное упоминание как мертвому припарка? Quote Link to post Share on other sites
qpPeW 191 Posted August 26, 2015 Report Share Posted August 26, 2015 Что бы не парсили Ваш контент, перенесите сайт на localhost и проблема сразу же исчезнет, в ином случаи попросту забейте, это интернет... LetSevI, Воланд, refer9 and 4 others 7 Quote Link to post Share on other sites
LetSevI 322 Posted August 26, 2015 Report Share Posted August 26, 2015 Что бы не парсили Ваш контент, перенесите сайт на localhost и проблема сразу же исчезнет, в ином случаи попросту забейте, это интернет... Сохранил как цитаты великих людей qpPeW and CyberEngine 2 Quote Link to post Share on other sites
mixas 12 Posted August 26, 2015 Report Share Posted August 26, 2015 Куями заполни и закрой от Яши и других поисковиков). как вариант можно и вирус выложить исходник в тексте. Quote Link to post Share on other sites
Модератор Воланд 5016 Posted August 26, 2015 Модератор Report Share Posted August 26, 2015 Куями заполни и закрой от Яши и других поисковиков). как вариант можно и вирус выложить исходник в тексте. Пред за мат Quote Link to post Share on other sites
mixas 12 Posted August 26, 2015 Report Share Posted August 26, 2015 Ну как вариант ещё закрыть сайт от парсеров ip и прокси общественной. Htaccess вам в помощь. Сори за "мат" сразу не замети схожесть по написанию. Quote Link to post Share on other sites
VIP GladWeb 1433 Posted August 26, 2015 VIP Report Share Posted August 26, 2015 Вы серьезно думаете что роботизированный парсер сможет превзойти ваш сайт как первоисточник? Если только сами этого не захотите. Quote Link to post Share on other sites
milions 37 Posted August 26, 2015 Report Share Posted August 26, 2015 А вам какая разница, если это переведенная статья, то вам от этого вообще вреда никакого не будет. Это не копия. Quote Link to post Share on other sites
TBicTep 59 Posted August 26, 2015 Report Share Posted August 26, 2015 Единственное что это забанить ip с которого парсят, врядли будут заморачиваться с прокси. Quote Link to post Share on other sites
yria 0 Posted August 26, 2015 Report Share Posted August 26, 2015 У меня тоже как- то роботизированный парсер на сайт подсел, причем цеплял тыщу знаков, но это не мешало яшке принимать его за первоисточник. Хостеры ихние морозились. Платонов доставала скринами выдачи, типа что за фигня- гугл четко определяет первоисточник, у них эта помойка парсерная и не светится, а у вас в первых строках выдачи? Вы чего там, совсем дикие? Ну они стандартными отписками отмахивались, но в итоге помойку ту убрали через пару- тройку месяцев. Quote Link to post Share on other sites
gefard 89 Posted August 26, 2015 Report Share Posted August 26, 2015 Я уже писал в одной из тем можно написать плюшку которая будет подменять классы и ID у элементов ( случайная генерация ) было div class="text" стало div class="afr3645hfgj" и так при каждой загрузке страницы + сделать вставку пустых DIV, P и SPAN именно на все это опираются парсеры wap_masterok 1 Quote Link to post Share on other sites
witosp 632 Posted August 26, 2015 Report Share Posted August 26, 2015 Записывать в Оригинальные Тексты Яндекса, постить в твит что бы быстрее в индекс новости попадали. Не работают оригинальные тексты. Этот сервис недоработан и брошен. Народ сократили и так и не наняли никого доделывать. Quote Link to post Share on other sites
VIP mrak7575 348 Posted August 26, 2015 VIP Report Share Posted August 26, 2015 хм тогда можно , накрутить отказов конкуренту этот сервис поможет redsurf.ru , но если тебе не влом ))), ну и ссылок с гс можно )) Quote Link to post Share on other sites
VIP webostrov 2532 Posted August 27, 2015 VIP Report Share Posted August 27, 2015 Недавно заметил, что с сайта парсят контент, при чем нагло. Парсят неоднократно и ужа давно, просто раньше не замечал. Некий украинский сайт (ссылка сразу на мою спарсенную) http://kvedomosti.com/73506-sony-predstavila-bespilotnik-s-vertikalnym-vzletom.html обнаглел. Это моя переведенная статья. И в ней в самом начале указан мой сайт. Активные ссылки там выключены, скорее всего wpgrabber работает. Что делать? Регистратор их домена забугорный, поддержка там не активная. Хостинг немецкий , Хетзнер. В статьи, которые я точно знаю, что своруют (т.е. в качественный потребный материал) я пару раз органично вставляю адрес своего сайта, прямо в текст, чтобы не выбросить, не покосив смысл статьи, без гиперссылки, типа www.мойсайт.ru http://мойсайт.ru В 70% случаев текст тупо копируется, идут переходы. И кажется мне, что такие адреса Яша считает ссылками, по-крайней мере у меня несколько сайтов висит как обратные ссылки, не имея в коде гиперссылки, только http:// и www. Так же, как в вордпресс достаточно просто вставить текстовую ссылку на ютуб (без всяких фреймов), и вордпресс выдает видеоролик с ютуба на этом адресе. И переходы с них идут. Мелочь, а приятно. В остальном можно погуглить по форуму - "воруют контент" или "авторское право". Quote Link to post Share on other sites
irina37kkz 0 Posted August 29, 2015 Report Share Posted August 29, 2015 Я так понимаю, что вариант - закрыть сайт не подходит? Ну тогда ничего не сделаете. Quote Link to post Share on other sites
Recommended Posts
Join the conversation
You can post now and register later. If you have an account, sign in now to post with your account.