sokolokaa

Как заблокировать доступ с сайта www.mlg.ru (pr.mlg.ru)?

11 posts in this topic

Привет!

Создал сайт, начал активно добавлять новости, крупные статьи, авторские и все такое. Поставил метрику и вебвизор, заметил очень странных ребят 2 раза в месяц, стабильно заходят с адреса pr.mlg.ru (основной сайт www.mlg.ru) и копируют тексты, причем копируют кусками, такое ощущение, что для агрегатора. Как они нашли мой сайт, фиг его знает, но уже больше 30 статей скопировали, наблюдаю за ними, через вебвизор.

Переходы идут всегда из: Россия → Санкт-Петербург и Ленинградская область → Санкт-Петербург

Знатоки, прошу помощи, кто это? Что это? Как заблокировать им доступ на сайт? Двигатель DLE 13.1 

Пока заблокировал 2 iP Домена, но не знаю, вообще это поможет или нет?

185.98.86.132
217.74.32.218

При просмотре в вебвизоре, переход идет с адреса: pr.mlg.ru/Article.mlg/ArticleDisplay/2321347/1074424116?internetUrl=https://мой сайт&mediaId=217910

Напрягает копирования текстов с моего сайта, вот и хочу заблокировать хомячков. Прошу помощи.

Share this post


Link to post
Share on other sites

Тянет админ в админке через какой-то парсер. Попробуйте еще так:

# Options +FollowSymlinks # 
RewriteCond %{HTTP_REFERER} pr.mlg.ru [NC]
RewriteCond %{HTTP_REFERER} !^http://(.*).natribu.org(/)?
RewriteRule .* – [F]

 

Share this post


Link to post
Share on other sites
39 минут назад, files сказал:

Тянет админ в админке через какой-то парсер. Попробуйте еще так:


# Options +FollowSymlinks # 
RewriteCond %{HTTP_REFERER} pr.mlg.ru [NC]
RewriteCond %{HTTP_REFERER} !^http://(.*).natribu.org(/)?
RewriteRule .* – [F]

 

Что значит "тянет админ в админке через парсер"? На мой или другой сайт могут быть переходы через левый сервер? Или это просто из-за кривого ПО на pr.mlg.ru?

Share this post


Link to post
Share on other sites

Переход на сайт зафиксирован из админки, соответственно, там стоит парсер, через который нужная статья копипастится.

Share this post


Link to post
Share on other sites
9 часов назад, sokolokaa сказал:

Напрягает копирования текстов с моего сайта, вот и хочу заблокировать хомячков. Прошу помощи.

Разве есть толк?
Если мне понадобится что-то спарсить/скопировать - я все равно это сделаю. Блокируй, не блокируй.
У меня из карточек товаров с лета копипастят абсолютно все. Иногда вебмастер присваивает ссылки на мой сайт, иногда нет.
Есть защита от школьников/наемных манагеров(в точку или запятую изредка вставляю ссылку на главную категорию раздела). Иногда срабатывает, иногда нет.
А вот более "хитрые" кровососы парсят выборочно и ничего не поделать.

П.С.: Сейчас начал вставлять в картинки тайтлы со своим доменом в конце. В ключевики картинок - аналогично. Вес прибавляет мизер - а эффект есть. Потому что больше всего копипастят картинки :P( а у меня в статьях есть очень много авторских фоток ).

Share this post


Link to post
Share on other sites
3 часа назад, A1exandr сказал:

Разве есть толк?
Если мне понадобится что-то спарсить/скопировать - я все равно это сделаю. Блокируй, не блокируй.
У меня из карточек товаров с лета копипастят абсолютно все. Иногда вебмастер присваивает ссылки на мой сайт, иногда нет.
Есть защита от школьников/наемных манагеров(в точку или запятую изредка вставляю ссылку на главную категорию раздела). Иногда срабатывает, иногда нет.
А вот более "хитрые" кровососы парсят выборочно и ничего не поделать.

П.С.: Сейчас начал вставлять в картинки тайтлы со своим доменом в конце. В ключевики картинок - аналогично. Вес прибавляет мизер - а эффект есть. Потому что больше всего копипастят картинки :P( а у меня в статьях есть очень много авторских фоток ).

Вся суть в том, что это человек заходит и выборочно копирует куски текста, причем выделяя не умело, видимо не первый сайт за сутки копирует. И заходит он, именно через этот сервис.

Share this post


Link to post
Share on other sites
13 часа назад, files сказал:

Тянет админ в админке через какой-то парсер. Попробуйте еще так:


# Options +FollowSymlinks # 
RewriteCond %{HTTP_REFERER} pr.mlg.ru [NC]
RewriteCond %{HTTP_REFERER} !^http://(.*).natribu.org(/)?
RewriteRule .* – [F]

 

Спасибо, прописал, надеюсь поможет, а как проверить, работает ли? Ещё, если на https отдельно нужно прописывать?

 

==============

Утром ещё один заход зафиксировал с pr.mlg.ru/Article.mlg/ArticleDisplay/1074424116?internetUrl=https:%2F%2Fмойсатй.ru&mediaId=217910 

Правда, данным способ воспользовался чуть позже.

==
Думал пишу в предыдущее сообщение, а случайно добавил новое (2 поста подряд).

Share this post


Link to post
Share on other sites
3 часа назад, sokolokaa сказал:

Вся суть в том, что это человек заходит и выборочно копирует куски текста, причем выделяя не умело, видимо не первый сайт за сутки копирует. И заходит он, именно через этот сервис.

Там корректировка скорее всего идет и контроль парсера.
Сам факт запретов отдельного сервиса - проблему не решит.
Одно хорошо, значит Ваша информационная составляющая занимает хорошее место, раз обратили внимание на нее :)

Share this post


Link to post
Share on other sites

Во-первых согласен с комментатором выше - то что копируют - это же хорошо. ПС не наказывает за неуникальные тексты, особенно если первоисточник - это вы.

Можете поставить защиту от копирования текстов, но это колхозный метод для защиты от НЕроботов, т.к. парсеры копируют через html-код

Share this post


Link to post
Share on other sites

Видать блокировка работает, поэтому стали заходить на прямую, через поиск. 

 

iP сеть Medialogia Company Network. Помогите заблокировать вредителей. Написал на почту, мол не копируйте, я запрещаю и все такое, жду ответа, но очень напрягает. Одно дело, когда копируют просто, зашел, скопировал и вставил, а эта сеть какая-то, мне она не очень нравится и напрягает прям.

Share this post


Link to post
Share on other sites

Create an account or sign in to comment

You need to be a member in order to leave a comment

Create an account

Sign up for a new account in our community. It's easy!


Register a new account

Sign in

Already have an account? Sign in here.


Sign In Now

  • Recently Browsing   0 members

    No registered users viewing this page.