Bazzinga

VK Docs Grabber — уникальный контент 0,5 млн зн. за полчаса!

9 posts in this topic

Предлагается комплекс софта и методика для постоянного сбора уникального контента. Парсим документы в промышленных объемах.  Не стоит бояться, что контент закончится - его так много, что хватит на всех. Плюс непрерывно появляются тонны нового. Если вы думаете что там нечего ловить, то это не так. 0.5-1% уника там есть, но это как с золотой рудой - мало кто способен его добыть. Ну а если парсим, к примеру, 10Gb - то можете сами представить. Предлагаемая методика позволяет свести ручную работу к минимуму и получить на выходе файлы с уником. Объемы такой работы смотрите ниже - все проверил и расписал максимально подробно.
Цена более чем символическая, не отбить её просто невозможно :)

Состав сборки:
- шаблон под ZennoPoster, если у вас нет постера то можно использовать ZennoBox
- очень удобная программа для удаления дублей (free)
- очень удобная программа-конвертер всех форматов документов (free)
- методика-мануал по поиску файлов с уникальным текстом (все подробно со скринами).

Как это работает:
- на входе файл с ключами, по которым будем парсить, на выходе папки по имени ключа, внутри все файлы разложены по папкам форматов файла.
- в данный момент грабит doc, docx, rtf, txt + могу добавить форматы по вашему желанию.
- ключи по мере парсинга из базы удаляются, так что если вдруг шаб вылетит по какой то причине - его можно снова запускать и он будет парсить с того же места.
- далее работаем по методике и получаем чистый уник. Потребуется 2-3 бакса на антикапчу.

Результаты эксперимента:
Была взята небольшая база ключей (ок.100шт), по которой за 10 часов на 10Mbit'ном канале в 1 поток было скачано ок. 5 Gb документов, все файлы скомпонованы по типам, после чего за день все было переконвертировано в txt.

Скриншоты:

img_1.png


img_2.png



Получилось ок 8 000 файлов, которые были прогнаны экспресс-проверкой, на что ушел второй день. Затем все получившиеся файлы были прогнаны второй раз с уже более  строгими настройками. В результате получилось почти 100 Мб (1500 файлов) уникального (от 70%) текста в txt формате и стоило это ок $2,5  (за  разгадывание капчи на antigate.com). Далее весь этот массив подлежал ручной проверке. В основном это оказались уникальные дипломы, лекции, конспекты, курсовые, книги и просто статьи. Иногда попадались большие файлы с творчеством пользователей - понятное дело, что они были уже 100% уникальны. Буквально за 30 минут я насобирал тематичных статей из чистого уникального текста без цифр и прочего мусора на 500 тыс знаков (на 1500р при средней цене за скан в 3р/1k). Причем это зависит от ключей, которые вы используете. Я предполагаю что можно найти такие ключи, по которым процент уника будет больше.
Всем желающим могу выслать пак на 350 тыс. знаков уникального теста. Более подробно у меня на сайте.

Скриншоты:

img_3.png


img_4.png



Стоимость шаблона - $10

Другие мои шаблоны:

  • Отправка заявок и сбор заданий для Блогуна (рост дохода и экстремальная экономия времени!)
  • Поиск и вступление в закрытые группы ВК и ОД - можно собирать уникальный контент или использовать их в других парсерах
  • Комплекс шаблонов для блогов LiveJournal.com (ЖЖ) - реггер, постер, френдер, филлер и чекер френдов.
  • любые другие шаблоны на заказ

Все это вы можете найти на сайте Bazzinga.ru - Шаблоны для ZennoPoster

Контакты:
im_icq.gif    3409-3409
im_skype.gif    bazzinga.ru
Gmail.gif    bazzinga.lab(гав!)gmail.com
 

 

 

Share this post


Link to post
Share on other sites

есть люди которые протестировали сие творение?

ТС первому за отзыв протестировать отказался.

Share this post


Link to post
Share on other sites

@zverolom, еще одно упоминание "первому за отзыв" - уйдете читать правила форума на недельку (не забудьте потом оставить отзыв). Одно ваше сообщение удалил - так вы снова пытаетесь.

 

ЗЫ: по поводу "за отзыв"

Share this post


Link to post
Share on other sites

@zverolom, еще одно упоминание "первому за отзыв" - уйдете читать правила форума на недельку (не забудьте потом оставить отзыв). Одно ваше сообщение удалил - так вы снова пытаетесь.

7. Кросспостинг (создание одной темы в двух или более форумах).

 

 

меня ругаете, а создателя данной темы нет...хм.

на нескольких форумах данная тема.

Share this post


Link to post
Share on other sites

меня ругаете, а создателя данной темы нет...хм.

Создателя темы только 2 часа нету, ему что целыми днями на форуме сидеть чтобы продать программу?

на нескольких форумах данная тема.

И это повод его ругать?

Share this post


Link to post
Share on other sites

 

 


на нескольких форумах данная тема.

 

И что?

 

Кросспостинг, если Вы не в курсе это создание нескольких тем на ОДНОМ форуме... 

Share this post


Link to post
Share on other sites

@zverolom десять раз подумайте прежде чем писать подобный бред, тем более когда ТС предоставил доказательства работы программы!

Надеюсь вы понимаете кто такой ТС!))

Соизволю возразить


Кросспостинг, если Вы не в курсе это создание нескольких тем на ОДНОМ форуме

 

Кросспостинг - это создание одной и той же темы в двух и более форумах.

Несколько тем в одном форуме, это уже дублирование так сказать!

Edited by buktor

Share this post


Link to post
Share on other sites

 

 


Кросспостинг - это создание одной и той же темы в двух и более форумах.

 

Один форум в данном случае один УРЛ адрес. То есть если человек создаст тему на этом форуме и Серче это не кросспостинг, если только у нас создаст 2 темы- это он и есть

Share this post


Link to post
Share on other sites

Один форум в данном случае один УРЛ адрес. То есть если человек создаст тему на этом форуме и Серче это не кросспостинг, если только у нас создаст 2 темы- это он и есть

Ну если на серче тогда понятное дело! :D

Share this post


Link to post
Share on other sites
Guest
This topic is now closed to further replies.

  • Recently Browsing   0 members

    No registered users viewing this page.