Оглавление / Уроки

Урок 5. Возможности инструмента "Фильтр базы ссылок"

В целом этот инструмент предельно прост, и подробно описан в справке. Однако, к большому сожалению, некоторые справкой пренебрегают, поэтому вынужден создать отдельный топик, ещё более подробный - уверен, эта информация поможет пользователям более эффективно использовать программу.

Начну с введения, после чего - три примера:

  1. Как в базе LinksList id*.txt оставить только те ссылки, которые есть в отчёте «Успешные» (в смысле хосты) - т.е. как очистить исходную базу, чтобы в ней остались только пробиваемые ресурсы
  2. Как из базы удалить все ссылки, которые ведут на форму контактов - т.е. как удалить потенциально абузные и практически бесполезные ссылки из базы
  3. Как из отчёта «Успешные» удалить все ссылки, помеченные строкой «присутствует nofollow»

ВВЕДЕНИЕ

Инструмент «Фильтр баз» способен фильтровать двумя методами:

  • применение второй базы, как фильтра (с логическим «И», или «НЕ»)
  • применение фразы или набора фраз, как фильтра

Применение второй базы, как фильтра

Для этого необходимо поставить галку напротив имени базы-фильтра:

После чего выбрать базу-фильтр, нажав на кнопку «…» справа. Это может быть либо другая база, либо какой-либо отчёт рассылки («Успешные», «Где требуется активация», и т.п.), либо просто набор хостов. Схематично можно это изобразить так: Где «База 1» - это исх.база, а «База 2» - это фильтр. Их пересечение означает, что они содержат ссылки с одинаковыми хостнеймами (именами доменов)

Далее вы вибраете одну из опций:
«Помещать в рез.базу только те строки из исх. базы, хосты которых…»

  • «присутствуют»
  • «отсутствуют в базе-фильтре»

Если выберете первую, то есть момещаем присутствующие строки - результат можно схематично изобразить так:

То есть остались только те ссылки от 1-й базы, имена доменов которых были и в фильтре.
Если выбираете вторую - то есть «остутствуют в базе-фильтре», то так:

То есть в рез.базе остались только те ссылки от 1-й базы, имен доменов которых не было в фильтре.

Применение фразы или набора фраз, как фильтра

Здесь ещё проще - программа отбирает в результирующую базу те строки, в состав которых входят (или НЕ входят) указанные слова:

ПРИМЕРЫ

Допустим, Вы завершили рассылку по базе ID 1 (т.е. LinksList id1.txt), и хотите оставить в ней только те ссылки, куда успешно отправилось сообщение. Производим следующие действия:

  1. Открываем «Инструменты → Фильтр базы ссылок»
  2. Выбираем при помощи кнопки «…» напротив поля «Исх.база» - нашу исходную базу, в данном случае LinksList id1.txt
  3. Ставим галку напротив «База-фильтр», и выбираем фильтр - в нашем случае это отчёт «Успешные», и находится в файле Logs\имя_вашего_проекта\Success id*.txt
  4. В опциях ниже выбираем «Присутствуют»
    Должно получиться примерно так:
  5. Жмём на кнопку «Старт», и через пару минут в базе LinksList id1_res.txt имеем только рабочие форумы / гостевые / блоги. Далее её уже можно переименовать в LinksList id1.txt (удалив перед этим старую) или в любую другую.

Пример 2: Как из базы удалить все ссылки, которые ведут на форму контактов - т.е. как удалить потенциально абузные и практически бесполезные ссылки из базы

Для этого нам прежде всего надо иметь список признаков, которые присутствуют в _именах_ ссылок, и ведут на формы контактов и т.п.
Я составил следующий список:

/feedback
/contact
/?content=contactus
/di_contact
/TOCContactUs.
contacts.php
contacts.htm
/index.jsp?pageId=contact
contactform.php
?class=Contact
/send_msg
kontakt
/SendMessage.
/sendfriend/
/sendtofriend.
sendtoafriend
send-private-message
send2friend

Далее:

  1. Открываем «Инструменты → Фильтр базы ссылок»
  2. Выбираем при помощи кнопки «…» напротив поля «Исх.база» - нашу исходную базу, в моём случае LinksList id1.txt
  3. В поле «Слова-фильтры» вбиваем последовательно, через пробел, вышеперечисленные слова
  4. Область поиска - выбираем «Only links», т.е. искать только в именах ссылок
  5. Далее опцию «Удалять», т.е. ссылки, которые содержат указанные слова, будут удалены из списка
    Должно получиться примерно так:
  6. Жмём на «Старт» - и через пару секунд результирующая база уже свободна от нежелательных ссылок.

Пример 3: Как из отчёта "Успешные" удалить все ссылки, помеченные строкой "присутствует nofollow"

Как Вы могли заметить, при рассылке XRumer отмечает в отчёте «Успешные» те ресурсы, где есть rel=nofollow, пометкой после Result:

присутствует nofollow;

или в англоязычном режиме:

nofollow is found;

Нужно избавиться от этих ресурсов? (хоть они и занимают-то от силы 1-2% от всей базы, но кому-то всеже хочется от них избавиться…)
Нет проблем!

  1. Открываем «Инструменты → Фильтр базы ссылок»
  2. Выбираем при помощи кнопки «…» напротив поля «Исх.база» - отчёт «Успешные», он находится в файле папка_хрумера\Logs\имя_проекта\Success id*.txt
  3. В поле «Слова-фильтры» вбиваем «nofollow» (без кавычек)
  4. Область поиска - выбираем «All except links», т.е. искать в строке кроме ссылки (т.е. то, что после «Result»)
  5. Далее опцию «Удалять», т.е. строки, которые содержат указанные слова, будут удалены из списка
  6. Жмём на «Старт» - и в результирующем файле этих строк больше нет.


См. также: • Урок 1. Обучение XRumer-а новым текстовым капчамУрок 3. Многообразие возможностей инструмента "Анализатор базы ссылок и отчётов" в XRumer-еУрок 4. Используем сразу два почтовых ящика в проекте, или как избежать бана почтовикаУрок 6. Как рассылать ответы в чужие топикиУрок 9. XRumer 5.0 - выжимаем макс.пробиваемость ПРАВИЛЬНО!Урок 10. Социальная инженерия в ходе рассылкиУрок 11. Постинг в блоги WordPressУрок 12. Пробиваем непробиваемоеУрок 13. Транслируем на весь мирУрок 14. Обучение XRumer-а 7.0 новым текстовым капчамУрок 15. Дорвеестроение - 2012Урок 16. SocPlugin - обходим ограничения соц.сетейУрок 17. Новый XRumer и DrupalУрок 18. Пакетная генерация РасписанияУрок 19. Обучение XRumer-а текстовым капчам на SMFУрок 20. Заполняем пачки аккаунтов в соц.сетях на автомате!Урок 21. Таргетированный сбор анкет в соц.сетяхУрок 22. Раскрываем возможности АвтоответчикаУрок 22 (а). Специфика работы с движками Discuz, DLE, Ucoz
Печать/экспорт
QR Code
QR Code Урок 5. Возможности инструмента "Фильтр базы ссылок" (generated for current page)
Языки