Оглавление / Уроки

Урок 5. Возможности инструмента "Фильтр базы ссылок"

В целом этот инструмент предельно прост, и подробно описан в справке. Однако, к большому сожалению, некоторые справкой пренебрегают, поэтому вынужден создать отдельный топик, ещё более подробный - уверен, эта информация поможет пользователям более эффективно использовать программу.

Начну с введения, после чего - три примера:

  1. Как в базе LinksList id*.txt оставить только те ссылки, которые есть в отчёте “Успешные” (в смысле хосты) - т.е. как очистить исходную базу, чтобы в ней остались только пробиваемые ресурсы
  2. Как из базы удалить все ссылки, которые ведут на форму контактов - т.е. как удалить потенциально абузные и практически бесполезные ссылки из базы
  3. Как из отчёта “Успешные” удалить все ссылки, помеченные строкой “присутствует nofollow”

ВВЕДЕНИЕ

Инструмент “Фильтр баз” способен фильтровать двумя методами:

  • применение второй базы, как фильтра (с логическим “И”, или “НЕ”)
  • применение фразы или набора фраз, как фильтра

Применение второй базы, как фильтра

Для этого необходимо поставить галку напротив имени базы-фильтра:

После чего выбрать базу-фильтр, нажав на кнопку “…” справа. Это может быть либо другая база, либо какой-либо отчёт рассылки (“Успешные”, “Где требуется активация”, и т.п.), либо просто набор хостов. Схематично можно это изобразить так: Где “База 1” - это исх.база, а “База 2” - это фильтр. Их пересечение означает, что они содержат ссылки с одинаковыми хостнеймами (именами доменов)

Далее вы вибраете одну из опций:
“Помещать в рез.базу только те строки из исх. базы, хосты которых…”

  • “присутствуют”
  • “отсутствуют в базе-фильтре”

Если выберете первую, то есть помещаем присутствующие строки - результат можно схематично изобразить так:

То есть остались только те ссылки от 1-й базы, имена доменов которых были и в фильтре.
Если выбираете вторую - то есть “остутствуют в базе-фильтре”, то так:

То есть в рез.базе остались только те ссылки от 1-й базы, имен доменов которых не было в фильтре.

Применение фразы или набора фраз, как фильтра

Здесь ещё проще - программа отбирает в результирующую базу те строки, в состав которых входят (или НЕ входят) указанные слова:

ПРИМЕРЫ

Допустим, Вы завершили рассылку по базе ID 1 (т.е. LinksList id1.txt), и хотите оставить в ней только те ссылки, куда успешно отправилось сообщение. Производим следующие действия:

  1. Открываем “Инструменты → Фильтр базы ссылок”
  2. Выбираем при помощи кнопки “…” напротив поля “Исх.база” - нашу исходную базу, в данном случае LinksList id1.txt
  3. Ставим галку напротив “База-фильтр”, и выбираем фильтр - в нашем случае это отчёт “Успешные”, и находится в файле Logs\имя_вашего_проекта\Success id*.txt
  4. В опциях ниже выбираем “Присутствуют”
    Должно получиться примерно так:
  5. Жмём на кнопку “Старт”, и через пару минут в базе LinksList id1_res.txt имеем только рабочие форумы / гостевые / блоги. Далее её уже можно переименовать в LinksList id1.txt (удалив перед этим старую) или в любую другую.

Пример 2: Как из базы удалить все ссылки, которые ведут на форму контактов - т.е. как удалить потенциально абузные и практически бесполезные ссылки из базы

Для этого нам прежде всего надо иметь список признаков, которые присутствуют в _именах_ ссылок, и ведут на формы контактов и т.п.
Я составил следующий список:

/feedback
/contact
/?content=contactus
/di_contact
/TOCContactUs.
contacts.php
contacts.htm
/index.jsp?pageId=contact
contactform.php
?class=Contact
/send_msg
kontakt
/SendMessage.
/sendfriend/
/sendtofriend.
sendtoafriend
send-private-message
send2friend

Далее:

  1. Открываем “Инструменты → Фильтр базы ссылок”
  2. Выбираем при помощи кнопки “…” напротив поля “Исх.база” - нашу исходную базу, в моём случае LinksList id1.txt
  3. В поле “Слова-фильтры” вбиваем последовательно, через пробел, вышеперечисленные слова
  4. Область поиска - выбираем “Only links”, т.е. искать только в именах ссылок
  5. Далее опцию “Удалять”, т.е. ссылки, которые содержат указанные слова, будут удалены из списка
    Должно получиться примерно так:
  6. Жмём на “Старт” - и через пару секунд результирующая база уже свободна от нежелательных ссылок.

Пример 3: Как из отчёта "Успешные" удалить все ссылки, помеченные строкой "присутствует nofollow"

Как Вы могли заметить, при рассылке XRumer отмечает в отчёте “Успешные” те ресурсы, где есть rel=nofollow, пометкой после Result:

присутствует nofollow;

или в англоязычном режиме:

nofollow is found;

Нужно избавиться от этих ресурсов? (хоть они и занимают-то от силы 1-2% от всей базы, но кому-то всеже хочется от них избавиться…)
Нет проблем!

  1. Открываем “Инструменты → Фильтр базы ссылок”
  2. Выбираем при помощи кнопки “…” напротив поля “Исх.база” - отчёт “Успешные”, он находится в файле папка_хрумера\Logs\имя_проекта\Success id*.txt
  3. В поле “Слова-фильтры” вбиваем “nofollow” (без кавычек)
  4. Область поиска - выбираем “All except links”, т.е. искать в строке кроме ссылки (т.е. то, что после “Result”)
  5. Далее опцию “Удалять”, т.е. строки, которые содержат указанные слова, будут удалены из списка
  6. Жмём на “Старт” - и в результирующем файле этих строк больше нет.


См. также: • Урок 1. Обучение XRumer-а новым текстовым капчамУрок 3. Многообразие возможностей инструмента "Анализатор базы ссылок и отчётов" в XRumer-еУрок 4. Используем сразу два почтовых ящика в проекте, или как избежать бана почтовикаУрок 6. Как рассылать ответы в чужие топикиУрок 9. XRumer 5.0 - выжимаем макс.пробиваемость ПРАВИЛЬНО!Урок 10. Социальная инженерия в ходе рассылкиУрок 11. Постинг в блоги WordPressУрок 12. Пробиваем непробиваемоеУрок 13. Транслируем на весь мирУрок 14. Обучение XRumer-а 7.0 новым текстовым капчамУрок 15. Дорвеестроение - 2012Урок 16. SocPlugin - обходим ограничения соц.сетейУрок 17. Новый XRumer и DrupalУрок 18. Пакетная генерация РасписанияУрок 19. Обучение XRumer-а текстовым капчам на SMFУрок 20. Заполняем пачки аккаунтов в соц.сетях на автомате!Урок 21. Таргетированный сбор анкет в соц.сетяхУрок 22. Раскрываем возможности АвтоответчикаУрок 22 (а). Специфика работы с движками Discuz, DLE, Ucoz
Languages
Translations of this page: