Table of Contents
Урок 5. Возможности инструмента "Фильтр базы ссылок"
В целом этот инструмент предельно прост, и подробно описан в справке. Однако, к большому сожалению, некоторые справкой пренебрегают, поэтому вынужден создать отдельный топик, ещё более подробный - уверен, эта информация поможет пользователям более эффективно использовать программу.
Начну с введения, после чего - три примера:
- Как в базе LinksList id*.txt оставить только те ссылки, которые есть в отчёте “Успешные” (в смысле хосты) - т.е. как очистить исходную базу, чтобы в ней остались только пробиваемые ресурсы
- Как из базы удалить все ссылки, которые ведут на форму контактов - т.е. как удалить потенциально абузные и практически бесполезные ссылки из базы
- Как из отчёта “Успешные” удалить все ссылки, помеченные строкой “присутствует nofollow”
ВВЕДЕНИЕ
Инструмент “Фильтр баз” способен фильтровать двумя методами:
- применение второй базы, как фильтра (с логическим “И”, или “НЕ”)
- применение фразы или набора фраз, как фильтра
Применение второй базы, как фильтра
Для этого необходимо поставить галку напротив имени базы-фильтра:
После чего выбрать базу-фильтр, нажав на кнопку “…” справа. Это может быть либо другая база, либо какой-либо отчёт рассылки (“Успешные”, “Где требуется активация”, и т.п.), либо просто набор хостов. Схематично можно это изобразить так:
Где “База 1” - это исх.база, а “База 2” - это фильтр. Их пересечение означает, что они содержат ссылки с одинаковыми хостнеймами (именами доменов)
Далее вы вибраете одну из опций:
“Помещать в рез.базу только те строки из исх. базы, хосты которых…”
- “присутствуют”
- “отсутствуют в базе-фильтре”
Если выберете первую, то есть помещаем присутствующие строки - результат можно схематично изобразить так:
То есть остались только те ссылки от 1-й базы, имена доменов которых были и в фильтре.
Если выбираете вторую - то есть “остутствуют в базе-фильтре”, то так:
То есть в рез.базе остались только те ссылки от 1-й базы, имен доменов которых не было в фильтре.
Применение фразы или набора фраз, как фильтра
Здесь ещё проще - программа отбирает в результирующую базу те строки, в состав которых входят (или НЕ входят) указанные слова:
ПРИМЕРЫ
Пример 1: Как в базе LinksList id*.txt оставить только те ссылки, которые есть в отчёте "Успешные" (в смысле хосты) - т.е. как очистить исходную базу, чтобы в ней остались только пробиваемые ресурсы
Допустим, Вы завершили рассылку по базе ID 1 (т.е. LinksList id1.txt), и хотите оставить в ней только те ссылки, куда успешно отправилось сообщение. Производим следующие действия:
- Открываем “Инструменты → Фильтр базы ссылок”
- Выбираем при помощи кнопки “…” напротив поля “Исх.база” - нашу исходную базу, в данном случае LinksList id1.txt
- Ставим галку напротив “База-фильтр”, и выбираем фильтр - в нашем случае это отчёт “Успешные”, и находится в файле Logs\имя_вашего_проекта\Success id*.txt
- Жмём на кнопку “Старт”, и через пару минут в базе LinksList id1_res.txt имеем только рабочие форумы / гостевые / блоги. Далее её уже можно переименовать в LinksList id1.txt (удалив перед этим старую) или в любую другую.
Пример 2: Как из базы удалить все ссылки, которые ведут на форму контактов - т.е. как удалить потенциально абузные и практически бесполезные ссылки из базы
Для этого нам прежде всего надо иметь список признаков, которые присутствуют в _именах_ ссылок, и ведут на формы контактов и т.п.
Я составил следующий список:
/feedback /contact /?content=contactus /di_contact /TOCContactUs. contacts.php contacts.htm /index.jsp?pageId=contact contactform.php ?class=Contact /send_msg kontakt /SendMessage. /sendfriend/ /sendtofriend. sendtoafriend send-private-message send2friend
Далее:
- Открываем “Инструменты → Фильтр базы ссылок”
- Выбираем при помощи кнопки “…” напротив поля “Исх.база” - нашу исходную базу, в моём случае LinksList id1.txt
- В поле “Слова-фильтры” вбиваем последовательно, через пробел, вышеперечисленные слова
- Область поиска - выбираем “Only links”, т.е. искать только в именах ссылок
- Жмём на “Старт” - и через пару секунд результирующая база уже свободна от нежелательных ссылок.
Пример 3: Как из отчёта "Успешные" удалить все ссылки, помеченные строкой "присутствует nofollow"
Как Вы могли заметить, при рассылке XRumer отмечает в отчёте “Успешные” те ресурсы, где есть rel=nofollow, пометкой после Result:
присутствует nofollow;
или в англоязычном режиме:
nofollow is found;
Нужно избавиться от этих ресурсов? (хоть они и занимают-то от силы 1-2% от всей базы, но кому-то всеже хочется от них избавиться…)
Нет проблем!
- Открываем “Инструменты → Фильтр базы ссылок”
- Выбираем при помощи кнопки “…” напротив поля “Исх.база” - отчёт “Успешные”, он находится в файле папка_хрумера\Logs\имя_проекта\Success id*.txt
- В поле “Слова-фильтры” вбиваем “nofollow” (без кавычек)
- Область поиска - выбираем “All except links”, т.е. искать в строке кроме ссылки (т.е. то, что после “Result”)
- Далее опцию “Удалять”, т.е. строки, которые содержат указанные слова, будут удалены из списка
- Жмём на “Старт” - и в результирующем файле этих строк больше нет.