Table of Contents
Урок 1. Обучение XRumer-а новым текстовым капчам
Сейчас на гостевых/блогах всё чаще вводят защиту в виде текстовых капчей (текстовых, а не графических - т.е. для их распознавания особых усилий не нужно, т.к. они видны в HTML-коде).
Общие сведения об обучении XRumer 4.0 текстовым капчам вы можете прочесть в справке, раздел “Описание работы программы → Автораспознавание текстовой защиты”
Возьмём для примера полезный ресурс в зоне EDU:
http://www.cuesta.edu/cuestainfo/
Этап 1: АНАЛИЗ
- Запускаем XRumer, желательно с дефолтовыми настройками, с любым готовым проектом. Вводим в поле слева от кнопки “Тест” (в главном окне) ссылку:
http://www.cuesta.edu/cuestainfo/ - Жмем на “Тест”, ожидаем завершения потока…
- Заходим в папку Debug, в ней XRumer отчитался об обработке данного ресурса
- Открываем файл LAST GET id*.htm - в нем находится отчёт о последнем ответе сервера, после заполнения формы и отправки. В нем наблюдается следующая строчка:
<script language="javascript">alert('the form could not be submitted :\n- field \'reqword\' is required.\n- field \'reqword\' is can only contain alphabetic characters.\n- field \'reqword\' cannot contain less than 5 characters.\n');history.back();</script>
Судя по сообщению, программа не заполнила одного из необходимых полей - reqword. Этого и следовало ожидать. Значит проблема именно в том, что программа не смогла обойти эту защиту.
Этап 2: ОБУЧЕНИЕ
- Заходим на http://www.cuesta.edu/cuestainfo/ через браузер, смотрим исходный HTML-код страницы; ищем там поле “reqword”, находим следующее:
<b>Finally, please type the word "Cuesta" here (to help us prevent spammers):<font color="#FF0000">*</font></b> <input name="reqword" type="text">
- Открываем файл XRumer-а textcaptcha.txt. Добавим 2 пустые строчки в его начале с помощью “Enter”-а.
- Прописываем в этих строчках:
#please type the word|"|" here reqword
Это означает, что за опорную фразу программа возьмет “please type the word”, после нее возьмет текст, который находится между “ и ” here, и полученное значение поместит в поле reqword.
- Сохраняем отредактированный файл textcaptcha.txt, перезапускаем XRumer. Обучение завершено!
Этап 3: ПРОВЕРКА
- Повторяем пункты 1-2 этапа “АНАЛИЗ”
- Как видим, в отчете теперь появляется “текстовая капча дешифрована”
- Смотрим файл LAST GET.htm из папки Debug, на этот раз видим:
thank you for contacting cuesta college. an email has been sent to your address to confirm receipt of your correspondence. one of our representatives will contact you soon
То есть сообщение было успешно отправлено - однако еще нужно потверждение по емейл. Тем не менее, этап обучения текстовой капчи пройден, и сообщение успешно отправляется.
Разумеется, это только пример - приведенный ресурс http://www.cuesta.edu/cuestainfo/ вообще не подходит для рассылки, лучше обучать програму капчам на распространенных движках гостевых и т.п.