Ворчун
( )
29/07/2009 12:30:32
Re: Вы получили неверные данные по Интимсити

Цитата:

Цитата:
Не 2-3 стр. в секунду, а 2-3 анкеты в секунду.

Сайт состоит из страниц, страница анкеты - это тоже страница сайта. Для срабатывания защиты не важно, что именно пользователь дергает по несколько раз в секунду - страницу анкеты или страницу каталога.

Цитата:
Вы как уникальные тел. определяли? В вашем скрипте нет обработки на дубли.

Там есть команда:

if (!in_array($matches[1][$j], $phones)) array_push($phones, $matches[1][$j]);

Означающая: если в массиве нет такого номера телефона, то добавить его. Если бы проверки на уникальность не было, то скрипт собрал бы не 1700 телефонов, а 2500 (по кол-ву анкет).

Впрочем, раз программа написана не Вами и Вы не можете вносить в нее исправления, то, наверное, нет смысла искать ошибку. Я со своей стороны, написав и выложив работающий скрипт, наглядно (на мой взгляд) показал, что ошибка не на моей, а на Вашей стороне.


ЕЩЕ РАЗ ПОВТОРЮ: "дергается" 1 страница, пишется в БУФЕР и уже из него собираются анкеты. У вас же телефоны есть прямо на странице. Для сайта это выглядит как открытие ОДНОЙ страницы в 20-30 сек.
Вашей команды, убирающей дубли, в приведенном скрипте не вижу. Если вы утверждаете, что он рабочий, приводите полностью рабочий код, чтобы можно было проверить. А то сейчас ваш "работающий" скрипт из командной строки у меня вылетает с ошибкой, а из-под обоих браузеров просто ничего не говорит. Я не настолько соображаю в JScript, чтоьбы искать причину этого. Мне проще написать все заново на C++. Зато я вижу, как мой рабочий скрипт медленно и визуально собирает телефон за телефоном с сайта. А затем дает один массив со всеми дублями, и отдельно - без оных.
Короче, через 2 недели запущу его еще раз, на вашем сайте - 30-60 проходов, посмотрим, что изменилось.