Вы читаете “Парсим Яндекс под Sape”, в блоге Оптимизация сайтов от cross{blog}
- Опубликовано:
- 11.25.07 / 2am
- Рубрика:
- Общее
Реклама
Полезные ссылки
Парсим Яндекс под Sape
В продолженние темы парсинга с помощью php, только теперь видимых в Яндексе сайтов показываю скриптец, который вам поможет упростить работу с Sape.
<?
$count_pages=20;
for($a=0;$a<$count_pages;$a++)
{
$url="http://www.yandex.ru/yandsearch?&p=".$a."&text=url%3D%22blog.itcross.net%22+%7C+url%3D%22blog.itcross.net%2F*%22&pag=u&lr=187";
$file=file_get_contents($url);
$file=str_replace("\n","",str_replace("\r","",str_replace("\r\n","",str_replace("\t","",$file))));
preg_match_all("/\<span style=\"color:#060;\"\>(.*?)\ \·\ /",$file,$urls);
if(!count($urls)) break;
for($i=0;$i<count($urls[1]);$i++)
echo $urls[1][$i]."<br>";
}
?>
Все, что необходимо сделать, оформить в Яндексе запрос вида url="blog.itcross.net" | url="blog.itcross.net/*", подставив свой сайт, оценить количество проиндексированных страниц и подправить url и count_pages переменные под себя. Парсер готов.
Почему много денег? Потому что Главмед!
Парсим Яндекс под Sape
Комментарии (2)Оставить комментарий |