! Главная страница | Зарегистрироваться | Вход с паролем | ОТЗЫВЫ клиентов BABBLS Shop | Уведомление от WM !

(пусто)
 

Если у Вас появились вопросы, стучите в icq - 348934686

РЕКОМЕНДУЮ!!! Прокси серсис AWMproxy, хорошо подходят для парсинга Поисковых Систем и для рассылок, при покупке выбирайте тариф "Приватные HTTP/SOCKS". Буду благодарен если воспользуетесь моей реф. ссылкой.


Основы парсинга Google

В этой статье я Вам расскажу, как правильно работать с Google, т.е. как собирать нужные вам ресурсы, как подготавливать запросы и еще несколько тонкостей.

Основные определения, которые вы должны знать, а если не знаете, то должны запомнить.

Что такое парсинг?

Парсинг – это сбор нужных вам ресурсов с Поисковой системы по правильно составленным запросам, если правильно составить поисковый запрос, то можно собрать все что угодно.

Что такое Поисковые запросы?

Поисковые запросы, в основном состоят из поисковых операторов + уточняющего запросам ресурса, к примеру:

поисковый оператор – intext:”” и уточняющий запрос ресурса, например ресурс форум – Powered by phpbb

Соединим вместе поисковый оператор +  запрос, и у  нас выйдет:

intext:” Powered by phpbb если ввести этот запрос в Google, то мы увидим в выдаче только форумы.

 

Теперь рассмотрим все подробней.

1. Вам надо знать несколько основных поисковых операторов Google:

intitle:”” – этот оператор отвечает за уточнение по заголовку сайта в выдаче Google, т.е. если вы введете запрос типа intitle:”Forum, то вы увидите такую картинку:

Тем самым заметите, что у всех ресурсов в заголовке есть слово “forum”.

Следующий оператор, это

intext:”” – этот поисковых оператор отвечает за уточнение в тексе сайта, т.е. если Вы введете в этот оператор, уточнение “Powered by phpbb”, выйдет полностью так:

intext:”Powered by phpbb, то Вы увидиет в выдаче Google, только те сайты в которых есть фраза “Powered by phpbb

на примере:

Эти два поискового оператора intitle:”” и intext:”” можно объединять, к примеру ввести в  Google такой запрос:

intitle:”Forum” intext:”Powered by phpbb”

Тогда Вы увидите только те сайты, в которых есть слово Forum в заголовке сайта и фраза ”Powered by phpbb” в тексте сайта.

 

Следующий основной поисковый оператор, это:

site: - этот оператор показывает уточнение по доменной зоне, если ввести такой запрос:

site:com – то вы увидите в выдаче Google, сайты в доменной зоне .com

Также можно совмещать этот запрос и предыдущие два запроса.

 

Не мало важный поисковый оператор – inurl:””

inurl:””этот поисковый оператор показывает выдачу Поисковой Системы по нужному куску ссылки, т.е. например в ссылке есть слово forum, это слово вставляем в этот поисковый оператор, выходит inurl:”forum”

и видим такую картинку:

Этот поисковый оператор, можно совмещать также и с другими поисковыми операторами, например:

inurl:”forum” intext:”Powered by phpbb”

inurl:”forum” intitle:”Forum

inurl:”forum” intitle:”Forum” intext:”Powered by phpbb”

и т.д.

 

И еще пару совсем простых поисковых операторов, которые вы должны знать.

+”” – если сделать поисковый запрос так +”car то Вы увидите в выдаче Google, только те сайты где присутствует слово car.

Можно этот оператор совмещать с  другими операторами, например:

inurl:”forum” +”car”

intitle:”Forum” +”car”

intext:”Powered by phpbb” +”car”

intitle:”Forum” intext:”Powered by phpbb” +”car”

intitle:”Forum” +”car” site:com

intitle:”Forum” intext:”Powered by phpbb” +”car” site:com

+”car” site:com

и т.д..

 

Оператор, –“” – это противоположность оператору +””, т.е. если вы сделаете запрос

–“car”, то вы увидите в выдаче Google сайта где нету слова car.

На этом с Поисковыми Операторами мы закончили.

 

Переходим к следующему пункту статьи.

2. Как правильно составлять уточняющие запросы.

Т.е. это фразы типа “Powered by phpbb” и т.д..

Эти запросы в основном нужны чтоб подставлять их к поисковым оператором.

Создавать поисковые запросы, так:

Если Вам надо собрать с выдаче Google форумы, то Вы заходите к примеру на форумов 50 и смотрите какие фразы на форумах, часто встречаются.

Это могут быть фразы типа:

Последнее сообщение

“View Topic”

"Powered by phpbb"

"Powered by IPB"

"Powered by vBulletin"

И т.д.

Те фразы, которые повторяются в тексте сайта, эти фразы надо подставлять к операторам intext:””, либо  +””

А фразы или слова, которые часто встречаются на заголовках форумов, то их надо подставлять к оператору intitle:””

 

Что касается поискового оператора inurl:””

Для него надо готовить куски ссылок, которые часто встречаются, к примеру, на форумах.

Например:

inurl: ”showthread”

inurl: ”viewtopic”

inurl: ”forumdisplay”


Все самое галвнео Вы узнали.

Теперь Вы знаете все чтобы начать собирать нужные ресурсы.

С Уважением BABBLS. Успехов в работе.

 

Блог / Новости
03.05.2012 10:58:10
26.03.2012 15:45:28
29.02.2012 13:28:27
02.01.2012 10:42:14
19.10.2011 17:21:40
Подписаться на новости:
или RSS 2.0
www.megastock.ru BABBLS SHOP © 2011 | Все права защищены