Основы парсинга Google
В этой статье я Вам расскажу, как правильно работать с Google, т.е. как собирать нужные вам ресурсы, как подготавливать запросы и еще несколько тонкостей.
Основные определения, которые вы должны знать, а если не знаете, то должны запомнить.
Что такое парсинг?
Парсинг – это сбор нужных вам ресурсов с Поисковой системы по правильно составленным запросам, если правильно составить поисковый запрос, то можно собрать все что угодно.
Что такое Поисковые запросы?
Поисковые запросы, в основном состоят из поисковых операторов + уточняющего запросам ресурса, к примеру:
поисковый оператор – intext:”” и уточняющий запрос ресурса, например ресурс форум – Powered by phpbb
Соединим вместе поисковый оператор + запрос, и у нас выйдет:
intext:” Powered by phpbb ” если ввести этот запрос в Google, то мы увидим в выдаче только форумы.
Теперь рассмотрим все подробней.
1. Вам надо знать несколько основных поисковых операторов Google:
intitle:”” – этот оператор отвечает за уточнение по заголовку сайта в выдаче Google, т.е. если вы введете запрос типа intitle:”Forum”, то вы увидите такую картинку:

Тем самым заметите, что у всех ресурсов в заголовке есть слово “forum”.
Следующий оператор, это
intext:”” – этот поисковых оператор отвечает за уточнение в тексе сайта, т.е. если Вы введете в этот оператор, уточнение “Powered by phpbb”, выйдет полностью так:
intext:”Powered by phpbb ”, то Вы увидиет в выдаче Google, только те сайты в которых есть фраза “Powered by phpbb”
на примере:

Эти два поискового оператора intitle:”” и intext:”” можно объединять, к примеру ввести в Google такой запрос:
intitle:”Forum” intext:”Powered by phpbb”
Тогда Вы увидите только те сайты, в которых есть слово Forum в заголовке сайта и фраза ”Powered by phpbb” в тексте сайта.
Следующий основной поисковый оператор, это:
site: - этот оператор показывает уточнение по доменной зоне, если ввести такой запрос:
site:com – то вы увидите в выдаче Google, сайты в доменной зоне .com
Также можно совмещать этот запрос и предыдущие два запроса.
Не мало важный поисковый оператор – inurl:””
inurl:”” – этот поисковый оператор показывает выдачу Поисковой Системы по нужному куску ссылки, т.е. например в ссылке есть слово forum, это слово вставляем в этот поисковый оператор, выходит inurl:”forum”
и видим такую картинку:

Этот поисковый оператор, можно совмещать также и с другими поисковыми операторами, например:
inurl:”forum” intext:”Powered by phpbb”
inurl:”forum” intitle:”Forum
inurl:”forum” intitle:”Forum” intext:”Powered by phpbb”
и т.д.
И еще пару совсем простых поисковых операторов, которые вы должны знать.
+”” – если сделать поисковый запрос так +”car” то Вы увидите в выдаче Google, только те сайты где присутствует слово car.
Можно этот оператор совмещать с другими операторами, например:
inurl:”forum” +”car”
intitle:”Forum” +”car”
intext:”Powered by phpbb” +”car”
intitle:”Forum” intext:”Powered by phpbb” +”car”
intitle:”Forum” +”car” site:com
intitle:”Forum” intext:”Powered by phpbb” +”car” site:com
+”car” site:com
и т.д..
Оператор, –“” – это противоположность оператору +””, т.е. если вы сделаете запрос
–“car”, то вы увидите в выдаче Google сайта где нету слова car.
На этом с Поисковыми Операторами мы закончили.
Переходим к следующему пункту статьи.
2. Как правильно составлять уточняющие запросы.
Т.е. это фразы типа “Powered by phpbb” и т.д..
Эти запросы в основном нужны чтоб подставлять их к поисковым оператором.
Создавать поисковые запросы, так:
Если Вам надо собрать с выдаче Google форумы, то Вы заходите к примеру на форумов 50 и смотрите какие фразы на форумах, часто встречаются.
Это могут быть фразы типа:
“Последнее сообщение”
“View Topic”
"Powered by phpbb"
"Powered by IPB"
"Powered by vBulletin"
И т.д.
Те фразы, которые повторяются в тексте сайта, эти фразы надо подставлять к операторам intext:””, либо +””
А фразы или слова, которые часто встречаются на заголовках форумов, то их надо подставлять к оператору intitle:””
Что касается поискового оператора inurl:””
Для него надо готовить куски ссылок, которые часто встречаются, к примеру, на форумах.
Например:
inurl: ”showthread”
inurl: ”viewtopic”
inurl: ”forumdisplay”
Все самое галвнео Вы узнали.
Теперь Вы знаете все чтобы начать собирать нужные ресурсы.
С Уважением BABBLS. Успехов в работе.