Автоматический сбор Яндекс Wordstat. Словоёб: как настроить и пользоваться программой Работа с частотностью в Словоёб

) Для работы парсера SE::Yandex::WordStat необходимы аккаунты Яндекс. Аккаунты можно зарегистрировать с помощью парсера или просто добавить существующие аккаунты в файл files/SE-Yandex/accounts.txt в формате:

[email protected];password
[email protected];password2
...

Нажмите, чтобы раскрыть...

Собираемые данные(top)

  • Количество показов по указанному запросу
  • Дату обновления статистики
  • Список всех кейвордов связанных с указанным и число их показов в месяц
  • Список всех дополнительных кейвордов которые искали пользователи и число их показов в месяц

Возможности(top)

  • Парсит максимальное отдаваемое вордстатом число результатов - 40 страниц по 50 элементов выдачи
  • Поддерживает выбор региона поиска(с подгруппами)
  • Может автоматически подставлять найденные кейворды заново в запросы(опция Parse to level)
  • Возможность выбора сразу нескольких регионов для оценки
  • Возможность обхода каптчи с помощью сервиса AntiCaptcha или любого другого поддерживающего их API

Варианты использования(top)

  • Оценка количества трафика по кейворду(частота)
  • Поиск новых ключевых слов схожей тематики
  • Сбор больших баз ключевых слов разной тематики
  • Любые другие варианты подразумевающие парсинг Яндекс.WordStat в том или ином виде

Запросы(top)

  • В качестве запросов необходимо указывать ключевые слова, точно так же как если бы их вводили прямо в форму поиска Вордстата, например:

окна москва
"окна москва"
!окна!москва

Нажмите, чтобы раскрыть...

Результаты(top)

  • В результате отображен исходный запрос, число его показов, дата обновления статистики, список связанных кейвордов и их показы в месяц, список дополнительных кейвордов и их показы в месяц

Окна!москва - 10368, updated: 16/05/2013
keywords:
окна москва: 32367
пластиковые окна москва: 8994
окна пвх москва: 4813
купить окна москва: 2561
окна цены москва: 1706
москва работа окна: 1547
вакансии окна москва: 1187
деревянные окна москва: 1087
служба +одного окна москва: 1021
...
additional keywords:
производство окон пвх: 8512
окна rehau: 15686
окна salamander: 1576
окна kbe: 3798
окна кбе: 6089
окна кве: 3227
остекление балконов: 83216
беседки: 471213
остекление лоджий: 26366
офисные перегородки: 18740
монтаж окон: 26223
...

Нажмите, чтобы раскрыть...

Возможные настройки(top)

Параметр Значение по умолчанию Описание
Pages count 10 Количество страниц для парсинга
Region All Регион поиска
Remove + from keywords Удалять символ плюса (+) из найденных запросов
Use AntiGate Определяет использовать ли AntiGate для обхода каптч
AntiGate preset default Необходимо предварительно настроить парсер Util::AntiGate - указать свой ключ доступа и другие параметры, после чего выбрать созданный пресет здесь
AntiGate preset for Login default Пресет AntiGate для логина. Необходимо предварительно настроить парсер Util::AntiGate с параметрами, после чего выбрать созданный пресет здесь
Use Accounts
First sleep 50 Задержка после первого запроса при использовании AntiGate для экономии каптч
Use session Сохраняет хорошие сессии для дальнейшего использования
Mobile only Получать статистику только для мобильного трафика
Remove bad accounts Автоматическое удаление аккаунтов с неверным логин/паролем или требующих подтверждения по телефону

Яндекс Вордстат - это один из базовых сервисов для SEO-оптимизаторов, работающих в Рунете. Штатный инструмент системы позволяет искать ключевые фразы из поисковой выдачи - высоко-, средне- и низкочастотные - используя для этого операторы для повышения эффективности поиска и настройку геолокации. В среде оптимизаторов процесс сбора ключевых запросов, релевантных тематике сайта, называется парсингом.

Специалисты проводят парсинг Яндекс, чтобы сформировать семантическое ядро - лингвистический «костяк» для будущего контента, который наиболее точно отражает нишу или услугу, которую предлагает сайт. Для этого есть собственный инструмент для поиска в Яндексе - Yandex Wordstat Assistant, который можно бесплатно привязать к аккаунту. С его помощью удобно собирать и выгружать собранные ключевые слова в таблицу Excel.

Вы можете пользоваться этим инструментом, но только в том случае, если у вас относительно небольшой сайт, где семантическое ядро составляет не более тысячи запросов. Если объем работы по сбору семантического ядра гораздо больше (например, для интернет-магазина с множеством товаров), то парсить выдачу Яндекса вручную с помощью Wordstat Assistant будет неоправданно долго. Целесообразнее делать это с помощью специальных программ и онлайн-сервисов - бесплатных, условно бесплатных и платных (например, Key Collector).

Рассмотрим основные принципы работы с Вордстат, а также популярные средства для автоматического сбора поисковых запросов.

Как правильно парсить в Вордстат: обзор программ для анализа поисковой выдачи

Парсинг выдачи Яндекса - это процесс сбора поисковых запросов по заданной тематике (с помощью базовых маркеров). С Yandex Wordstat Assistant можно легко получить основную информацию для формирования семантического ядра - поисковые запросы, количество показов в месяц по каждой фразе, а также схожие по тематике слова, помогающие расширить охват целевой аудитории. Парсер Wordstat позволяет получить информацию по словам и по регионам, при этом система ориентируется именно на сайты.

Если хотите выполнить расширенный поиск, включающий не только Яндекс, но и социальные сети и другие поисковые системы, необходимо воспользоваться универсальными инструментами, например, A-Parser. Этот программный продукт отличается удобством в работе, но для эффективной работы с ним нужно купить прокси для парсинга.

В какой среде бы Вы ни работали, используйте универсальную схему сбора семантического ядра:

  • формирование базового списка маркеров (запросов, однозначно релевантных сайту);
  • сбор ключевых слов;
  • удаление «мусора» - ненужных и случайно попавших в список запросов;
  • кластеризация ключевиков по разделам сайта или тематикам.

Рассматриваем основной алгоритм работы с Вордстат и парсим Яндекс для сбора семантики на примере сайта агентства недвижимости. Допустим, нам нужно составить перечень релевантных ключевых запросов, соответствующих базовому маркеру «аренда квартир».


Совет! Обращайте внимание на подсказки типа «вместе с этим ищут» в соседнем поле выдачи результатов парсинга - это поможет вам охватить больше аудитории при составлении SEO-контента.

Чтобы облегчить себе задачу по ручному парсингу, используйте операторы Яндекс. Например, поставив в конце поисковой фразы знак «!», вы зафиксируете окончание поискового запроса, и система будет искать слова именно в этой словоформе. Оператор «-» (минус) позволит убрать лишние слова, а квадратные скобки «» - зафиксировать порядок слов в запросе.

Специалисты советуют сочетать ручной и автоматический выбор запросов для составления семантического ядра, особенно для новичков. Пользуясь штатным инструментом Яндекс Вордстат Ассистент, вы нарабатываете навыки интуитивного подбора поисковых фраз, которые приводят на сайт целевых клиентов с помощью средне- и низкочастотных ключей. Высокочастотные фразы не всегда работают, особенно в конкурентной нише.

Если у вас нет времени на ручной парсинг в Яндекс Вордстат, используйте специальные инструменты. В интернете можно найти различное программное обеспечение, но большинство русскоязычных специалистов по SEO-оптимизации делают парсинг выдачи Яндекса с помощью Key Collector.

Это десктопный продукт, позволяющий создавать и хранить в локальной памяти компьютера проекты для каждого сайта, загружать и сохранять файлы и делать парсинг ключевых слов в соответствии с региональными настройками. Программа требует привязки к аккаунту. Для работы с ключевыми поисковыми запросами в Кей Коллекторе имеются пиктограммы основных поисковых систем в Рунете (в нашем случае это Yandex-парсер, хотя можно выбрать Google, Bing и другие).

Среди других полезных сервисов для SEO такие:

  • Serpstat - многофункциональная платформа для профессионалов, имеющая триальную версию с ограниченным функционалом, а также платную подписку от 19 до 299$ в месяц;
  • Ahrefs - веб-сервис с множеством полезных опций, включая мониторинг ниши, анализ конкурентов и улучшение индексации сайта. Для сбора семантического ядра предусмотрен инструмент Keywords Explorer. Протестировать его можно от 7$ в неделю;
  • Semrush - аналог Ahrefs по части функционала, более дорогой по тарифам (от 99$ и выше).

Специалисты утверждают, что Кей Коллектор - это самая удобная и функциональная программа, позволяющая значительно облегчить жизнь оптимизатора. У нее есть множество полезных опций для точной настройки параметров парсера Yandex (например, глубины поиска, избирательного поиска запросов по базовой частотности и т.п.).

Но у программы есть нюанс - она платная. Стоимость лицензии составляет 1800-1900 рублей по электронному и безналичному расчету соответственно.

Совет! Если по какой-то причине вы не хотите пользоваться этим продуктом, можете попробовать его бесплатный аналог «Словоёб». Подойдет и более простой вариант - Букварикс - бесплатный сервис для сбора ключевых слов и формирования семантического ядра.

Парсинг Яндекс Вордстат можно делать самостоятельно и с помощью специальных программ. Ручной сбор посредством инструмента Wordstat Assistant оправдывает себя в том случае, если ваша ниша имеет узкую направленность и мало конкурентов, а перечень поисковых запросов относительно невелик. При больших объемах работ рекомендуется пользоваться специальными программами для парсинга и аналитики.

Скачать архив с парсером
Данный парсер собирает ключевые слова и частотность в эксель файл из сервиса яндекс wordstat.
Если в Ваших частых задачах присутсвует сбор статистики по ключевым словам из сервиса yandex водстат, то одним из способов оптимизации рабочего процесса - является делегирование парсеру задачу парсинга ключевых слов.
Данный парсер не является оригинальным в функциональности, но оригинален в простоте настроек и получения данных по ключевым словам.


Функциональность данного парсера позволяет собрать кллючевые слова из сервиса wordstat.yandex.ru , статистику запрашиваемости собранных ключей, точную частоту ключей, а так же разгруппировать на кластеры собранные ключи.

Настройки парсера:

1. Логин от yandex.ru - в данное поле необходимо ввести адрес Вашего почтового ящика от яндекс почты

2. Пароль от yandex.ru - в данное поле необходимо ввести пароль от Вашей почты на яндексе

3. Файл с ключевыми словами - в данное поле указывается файл со списком ключевых слов (файл должен быть сохранён в формате utf-8, каждый ключ с новой строки), если Вы планируете активировать кластеризацию запросов после сбора, то в данном файле должна находится только 1 базовая ключевая фраза (все слова только в нижнем регистре (маленькими буквами))

4. Файл с минус-словами - в данное поле указывается файл со списком минус-слов (файл должен быть сохранён в формате utf-8, каждое минус-слово с новой строки)

5. Глубина взятия - до какой глубины парсить

6. Исследовать результаты - данная опция активирует этап кластеризации запросов, после того, как будут собраны ключи по базовой фразе (активируя данную опцию Вы обязательно должны указать файл для сохранения исследования)

7. Проверять на точную частоту - данная опция активрует сбор точной частотки по собранным ключам

8. Глубокое сканирование - данная опция активирует глубокое сканирование

9. Ключ для капч - указывать необязательно

10. Файл для сохранения ключей - эксель файл, в который будут сохраняться ключевые слова из сервиса wordstat.yandex.ru

11. Файл для сохранения исследования - эксель файл, в который будут сохраненны сгруппированые кластеры после кластеризации

Если есть вопросы или пожелания - пишите на почту [email protected]
skype - vipvodu
Скачать архив с парсером

Пример файла с кластерами по ключу - база клиентов.

Советы:
1. Тщательно проверяйте настройки перед запуском.
2. Если программа, после нажатия на кнопку - запустить - выключается - то скорее всего, что-то не так с настройками, либо есть повисшие процессы после предыдущего прерванного парсинга, повисшие процессы надо либо убить в диспетчере задач, либо перезагрузить компьютер.
3. Не прерывайте парсинг, дожидайтесь надписи - Все данные сохранены

Парсер ключевых слов — это настройка Datacol, которая автоматически собирает запросы из статистики сервиса Wordstat по заданным пользователем ключевым словам. Таким образом, вам необходимо всего лишь задать базовые ключевые слова, после чего Datacol самостоятельно соберет информацию по производным запросам. Наряду с запросами сохраняется частота показов каждого запроса в месяц. При парсинге Datacol проходит по всем страницам выдачи Wordstat.

  • С помощью парсера Wordstat Вы сможете собрать запросы и частоту показа из статистики;
  • Вам нужно указать только список ключевых слов, данные по которым Вам необходимо собрать;
  • Сохраняйте собранную информацию в любом удобном формате (Excel, TXT, WordPress, MySQL и т. д.).

Парсинг Wordstat подразумевает обработку Javascript, а также необходимость авторизации для сбора данных. Такую возможность мы получаем благодаря плагину . При запуске кампании Datacol откроет один или более экземпляров браузера Chrome для загрузки через них вебстраниц. Количество работающих экземпляров Chrome равно количеству потоков кампании. Обратите внимание, что инициализация экземпляров браузеров может занять некоторое время.

Кем и для чего используется парсер ключевых слов яндекса

Парсер ключевых слов чаще всего используется специалистами по поисковому продвижению сайтов. В частности, это касается реализации задачи составления семантического ядра сайта. Оговоримся, что ниже речь пойдет о продвижении сайтов в рунете. В данном контексте более актуален парсер ключевых слов яндекс директа.

Парсер поисковых запросов директа

Для начала опишем стандартную схему работы парсера директа.

1. Пользователь задает поисковые запросы, производные которых необходимо собрать.
2. Парсер авторизуется на яндексе и начинает парсить яндекс вордстат поочередно для каждого запроса.
3. Для каждого запроса получаются производные ключевые слова не только с первой страницы выдачи директа, но и со всех последующих.

В результате на выходе мы имеем достаточно большое количество вариантов ключевых слов, которые в дальнейшем используются для формирования семантического ядра сайта.

Парсер ключевиков и количества показов — “скользкий момент”

Отметим, что помимо ключевых слов мы получаем так называемое “прогнозируемое количество показов” — показатель к которому стоит относиться очень осторожно. Для начала разберемся, что об этом значении пишет сам Яндекс:

В результатах выводится статистика запросов поисковой системы Яндекс, содержащих заданное слово или словосочетание, и других запросов, которые осуществляли искавшие его люди (справа).
Цифры рядом с каждым запросом в результатах выдачи вордстат дают предварительный прогноз числа показов в месяц, которое вы будете иметь, выбрав данный запрос в качестве ключевого слова.

Ошибкой многих оптимизаторов является то, что они читают только первую часть описания, и при этом — читают не совсем внимательно. Идем дальше:

Цифра рядом со словом «телевизор» обозначает число показов по абсолютно всем запросам, включающим слово «телевизор»: «купить телевизор» , «плазменный телевизор», «купить плазменный телевизор», «купить новый плазменный телевизор» и т.п.

Вы уже наверное догадались, на что мы намекаем? Итак, вы должны понять главное — при парсинге производных запросов по Wordstat не стоит обращать внимание на показатель их частотности, поскольку данное значение суммируется из частотностей всех производных запросов.

Но как в таком случае определить какие ключевики более “жирные” а какие менее? Сразу развенчаем ошибочное мнение, что производные ключевики всегда имеют меньше реальных показов, что основные. Это откровенная чушь! Найти реальные количества показов ключевиков (с вычетом количества показов производных) нам позволит операторы кавычки. Таким образом, для поиска запросов и определения самых “жирных” необходимо применять следующую схему:

1. Запустить парсер ключей для поиска производных.
2. Взять все производные запросы и отпарсить количество показов каждого, задавая запрос в кавычках.

Мы согласны, что это несколько более длинный и сложный путь. Однако представьте ситуацию. У вас есть около 500 запросов, по которым вы хотите продвинуть основной сайт. 30 из них являются (по вашему первоначальному мнению, то есть по изначально спарсенной статистике Wordstat) наиболее высокочастотными. Далее вы тратите 3 месяца времени и несколько тысяч убитых енотов (да ребята — качественное продвижение это дорогостоящее и длительное мероприятие) и в итоге оказывается, что поискового трафика в несколько раз меньше чем ожидалось. Вы сильно расстраиваетесь, ищите профессионального специалиста по продвижению и он вам открывает глаза на то, что вы продвигали совсем не те запросы, которые приводят трафик (в частности, он показывает вам реальную статистику по запросам в кавычках).

Тестирование парсера запросов

На нашем сайте вы можете бесплатно скачать парсер ключевых слов яндекса и протестировать его. Мы также можем обсудить настройку парсера кеев, которая будет проверять значения собранных запросов в кавычках.

Тестирование парсера Wordstat

Чтобы протестировать работу парсера Wordstat :

Шаг 1. Установите . Демо-версия программы имеет все возможности платной, но сохраняет только первые 25 результатов парсинга.

Шаг 2. В дереве кампаний присутствует кампания seo-parsers/wordstat-keywords-parser.par . Выберите ее и нажмите кнопку Запуск (Play) . Перед запуском можно отредактировать Входные данные , чтобы изменить набор базовых запросов , по которым будет собираться статистика.

кликните на изображении для увеличения

После запуска кампании открывается окно браузера, в которое необходимо ввести авторизационные данные для доступа к статистике Wordstat.

Если у вас крупный проект с семантическим ядром на несколько сотен или тысяч запросов, согласитесь, сидеть в Вордстате и подбирать их вручную покажется изощрённой пыткой. Хорошо, что существуют программы-помощники, способные взять основную часть рутинной работы на себя. Одна из таких программ называется Словоёб.

Что такое Словоёб

Словоёб (Slovoeb) – бесплатная (и значительно урезанная по функционалу) версия программы , полюбившейся профессиональным оптимизаторам. Большинство функций КейКоллетора обычному пользователю вряд ли понадобится, поэтому можно обойтись Словоёбом для решения главной задачи – подбора ключевых слов.

Кстати, платный KeyCollector позволяет парсить слова и из Google AdWords – это особенно полезно, если ваш сайт ориентирован в первую очередь на страны, где основной трафик даёт именно Гугл. Бесплатный Slovoeb ограничен только Яндексом.

Для начала нужно скачать программу Словоёб. Сделать это можно по ссылке в блоге SEOM.info .

Программа не требует установки. Просто распакуйте архив в любое удобное место на компьютере и запустите Slovoeb.exe. В дальнейшем все ваши настройки будут храниться в выбранной папке. Перед началом работы не забудьте прочитать материал о – информация в статье актуальна и для этой программы.

Настройка Slovoeb

Вот что мы увидим после запуска:

Прежде чем приступить к работе, необходимо выполнить ряд настроек. Первое – указать аккаунты Яндекса для парсинга ключевых слов. Напоминаю, что работать в Вордстате можно только после авторизации. Поэтому советую , штук пять аккаунтов, специально предназначенных для Словоёба. Не используйте спецсимволы в паролях этих аккаунтов!

Не советую использовать свой настоящий аккаунт, так как программа делает очень много запросов к Яндексу за единицу времени, за что можно получить санкции.

Нажмите на значок шестерёнки в верхней левой части окна программы и перейдите в настройки.

Выберите вкладку Yandex.Direct и введите данные аккаунтов в формате логин:пароль . По желанию можно указать и прокси. Обязательно прочтите памятку в окне настроек!


Советую изучить и изменить другие настройки софта.

Автоматическое распознавание капчи

Следующим шагом является автоматизация распознавания капчи. Согласитесь, какой смысл в программе, если она каждый раз требует от вас вручную вводить капчу, выдаваемую Яндексом. Так как Словоёб будет много раз отправлять запросы к Яндексу за короткий промежуток времени, капчи неизбежны.

Я пользуюсь сервисом Antigate . По желанию вы можете воспользоваться и другими программами. Slovoeb поддерживает следующие:

  • Antigate
  • CaptchaBot
  • RIPCaptcha
  • ruCaptcha
  • SocialLink

О многих из них я прежде никогда не слышал.

В случае с Антигейтом есть нюанс: они переехали на новый сайт (хотя старый всё ещё доступен). Они используют общую базу, поэтому на обоих сайтах единый аккаунт. На каком регистрироваться – решать вам. Первый более классический, спартанский, более привычный для веб-мастеров со стажем. Второй же более современный.

Учтите, что Antigate платный. Но недорогой. Мне хватает 1 доллара на 2 месяца работы (а то и больше).

Перейдите на страницу настроек антикапчи, щёлкнув по вкладке в левой части окна настроек.

В поле Antigate Key введите ваш ключ антикапчи. Получить его можно в настройках профиля Antigate.


На этом базовая настройка Словоёба завершена.

Подбор ключевых слов с помощью Словоёб

Пора приступить непосредственно к подбору запросов. Для этого нужно создать новый проект. Все его данные сохранятся в файл. Таких файлов может быть неограниченное количество, так что вы легко сможете переключаться между проектами.

Нажмите на кнопку “Создать проект”:

В открывшемся окне выберите, куда сохранить файл и как его назвать. Я обычно называю файлы по имени сайта и сохраняю в папку проекта (там, где лежат все остальные данные по нему). Кто-то держит все файлы Словоёба в единой папке. Кому как удобнее.

Следующий шаг после создания проекта – настройка региона. Если ваш сайт ориентирован только на определённый регион (или регионы), вам нужна статистика поисковых запросов именно по нему, а не по всему миру. Нажмите на кнопку выбора региона и установите нужные вам галочки.

Здесь всё так же, как в интерфейсе Вордстата:


Настало время подбора ключевых слов!

Для начала подбора запросов кликните по кнопке “Пакетный сбор запросов из левой колонки Yandex.Wordstat “, как показано на скриншоте.

В открывшемся окне введите ключевые слова, на основе которых вы хотите подобрать запросы. Всё точно так же, как в интерфейсе Вордстата. Главное отличие – в программе вы можете ввести сразу несколько слов, и программа будет работать с ними по очереди, а в Вордстате нужно работать с каждым словом по очереди, вручную, что значительно увеличивает время работы.

Нажмите на кнопку “Начать сбор “. Ура, теперь можно пойти сделать кофе или переключиться на другие задачи. Словоёбу понадобится время, чтобы собрать запросы.

Стоп-слова

После того как программа отпарсила ключевые слова, необходимо отфильтровать их, отбросив не интересующие нас сочетания и формулировки. Это можно сделать с помощью стоп-слов. Нажмите на большую кнопку “Стоп-слова ” с изображением щита. В открывшемся окне кликните по кнопке “Добавить списком “. В ещё одном открывшемся окне перечислите стоп-слова (каждое с новой строчки), которых не должно быть в вашем поисковом запросе. Например, нас не интересуют запросы со словами “скачать”, “торрент”, “новая версия”, “последняя версия” и т. д., так как мы распространяем не саму программу, а только её описание.

После введения стоп-слов нажмите на кнопку “Отметить фразы в таблице ” в левом нижнем углу окна стоп-слов.

Работа с частотностью в Словоёб

Остался один нюанс: частотность запросов, отображаемая в колонке, – это базовая частотность, то есть фраза со всеми словоформами. Чтобы определить частотности с помощью операторов, кликните по кнопке с изображением лупы и выберите пункт “Собрать частотности вида ” ” “.