Релевантность поиска с помощью поисковых систем. Релевантность — что это простыми словами

(6)

Релевантность (в SEO) – это соответствие страницы web-сайта запросу интернет-пользователя в поисковой системе. Проще говоря, релевантность определяет степень удовлетворения пользователя поисковыми результатами, которые отобразились в ответ на его запрос.

Соответствие сайта запросу высчитывается различными алгоритмами поисковиков. Однако, чем больше контент страницы предоставляет пользователю необходимой информации, тем больше она релевантна и, соответственно, тем выше находится в поисковой выдаче.

Если веб-мастер, создав контент для определенной страницы, обеспечит пропорциональное соотношение ключевых слов объему самого текста, то сразу после индексации она может попасть в ТОП выдачи поисковых систем. Но сам контент может не соответствовать ожиданиям пользователя.

Например, вы можете ввести запрос: «что такое релевантность», и в результатах поиска на первом месте будет находиться страница, в которой предлагаются услуги по повышению релевантности сайта компанией, занимающейся SEO продвижением сайтов. Это нерелевантный результат.

А вот результаты поиска, например расположенные ниже, уже будут соответствовать интересующей вас тематике, то есть отвечать на запрос "что такое релевантность".

Такое явление зачастую наблюдается из-за спам-страниц или дорвеев – ресурсов, которые продвигаются по определенным запросам с целью перенаправления посетителя на другую интернет-площадку, не отвечающую его запросу.

Раньше страница, не соответствующая запросу, и дальше оставалась бы в ТОПе, но сегодня большую роль в ранжировании web-сайтов играют современные инструменты, среди которых – поведенческие факторы (поведение пользователей на странице ресурса). Разумеется, зайдя на первый (нерелевантный) сайт, вы быстро покинете его, а на последующих задержитесь подольше, так как там есть полезная для вас информация.

На заметку . Поисковые системы отслеживают поведение пользователей на страницах и, исходя из этого, определяют их соответствие запросам. Если посетители, перейдя по ссылке, вскоре ее покидают, это снижает ее релевантность и, соответственно, она теряет позиции в поисковой выдаче.

Поэтому сегодня у поисковиков в приоритете сайты с максимально раскрытым, полезным и содержательным контентом, который дает исчерпывающие ответы на вопросы пользователей. Именно такие ресурсы и пробиваются на лидирующие позиции в поисковых выдачах.

Какие есть виды релевантности поиска?

  1. Формальная . Данный вид релевантности заключается в сравнении пользовательского запроса с индексируемой страницей, и рассчитывается он по конкретной формуле, исходя из собранных роботом данных. Это основной алгоритм поисковиков.
  2. Содержательная . Определяется специалистами, которых называют асессорами. Они анализируют качество поисковых результатов, исходя из оценки соответствия найденной страницы запросу.
  3. Пертинентность . Полноценное удовлетворение пользователя необходимой информацией. Данный вид релевантности определяется поведением посетителей сайта и их удовлетворенностью содержимым документа. К такому алгоритму сегодня стремятся все поисковые машины.

Какие факторы определяют релевантность страницы?

Каждая поисковая система имеет свои инструменты, по которым она определяет релевантность ресурса. Однако есть ряд общих алгоритмов, влияющих на соответствие web-страницы запросам пользователей.

Текстовое соответствие запросу

  • мета-теги title и description;
  • URL-страницы;
  • заголовок и подзаголовки текста;
  • прямые и разбавленные вхождения ключевых слов и фраз в тексте;
  • атрибут alt тега img (альтернативный текст для изображения).

Факторы ссылочной релевантности

  • внутренняя и внешняя перелинковка;
  • анкоры (тексты) ссылок;
  • авторитетность ссылающихся сайтов (доноров) ;
  • скорость прироста ссылочной массы.

Поведенческие факторы

  • количество посетителей;
  • ресурсы, с которых они переходят на страницу;
  • время пребывания на сайте;
  • количество просмотров;
  • удобство переходов по разделам ресурса для поиска нужной информации;
  • частота отказов;
  • конверсия (количество целевых действий: регистрация, покупка, подписка и т.п.).

Заключение

Как видите, релевантность сайта зависит от многих факторов, как внешних, так и внутренних. Но если вы хотите, чтобы ваш ресурс всегда находился на высоких позициях в поисковых системах, пишите качественный контент для людей, а не для роботов. С учетом современных алгоритмов ранжирования, текстовая составляющая релевантности является одной из основных для SEO продвижения.

Изучая заумный SEO талмуд вы часто встречаете понятие «релевантность» текста, страницы или сайта в целом. Релевантность что это простыми словами? Именно об этом и будет эта публикация, подробно разберем термин релевантность, рассмотрим примеры релевантной выдачи поисковых систем и как ее добиться.

Релевантность что это

Релевантность это соотношение поискового запроса к полученному результату выдачи. Простыми словами релевантность информации это то насколько контент (текст, картинки, видео) удовлетворяют ищущего в поиске пользователя.

Что такое релевантность поиска

Что бы понять что такое релевантность поиска давайте рассмотрим примеры на пальцах, простыми словами попытаемся разобраться.

Пример релевантной выдачи. Некий пользователь вводит запрос в поисковике: «Как печь пироги с яблоками». В итоге мы получим первую 10-ку сайтов с рецептами.

Возьмем первых 5 позиций, проанализируем снизу вверх (начнем с 5-й):

  1. На пятом месте мы увидим рецепт пирога, где будет описаны нужные ингредиенты, что зачем смешивать и как готовить, общая картинка готового пирога. В роди бы все отлично, но почему этот сайт «получил» только 60% релевантности (цифра с потолка для наглядности). Пойдем дальше и поймем в чем причина.
  2. На 4-й позиции все тот же рецепт что и в предыдущим примере, только добавлено несколько картинок в процессе приготовления. Статья получилась уже более информативной и она получит свои 70% релевантности.
  3. Поднимаемся выше. Все то же самое что и в предыдущем примере, плюс добавлено видео процесса приготовления злосчастного пирога. Процент пользователей довольных полученной информацией резко увеличиться. Свои 80% релевантности информации сайт получил не зря.
  4. На втором пункте находится рецепт с картинками, видео, подробным текстовым описанием и расположены ссылки на похожие рецепты, к примеру с добавлением груш или более дешевый вариант. Пользователь изучил материал, остался доволен и перешел на следующую страницу. Для поисковой системы это отличный сигнал. Этот сайт получает 90%.
  5. И наконец наш победитель, первое место в выдаче по релевантности информации. Полный набор контента (текст, картинки, видео, ссылки на похожие материалы), довольный пользователь. Но что же отделяет этого пользователя от предыдущего? А отделяет его правильно использованные ключевые слова, которые соответствуют поисковому запросу. К примеру в тайтле страницы, в тегах h1-h6, в тексте есть слова и словосочетания встречающиеся в запросе. Это называется внутренней релевантностью. Об это я расскажу чуть ниже.

Я думаю после этого примера вам стало ясно что такое релевантность страниц сайта и как ее определить. Мы определяли уровень релевантности наглядно, но ее можно вычислить и в реальных цифрах, сразу после того как разберем внутреннюю и внешнюю релевантность.

Внутренние критерии релевантности текста

Мы рассмотрели что такое релевантность в поиске, теперь давайте выведем основные тезисы, благодаря которым можно добиться высшей степени удовлетворения посетителя:

  • Первый и основной момент, текст должен рассказать или показать то, о чем спрашивает пользователь в поисковой машины. Это самое главное.
  • Присутствие ключевых слов в тексте, немаловажный пункт. Если ваш контент будет идеален но в нем не будет ни одного точного вхождения продвигаемого запроса шанс попадания в топ стремиться к нулю.
  • Использование синонимов и словоформ ключевых слов.
  • Плотность ключей. Это понятие доживает свой век, при хорошем контенте и правильной оптимизации достаточно и одного вхождения ключа. Тем не менее старайтесь не пичкать одни и те же слова рядом, это будет расценено как спам и не только понизит релевантность теста, а может и вовсе выбросить такую страницу с поиска.
  • Место расположения ключевых слов. Это интересный вопрос, над ним так же бушует много споров. Все могут согласиться в одно. Главный ключ должен находиться в точной форме в первом абзаце текста, раз в средине и в самом конце. Этого будет вполне достаточно.
  • Используйте ключевые фразы в тегах h1-h6, в дескрипшине и тайтле. Это придаст значительный вес вашей странице по данному запросу.

Это основные внутренние принципы, по которым определяется релевантность информации на страницах сайта.

Внешние критерии релевантности

К внешней релевантности относятся ссылки ведущие на сайт. Чем чаще на вашу страницу ссылаются тем лучше. Если страница, с которой поставлена ссылка, схожей или той же тематики, да еще и анкор (текст ссылки) содержит ключевое слово. Это значительно увеличит релевантность той страницы на которую поставлена ссылка.

Как повысить релевантность

Как повысить релевантность уже проиндексированной страницы? Можете вернуться к предыдущим двум заголовкам и проанализировать все ли у вас имеется, но давайте еще раз повторимся и разложим по пунктам, как должна выглядеть релевантная страница, будь она новой или требуемой редактирования старой.

Итак, релевантная страница должна содержать в себе следующее:

  1. Ключевые слова в title.
  2. Ключ в H1
  3. Ключевые слова в первом абзаце. (Чем ближе к началу тем лучше).
  4. Контент должен полностью отвечать поисковому запросу. Содержать исчерпывающую информацию, что бы посетителю больше не захотелось смотреть другие сайты.
  5. Использовать картинки, видео, списки, небольшие абзацы, ссылки на похожие материалы.
  6. Описание (description), часто используется в снипете (текст в поиске), должно быть кратки, информативным и привлекательным. С использованием ключевых слов.
  7. Страница должна иметь входящие ссылки с других сайтов.

Вы можете пробежаться по всем пунктам и проверить все ли у вас на месте, если нужно можно дополнить статью, дописать, добавить некоторые элементы. Очень детально о том, я уже рассказывал.

Для проверки релевантности странице существует множество онлайн сервисов. Я перечислю несколько из них.

На сайте PR-CY.ru можно проверить релевантность. Нужно ввести необходимы запрос и указать url проверяемой страницы.

В заключение . Целью этой публикации было убрать ответить на ваш запрос - «релевантность что это простыми словами». Надеюсь я смог донести до вас суть понятия релевантности, это удовлетворение посетителя предоставляемой информацией, полнота и равноценность поисковому запросу.

Смешное видео для отдыха. Не всегда же только учиться.

Приветствую всех! Изучая все тонкости оптимизации и продвижения Вордпресс-блога, мы с вами уже неоднократно сталкивались с понятием релевантности сайта. Этот критерий – один из основополагающих в ранжировании веб-ресурса поисковиками. Их формулы вычисления данного параметра с каждым годом становятся все сложнее. Постоянно растет количество факторов, которые влияют на степень релевантности. Поскольку данный критерий столь важен для успешного развития любого блога, давайте подробно рассмотрим, что же такое релевантность страницы сайта, как ее определить и повысить.

Релевантность сайта – это степень соответствия результата выдачи (т.е. в нашем случае — блога) введенному пользователем запросу. Релевантная страница должна четко отвечать на вопрос, заданный пользователем. Становится понятно, почему поисковики проводят тщательный анализ релевантности страниц сайта: от этого параметра непосредственно зависит популярность и прибыль той или иной поисковой системы. Ведь если информация документа, предлагаемого Гуглом или Яндексом в ответ на запрос, не будет адекватна ему, посетитель может больше не обратиться к данному ресурсу. Как следствие получаем: чем выше степень релевантности сайта, тем он выше в рейтинге поисковой выдачи. Естественно, при условном равенстве других параметров среди конкурентов.

Вот простой пример. Мы хотим найти в интернете информацию о том, как правильно писать статьи для блога. И вбиваем в строку поиска – . Если поисковик выдает нам варианты публикаций, где описаны основные правила составления семантического ядра и написания оптимизированных текстов, такие результаты можно считать релевантными. Если поисковая система показывает в ответ некую компанию, которая предлагает комплекс услуг по продвижению, то такой сайт нельзя считать релевантным нашему запросу.

Мы уже знаем, что каждая отдельная страница сайта продвигается по определенным «ключам». (Если вы только начинаете раскрутку своего веб-ресурса, рекомендую к прочтению статью ). Отсюда вытекает понятие релевантности страницы сайта. Что имеется ввиду? Зачастую блог содержит несколько страниц, которые будут в той или иной мере отвечать запросу пользователя. Перед поисковой системой возникает задача – выбрать ту из них, которая соответствует искомому в наибольшей степени. И мы подошли к самому интересному: каким образом поисковик определяет релевантность страницы?

Разные поисковые системы, будь то Яндекс, или Google, имеют свою схему расчета релевантности. В результате его проведения каждая страница получает рейтинг. Чем он выше, тем больше степень соответствия запросу. Но существует ряд факторов, которые однозначно влияют на данный показатель. Их можно определить как внутренние и внешние, плюс уровень траста сайта.

Внутренние факторы релевантности страницы:

  1. Оптимизированный заголовок. Разместите в мета-теге «title» прямое вхождение ключевого слова. Это значительно увеличит вес страницы. Желательно, чтобы этот заголовок отличался от «h1». Для формирования мета-тегов в WordPress вы можете воспользоваться плагином .
  2. Правильное использование ключевых слов в тексте. По сути речь идет о грамотно написанном тексте с точки зрения seo. Сначала сделайте сам . Подойдите к этому вопросу очень серьёзно, поскольку роль семантического ядра для анализа релевантности текста страницы сложно переоценить. Употребите «ключи» в заголовках уровня «h2» — «h6». Таким образом вы сделаете на них акцент. Соблюдайте вложенность. Распределите ключевые фразы равномерно в теле статьи, но так, чтобы использовать их уже в самом начале текста. Поисковые роботы сканируют контент сверху вниз, поэтому будет лучше, если они сразу будут находить соответствие запросу. Общее количество ключевых слов не должно превышать 4-5% от всего текста. При этом слова с низкими показателями имеет смысл использовать 1-2 раза, а высокочастотные «ключи» чаще. Не разбивайте одну ключевую фразу на несколько предложений. Употребляйте синонимы, соответствующие тематике статьи. Для поисковых роботов это будет значить, что содержание страницы на самом деле соответствует ее названию, а то есть и запросу. Больше информации вы можете узнать из материала .
  3. Внутренняя перелинковка. Если на страницу, для которой осуществляется проверка релевантности, ссылаются другие страницы того же сайта, это тоже увеличивает ее вес. Постарайтесь составить , т. е. таким образом, чтобы они представляли собой ключевые слова.
  4. Оптимизированный адрес. Считается плохим тоном, если URL содержит непонятный набор символов и цифр. Желательно, чтобы адрес статьи совпадал с ее названием. Как этого достичь, вы можете узнать в статье о .
  5. Правильный сниппет. Сниппет - это текст, извлекаемый из материала страницы и показываемый в поисковой выдаче. Google формирует его из содержимого мета-тега «description», поэтому следует указать в нем ключевые слова, но так, чтобы размер текста не превысил 160 символов. Яндекс же сам выбирает какой-то участок статьи, содержащий «ключ» и отображает его на странице результатов поиска. Чтобы понять, в чем важность описания сайта и как оно может повысить релевантность страницы, прочтите, .

Ко внешним факторам оценки релевантности страницы относят ее ссылочную популярность, или цитируемость. Чем больше внешних веб-ресурсов ссылается на данную страницу, тем выше ее рейтинг. К формированию анкоров в этом случае применяются те же принципы, что и у внутренних ссылок. Также играет роль и околоанкорный контент ссылающегося источника. Если он соответствует теме целевой страницы, это повысит ее релевантность.

Авторитет блога, или траст – это показатель доверия поисковых систем по отношению к сайту в целом, вне зависимости от конкретного запроса. Этот показатель основывается на большом количестве параметров, начиная со скорости загрузки ресурса и заканчивая его дизайном. Поскольку этот фактор тоже влияет на релевантность блога, имеет смысл проверить его TrustRank и, в случае необходимости, .

Теперь ответ на вопрос, как повысить релевантность страницы поисковым запросам, становится очевидным. Внимательно изучите все вышеописанные параметры, которые учитываются поисковыми системами для оценивания, и работайте над их улучшением. Если вы будете следовать всем инструкциям и заботиться о высоком качестве контента вашего блога, результат не заставит себя ждать.

Как проверить релевантность страницы: основные способы.

Перед тем как приступить к каким-либо активным действиям по оптимизации контента, следует провести проверку и анализ релевантности страницы. Стоит заметить, что однозначного ответа, какие же показатели по тем или иным параметрам считаются объективно оптимальными, не существует. Алгоритмы вычислений Гугла и Яндекса держатся в тайне и постоянно меняются. Помимо этого, по отношению к различным тематикам и направлениям применяются разные системы оценивания релевантности. Рекомендуется проинспектировать сайты конкурентов, находящиеся на текущий момент в топе поисковой выдачи, и ориентироваться в процессе оптимизации на них.

Для определения релевантности страниц блога мы воспользуемся популярным онлайн-сервисом Megaindex (megaindex.ru ) Он предоставляет услуги по автоматическому продвижению сайтов и имеет в своем распоряжении большое количество инструментов для аудита интернет-ресурса. Для начала необходимо пройти несложную регистрацию. После этого переходим во вкладку «SEO сервисы» и в выпадающем списке выбираем пункт меню «Анализ релевантности».

В новом окне в соответствующие поля мы вбиваем запрос, по которому продвигается целевая страница, и ее адрес. Жмем «Проверить».

В результате проверки релевантности страницы запросу программа сформирует отчет, где будут указаны: общий процент соответствия, количество точных вхождений запроса в мета-тегах, число слов всего и в отдельных элементах. Показатели, на основании которых проводился анализ, также описаны и разделены на группы по важности. Если критерий соблюден, он отмечен зеленой галочкой. В противном случае напротив него будет расположена кнопка «Как исправить». Нажав на неё, вы получите рекомендации по оптимизации того или иного параметра.

PR- CY (pr-cy.ru/audit/ ) – еще один бесплатный онлайн-инструмент, который обещает нам подробный аудит страницы. Имеет схожий с «Мегаиндексом» интерфейс и список обрабатываемых данных. Не требует регистрации. Перейдя по ссылке, действуем аналогично: указываем «ключ», адрес инспектируемой страницы и нажимаем кнопку «Аудит сайта». В этой программе, если мы хотим получить рекомендации по улучшению какого-либо параметра, необходимо кликнуть прямо по нему.

Сервис Majento (majento.ru ) также предлагает нам проверить релевантность сайта. На его страницах сразу указаны основные критерии, по которым он определяет ресурс как «готовый» к продвижению.

Следует заметить, что одна и та же страница по одинаковому запросу может иметь разную оценку во всех этих программах. Поэтому устраняйте недочеты, анализируйте показатели конкурентов, а главное – наполняйте свой блог контентом, максимально полезным для пользователей.

В более общем смысле, одно из наиболее близких понятию качества «релевантности» - «адекватность» , то есть не только оценка степени соответствия, но и степени практической применимости результата, а также степени социальной применимости варианта решения задачи.

Виды релевантности

Соответствие документа информационному запросу, определяемое неформальным путем.

Формальная релевантность

Соответствие, определяемое путем сравнения образа поискового запроса с поисковым образом документа по определенному алгоритму.

Одним из методов для оценки релевантности является TF-IDF -метод. Его смысл сводится к тому, что чем больше локальная частота термина (запроса) в документе (TF) и больше «редкость» (то есть чем реже он встречается в других документах) термина в коллекции (IDF), тем выше вес данного документа по отношению к термину - то есть документ будет выдаваться раньше в результатах поиска по данному термину. Автором метода является Gerard Salton (в дальнейшем доработан Karen Sparck Jones).

Пертинентность

Примечания

См. также

  • Ранжирование

Литература

  • Капустин В. А. Основы поиска информации в Интернете . Методическое пособие. - СПб.: Институт «Открытое общество». Санкт-Петербургское отделение, 1998. - 13 с (см. стр. 5 - о пертинентности)
  • Пертинентность // Краткий словарь терминов и обозначений

Wikimedia Foundation . 2010 .

Синонимы :

Смотреть что такое "Релевантность" в других словарях:

    В широком смысле мера соответствия получаемого результата желаемому результату. Релевантность в поисковых системах мера соответствия результатов поиска задаче поставленной в запросе. Различают содержательную и формальную релевантности. По… … Финансовый словарь

    релевантность - релевантный Соответствие полученной информации информационному запросу. [ГОСТ 7.73 96] релевантность степень соответствия документа запросу Слово релевантность означает соответствие между желаемой и действительно получаемой информацией. Согласно… … Справочник технического переводчика

    Уместность Словарь русских синонимов. релевантность сущ., кол во синонимов: 3 адекватность (18) … Словарь синонимов

    - (от relevant зависящий от ч. л., к. л.) англ. revalency; нем. Relevanz. Смысловое соответствие между информационным запросом и полученным сообщением. Antinazi. Энциклопедия социологии, 2009 … Энциклопедия социологии

    В широком смысле мера соответствия получаемого результата желаемому результату. в поисковых системах мера соответствия результатов поиска задаче поставленной в запросе. Различают содержательную и формальную релевантности. Словарь бизнес терминов … Словарь бизнес-терминов

    Релевантность - 34. Релевантность D. Relevanz E. Relevance F. Pertinence Соответствие содержания документа информационному запросу Источник … Словарь-справочник терминов нормативно-технической документации

    релевантность - Rus: релевантность Eng: relevance Fra: adequation Соответствие полученной информации информационному запросу. ГОСТ 7.73 … Словарь по информации, библиотечному и издательскому делу

    I ж. отвлеч. сущ. по прил. релевантный I II ж. отвлеч. сущ. по прил. релевантный II Толковый словарь Ефремовой. Т. Ф. Ефремова. 2000 … Современный толковый словарь русского языка Ефремовой

    - (англ. relevant уместный, относящийся к делу) смысловое соответствие между информационным запросом и полученным сообщением. Новый словарь иностранных слов. by EdwART, 2009 … Словарь иностранных слов русского языка

    релевантность - релев антность, и … Русский орфографический словарь

Книги

  • Проблемы психологической безопасности , Журавлев Анатолий Лактионович, Кольцова Вера Александровна, Тарабрина Надежда Владимировна, Юревич Андрей Владиславович. В настоящем сборнике представлены работы научных сотрудников Института психологии РАН, тематика которых в большой степени связана с исследованиями в проблемном поле новой для отечественной…
  • Ноомахия. Войны ума. По ту сторону Запада: Китай, Япония, Африка, Океания , Дугин Александр Гельевич. В книге рассматриваются неиндоевропейские цивилизации - китайская, японская, африканская и тихоокеанская. Автор выявляет в каждой из них наиболее очевидные, с ноологической точки зрения,…

Индекс поисковых систем и релевантность выдачи

Очень часто при разговоре о продвижении сайтов в ПС употребляют такие термины, как релевантность поиска и индекс поисковой системы . Что это такое?

Понятие релевантности

Буквально, «релевантность» переводится как соответствие чему-либо . В она означает

  • во-первых, соответствие поисковой выдачи (SERP’а) запросу пользователя,
  • а во-вторых — соответствие страницы сайта данному запросу.

Логично, что чем выше релевантность в обоих случаях, тем лучше конечному пользователю: он получает ответ, максимально соответствующий .

Вообще, релевантность является основополагающим фактором успешности как для поисковых систем , так и для seo-оптимизаторов .

  • Для первых важна максимальная релевантность выдачи (т.е. верное ранжирование упорядочивание сайтов в соответствии с их релевантностью по данному запросу ) — иначе пользователи не будут получать должного ответа на свой вопрос и обратятся к другой ПС.
  • Для вторых — максимальная релевантность продвигаемой страницы по конкретному запросу для получения максимально .

Тут стоит добавить, что и для ПС и для оптимизаторов одновременно важны оба «ответвления» данного понятия — поисковикам нужно, чтобы страницы сайтов в их выдаче были релевантны запросу, а оптимизаторам — чтобы выдача была релевантной.

Суть здесь в том, что оптимизаторы зависят от правильного осмысления поисковиком релевантности по данному запросу (чёткости работы алгоритмов ПС) точно так же, как сами ПС зависят от этого. В противном случае и те, и другие будут терять трафик.

Индекс поисковой системы

В Интернете часто можно услышать «Гугл быстро проиндексировал мой сайт» или «Яндекс выкинул из индекса» и т.п. Что за индекс (англ. «index») такой?

Легче всего можно это понять, если провести аналогию с реальной жизнью. Например, с книгами, а именно с алфавитным указателем. В нём содержатся часто употребляемые слова и номера страниц, на которых они встречаются. В голову почему-то пришла сказка о репке, пусть она будет простейшим примером поискового индекса.

Итак, допустим в книге с данной сказкой всего 5 страниц. В алфавитном указателе написано, что слово «репка» встречается на 1, 2, 3, 4 и 5-й страницах:

  • «репка»: 1,2,3,4,5

слово «кошка» на 4 и 5-й:

  • «кошка»: 4,5

а слово «позвала» на 2,3,4,5 страницах:

  • «позвала»: 2,3,4,5

Пользователь вводит в поиск слово «репка» — ему выдаются 1,2,3,4,5-я страницы и упорядочиваются по мере убывания релевантности (наиболее релевантная — по мнению ПС — сверху).

Теперь он ищет по фразе «позвала кошка». В индексе такой фразы нет, но есть слова «кошка» и «позвала», причём одновременно они встречаются на 4 и 5-й страницах. Обе эти страницы будут соответствовать запросу, причём одна из них будет релевантнее.

Аналогом книги в Интернете является, собственно, сам . Т.е. поисковик хранит в себе практически все тексты с проиндексированных сайтов (предварительно очистив их от html-тегов). Страшно представить, сколько жёстких дисков требуется поисковикам.. (без , наверное, не обходится).

Таким образом, индекс поисковой системы — это упорядоченный набор текстовой информации. Причём упорядочен он может быть по тысячам параметров (чем сильнее развиваются ПС, тем их больше), большинство из которых никому, кроме разработчиков алгоритма, не известны. Среди этих параметров:

Чем грамотнее составлен индекс и выше релевантность поиска — тем лучше и пользователям, и оптимизаторам.

Похожие статьи