Релевантность
О понятии релевантности и новом поисковом фильтре от Google
Релевантность представляет собой одно из понятий, используемых для описания работы роботов поисковых машин. Системы машинного поиска стараются предоставить пользователям выборку страниц, релевантную словам, вводимым в поисковую форму. Существует ряд способов дать определение релевантности.
Что такое релевантность?
Релевантность – способ нахождения документов, которые содержат слова кем-либо искомые, или же документов, которые имеют отношение к тематике поискового запроса. Определена релевантность может быть из рассмотрения отношения пользователей и терминов, применяемых при поиске. При этом может приниматься во внимание история поиска и просмотров, которая была произведена другими людьми имеющими схожие интересы. Такое определение дает преподаватель Рутгерского университета Тефко Сарачевич, который занимался изучением понятия релевантности в течение многих лет.
Также релевантность может быть определена посредством проблемы и задачи, которые встречают пользователя при выполнении поиска.
Определение релевантности поисковыми системами
Поисковые системы также исследуют эти концепции для определения релевантности. В недавнем патенте, который был выдан компании Google, дается очередное определение способу поиска информационных страниц.
Способ определения релевантности, который описан в этом патенте, помимо использования термина поискового запроса также используется понятие "ярлык", которое совпадает с понятием "аннотация".
К примеру, если кто-то ищет информацию о сотовых телефонах и хочет найти новинки, не перебирая все возможные низкочастотные запросы. В форму на странице поисковой машины может быть введен такой текст:
Сотовые телефоны label:Новинки
В качестве результатов поиска будут представлены страницы, которые релевантные термину «сотовые телефоны», а среди них как более релевантные, в свою очередь, будут отмечены страницы с ярлыком «новинки».
В случае, когда пользователи добавляют к поисковому запросу больше информации, например упомянутые выше ярлыки, поисковые машины могли бы находить более релевантные результаты.
Каким образом создаются ярлыки и аннотации в алгоритме поисковой машины?
Если сайт посвящен продаже сотовых телефоны, он может иметь теги и категории для опубликованных статей. К примеру, статьи могут иметь теги «новинки», «обзоры». А сайт посвященный кино может иметь теги «актеры», «рецензии». Аннотации также могут быть определены из комментариев на страницах.
Такие теги могут быть полезными, однако среди результатов поиска в поисковых машинах Google, Yahoo или Bing, аннотаций вы не увидите.
Поисковые машины не захватывают такую информацию, как теги. Более того многие страницы попросту не обладают подобными аннотациями, хотя и могут содержать полезную информацию.
Поисковые машины могут определять аннотации и другими способами, например, рассматривая информацию о паттернах в адресе страницы. К примеру, если страница сайта имеет адрес «www.site.ru/news/», ей может быть присвоен ярлык «новости». Такие алгоритмы уже давно используются в работе над поисковым продвижением сайта.
Патент Google:
Фильтрование результатов поиска с использованием аннотаций
Изобретатели: Patrick F. Riley, Ramanathan Guha
Принадлежит Google
US Patent 7,668,812
Утверждено 23 февраля 2010 года
Подано на рассмотрение 9 мая 2006 года
Аннотация:
Поисковая система принимает запросы, которые включают термины и ярлыки. Данные ярлыки и термины могут быть применимым к определенным документам. Результаты поиска проходят через фильтр домена, оставляющем среди результатов домены определенные ярлыками в поисковом запросе. Результаты поиска прошедшие через фильтр обрабатываются так, чтобы обеспечить принадлежность определенных результатов доменам, которые включены в фильтр. Далее результаты обрабатываются таким образом, чтобы они включали ярлыки запросов с определенными результатами.
Заключение
Идея добавить «ярлыки» в поиске определенно вызывает интерес, однако не известно, сколько пользователей будет использовать такую возможность. Возможность использовать ярлыки может существенно облегчить поиск в конкретных ситуациях, повысит релевантность страниц в выдаче. Google уже предоставляет возможность использования ярлыков при пользовательском поиске.
| Tweet |


