(Симонович С.В., Мураховский В.И. Интернет у Вас дома: Полное руководство начинающего пользователя)
Прежде чем приступать к описанию языка запросов системы Яндекс, отметим, что он заметно мощнее и ложнее языков запросов других отечественных поисковых систем. Впрочем, не надо пугаться. Даже если вы очень не любите читать и, тем более, изучать Инструкции, можете работать с системой интуитивно. Например, введите запрос обычными человеческими словами: Как приготовить пельмени?
В принципе, система Яндекс использует в работе эвристические алгоритмы, которые не совсем строги с математической точки зрения. В результате мы можем получить разные результаты, если будем искать документы со словами Буш Гор выборы и выборы Буш Гор. Зато благодаря этим алгоритмам интуитивный подход к созданию запросов (без чтения инструкций) дает очень Хороший результат, к тому же за очень краткое время.
Поиск по одному слову. Введите искомое слово в поле поиска и нажмите кнопку Найти. Слова разыскиваются с учетом всех возможных словоформ, что особенно важно для русского языка. Например, если введено слово снег, то будут найдены документы, в состав которых входят слова снега, снегов и т. п., снежный, заснеженный и т. п. Если же поиск словоформ не требуется, то его можно отменить с помощью восклицательного знака например !снегом.
Поиск по группе слов. Если слова разделены пробелом, то разыскиваются документы, в которых в одном предложении ветре я все введенные слова. Так, по запросу Буш Гор выборы система выдает документы с фразами типа ... Накануне выборов хакеры взломали сайты Буша и Гора. Среди результатов такого поиска возможны нестрогие соответствия — поисковая система проявляет свой интеллект. Чтобы строго обеспечить появление слов в предложении, надо перед ними поставить знак +, например так: +Буш +Гор +выборы. Знак + должен записываться слитно с тем словом, к которому относится (без пробела). Про т роль оператора И, который также можно ввести явно(символ &), например так: +Буш & +Гор & +выборы. Справа и слева от логического оператора должны быть пробелы.
Если же требуется одновременное присутствие слов не только в предложении, но и во всем документе, применяется оператор &&, например: +Буш &&+Гор &&+выборы.
Теперь рассмотрим приемы исключения слов из поиска. для этого применяются: знак - (строгое исключение из предложения), знак ~ (нестрогое исключение из предложения) и знак ~~ (исключение из всего документа). Так, например, запрос +Буш +Гор~~выборы позволит отобрать документы, в которых в одном предложении встречаются слова Буш и Гор, но во всем документе нет слова выборы и его производных (выбор, на выборах, после, выборов и т. п.).
В тех случаях, когда надо объединить ключевые слова с помощью оператора ИЛИ, используется символ | (вертикальная черта). Так, например, запрос Буш | Гор && +выборы отберет документы, в которых упоминается либо Джордж Буш , либо Альберт Гор, но обязательно встречается слово выборы.
Поиск с указанием расстояния. Давным-давно в поисковых системах появился оператор NEAR позволяющий находить документы, в которых два слова расположены близко друг к другу. Правда, что такое близко каждая система понимает по-разному. В поисковой системе Яндекс можно конкретно указать, на каком расстоянии друг от друга эти слова должны находиться.
Представьте себе, что в документе у каждого слова есть свой номер позиции. Номера позиций двух соседних слов различаются на единицу (номер позиции слова, находящегося справа, больше). Оператор расстояния записывается как /+n, где n — число, соответствующее расстоянию. Например, оператор /+1 соответствует двум словам, идущим подряд, то есть Microsoft/+1 Windows — это то же самое, что и “ Microsoft Windows”.
Оператор расстояния может иметь и отрицательное значение. Это означает, что второе слово, указанное в запросе, должно в документе располагаться раньше первого. Например запрос Microsoft/-5 Windows может дать ссылку на документ, содержащий фразу Об операционных системах, которые заменят Windows, рассказал ответственный представитель компании Microsoft.
При проведении поиска с указанием расстояния можно задавать не точное расстояние между словами, а диапазон, например /(—5 +5). В этом случае будут отобраны документы, в которых. слова, указанные в запросе в качестве ключевых, попадают в заданный диапазон. На самом деле, если знак параметра не указан, то это тоже поиск в диапазоне. Так, оператор /5 надо рассматривать на самом деле как диапазон /(-5+5). Запрос Буш/5 Гор разыщет предложения типа: Женщины симпатизировали Бушу, а мужчины — Гору или Гор Буша не слаще.
Система .Якдекс имеет довольно сложные правила языка запросов, но у нее обширные возможности. К примеру, расстояние можно измерять не только между словаки, но и между предложениями. Эта единица измерения используется, когда в запросе применен двойной знак && или ~~ Так, запрос Буш/ +1 &&. Гор выдаст документы, в которых слова Буш и Гор встречаются либо в одном предложении, либо в соседних.
Использование скобок. Задание на поиск — это, по сути дела, логическое выражение, которое работает как фильтр при просмотре документов, входящих в базу данных поисковой системы. В логическом выражении точно так же, как и в арифметическом, можно применять круглые скобки. Они служат для управления порядком действий. Характерный пример: Буш & (вы6оры ׀ голосование). Такой запрос вернет ссылки на
Web-страницы, содержащие предложения, в составе которых слова Буш, Гор, выборы или Буш, Гор, голосование.
Управление ранжированием. Цель ранжирования — сделать чтобы Web-страницы‚ наиболее оптимально соответствующие запросу, отображались в списке результатов как можно раньше. Какие алгоритмы при ранжировании применяет поисковая система, это ее дело. Мы либо довольны их работой, либо обращаемся к другой поисковой системе В системе Якдекс есть возможность самостоятельно изменить алгоритм механизма ранжирования с помощью весовых коэффициентов. Такой коэффициент можно присвоить любому ключевому слову или выражению, если оно заключено в скобки. Весовые коэффициенты вводятся через двоеточие, например Буш:5 Гор выборы. При таком запросе документы, в которых слово Буш встречается чаще, получают преимущество и отображаются в результирующем списке на более высоких позициях.
Еще один прием управления ранжированием связан с уточняющим словом. Это такое слово, которое не обязательно содержаться в отбираемых документах, но если оно там есть, то документ получает преимущество при ранжировании. Уточняющее слово вводится после знаков <—. Например, при поиске по ключевым словам Гор Буш <—младший выборы получат преимущество Web-страницы, в которых речь идет не просто о Джордже Буше, а о дДордже Буше-младшем.
Специальный поиск. Особняком стоят приемы поиска информации, содержащейся в специальных полях заголовков ‚ страниц (каждая Web-страницы имеет служебные поля в своем заголовке) или поиск специальных элементов, входящих в Web-страницы, например гиперссылок. В системе Яндекс команды специального поиска в полях заголовка начинаются с символа $, а команды поиска отдельных элементов Web-страниц — со знака Все средства специального поиска работают заметно медленнее по сравнению с обычными. Поэтому набе ритесь терпения.
|
Команда |
Описание |
Пример |
Пояснение |
|
$title (выражение)
|
Поиск ключевых слов, указанных в выражении выполняется только в заголовках Web-страниц |
$title (Космос) |
Разыскиваются только Web -страницы, в заголовках которых имеется слово Космос |
|
$аnсhог |
Поиск ключевых слов, указанных в выражении, выполняется только в якорях внутренних ссылок Wеb-страниц |
$аnсhог (вступление) |
Внутренние (выражение) гиперссылки (ссылки внутри документа) используют для создания внутренней структуры документа (аналог содержания). Эта команда разыщет 1еЬ-страницы, в которых имеется якорь «Вступление» |
|
#kеуwords =(выражение)
|
Поиск среди ключевых слов, заданных автором Wеb-страницы |
#kеуwords = (новости) |
Автор Wеb-страницы может сам задать ключевые слова, описывающиеего материал. При просмотре в броузере мы их не видим, но они учитываются поисковыми системами при индексации |
|
#abstract =(выражение)
|
Поиск в аннотации Wеb-страницы |
#abstract =(Буш ׀ Гор) |
Автор Wеb-страницы может дать ей краткую аннотацию, которая на экране не отображается, но учитывается поисковыми системами при индексации и представлении - |
|
#image “имя файла” |
Поиск файлов иллюстраций по их имени |
#image= “Bush.*” |
Если заранее неизвестно, какое расширение может иметь имя файла, при меня ют подстановочный символ <*», который замещает любое количество произвольных символов |
|
#hint= (выражение)
|
Поиск слов в альтернативном тексте иллюстраций |
#hint= (Буш ׀ Гор) |
Автор может связать с иллюстрацией текст называемый альтернативным. Он воспроизводится, если графика в броузере отключена или при наведении указателя мыши на рисунок. Считайте его подрисуночной подписью |
|
#url= “URL-адрес” |
Поиск сайта или Wеb-страницы |
#url= “www.anysite.ru” |
Обычно используется для локализации поиска. Например, чтобы ограничить круг поиска одним сайтом или, наоборот, исключить его из области поиска |
|
#link= ”адрес” |
Поиск Wеb-страниц, содержащих “ гиперссылки на заданный URL-адрес сайта или ‚ЧеЬ-страницы |
#link= “www.musite.ru” |
Обычно используется “URL-адрес” для выявления Wеb-страниц , на которых имеются гиперссылки, ведущие к собственной странице |