ИТМ. Информационные технологии для менеджмента

ИТ для руководителя, управления, бизнеса

  • NEW!

    Покупайте каталог через редакцию!
  • журнал ИТМ 7-8/2013

    журнал ИТМ 7-8/2013

  • Введите email

  • Партнеры

  • Реклама

Поиск информации

Posted by it4m на 21.03.2010

Оператор точной формы (!) (поиск имени)

Слова с большой и маленькой буквы считаются разными формами одного слова, поэтому все равно, какой регистр использовать в запросе. Исключением является оператор точной формы. По запросу [!кошка] будут найдены все документы, содержащие эту словоформу в любом регистре, а по запросу [!Кошка] — только документы, в которых имеется форма «Кошка» с большой буквы. Это полезно, если искомое имя собственное совпадает с распространенным именем нарицательным, например, Кошка – это село.

Оператор «плюс» (+) (обязательная выдача слова)

Чтобы отобрать документы, где определенное слово присутствует обязательно (некоторые слова запроса, так называемые «стоп-слова» не учитываются Яндексом), поставьте перед ним плюс (без пробела). Поэтому, если вас интересует цитата «быть или не быть», вы можете задать запрос [+быть +или +не +быть].

В этом случае помимо фраз «быть или не быть», также будут выданы и другие результаты, например, «Быть или не быть, или что такое молитва?», «быть, или не быть» с запятой в внутри фразы и др.

Стоп-слова

В любом языке есть слова, которые встречаются намного чаще других. Слова, которые встречаются слишком часто, чтобы быть значимыми для поиска, называются стоп-словами. Как правило, это местоимения, предлоги и частицы. По классике, поисковые машины должны игнорировать стоп-слова, даже если они встречаются в тексте запроса. Из документации Яндекса следует, например, что в запросе [не работает компьютер] Яндекс игнорирует «не» и будет искать по запросу [работает компьютер], поскольку отрицательная частица «не» является стоп-словом, и по умолчанию она не ищется. Поэтому правильным будет запрос — [+не работает компьютер]. Однако Яндекс как-то обрабатывает стоп-слова бессистемно, иногда кажется, что он их учитывает в последовательности из трех-четырех (?) слов. Чтобы гарантированно включить стоп-слово, его лучше указать с оператором (+).

На занятии №2 в следующем выпуске ИТМ мы рассмотрим правила поиска с помощью формальной логики, а также операторы, управляющие поиском в «ширину и глубину» страниц сайтов.

Реклама

Страниц: 1 2 3

Sorry, the comment form is closed at this time.