ИТМ. Информационные технологии для менеджмента

ИТ для руководителя, управления, бизнеса

  • NEW!

    Покупайте каталог через редакцию!
  • журнал ИТМ 7-8/2013

    журнал ИТМ 7-8/2013

  • Введите email

  • Партнеры

  • Реклама

Поиск информации

Posted by it4m на 21.03.2010

Учет морфологии

В русском языке слова могут иметь разные формы (падежи, единственное и множественное число и т.д.) В какой бы форме ни стояло слово в тексте страницы (даже отличной от формы слова в запросе), Яндекс найдет его. Например, если задан запрос [идти], то в результате поиска будут найдены документы, содержащие слова «идти», «идет», «шел», «шла» и т.д. На запрос [окно] будет выдана информация, содержащая и слово «окон», а на запрос [отзывали] — документы, содержащие слово «отозвали».

При выборе форм слова для поиска Яндекс различает части речи. Например, если задан запрос [компьютер] (существительное), то будут найдены страницы со словами «компьютера» или «компьютерами», но не «компьютерный» (прилагательное).

Отключение морфологии

Нормальной формой слова считается именительный падеж единственное число. Так, с точки зрения Яндекса, «кот», «коты», «кота» и т.д. — формы одного и того же слова, среди которых нормальной является форма «кот». Если нужна именно такая форма, которая введена в строке запроса, то для поиска точной формы возьмите нужное слово в кавычки («») или поставьте перед ним восклицательный знак (!).

Выбор формы морфологии

В русском языке некоторые формы разных слов совпадают. Если необходимо, чтобы по запросу [день] находились только формы существительного «день» («день», «дня», «дню» и т. д.), но не глагола «деть» («деньте», «денешь», «денут» и т.д.), а по запросу [Иванов] только формы фамилии «Иванов» («Иванов», «Ивановым», «Ивановы» и т. д.), но не имени «Иван» («Иван», «Ивану», «Иванам» и т.д.), тогда для поиска только формы искомого слова укажите перед словом два восклицательных знака. Например, [!!день] или [!!Иванов].

Правильный запрос

Правильный запрос в Яндексе состоит из нескольких слов, потому что по одному слову обычно трудно понять, что вы хотите найти. Например, запрос [дизайн] может означать желание найти информацию о дизайне интерьера, или о веб-дизайне, а может — о ландшафтном дизайне. По запросу [дизайн] Яндекс найдет страницы обо всех известных ему видах дизайна. На момент написания статьи таких страниц оказалось 328 млн., а [«веб-дизайн»] – 37 млн. Это значит, что в первом случае нерелевантными оказались 291 млн. страниц – это информационный шум, мусор. Но и 37 млн. страниц – это слишком много. В запросе необходимо уточнить, какие конкретно аспекты веб-дизайна вас интересует. Вот почему важно составлять правильные запросы, состоящие из нескольких ключевых по смыслу слов.

Точное соответствие (поиск цитаты)

Если вы хотите найти точную цитату, просто задайте искомую фразу в кавычках: [«быть или не быть»]. По такому запросу будут найдены все страницы, в которых есть нужная вам цитата. В русском языке нормальными считаются кавычки такой формы – («»), но точное соответствие работает и при использовании кавычек типа – (‘’) и (“”).

Реклама

Страниц: 1 2 3

Sorry, the comment form is closed at this time.