Почему Google не показывает по поиску: много сайтов с полезной информацией?[...]Идеологическая основа Autonomy IDOL — это Meaning-Based Computing, что можно перевести как «компьютерные системы, основанные на смысле»; в документах компании не используется понятие искусственного интеллекта, но на самом деле это именно он.
MBC наделяет машину способностью выделять смысл из любых текстов, независимо от формы их представления и форматов: 1) Поиск по ключевым cловам (Keyword Search), не предусматривающий вообще никакой связи между данными и содержащейся в них информацией, это просто посимвольное совпадение искомого слова со словом в тексте.
2) Усовершенствованный поиск по ключевым словам (Keyword Search+), учитывающий простейшие закономерности (частоту повторений слов и т. п.).
3) Ссылочное ранжирование (PageRank), основанное на частоте обращений к тому или иному документу. Этот механизм, предложенный Ларри Пейджем и Сергеем Брином, эффективен в Интернете, однако в корпоративных хранилищах число обращений может не быть репрезентативным, а редко используемые понятия могут иметь большое значение.
4) Федеративный поиск (Federated Search), обладающий одним существенным недостатком, — в нем сложно поддерживать актуальные репозитории.
5) Концептуальный поиск (Conceptual Search). Существует несколько разных подходов к созданию поисковых систем, учитывающих контекст, чаще всего в них используются те или иные эвристические алгоритмы, соответствующие определенной прикладной области (например, в ответ на запрос по слову «собака» выдаются еще и их породы).
6) Безопасный поиск (Secure Search) — это почти то же самое, что поиск, учитывающий контекст, к которому добавлены средства ограничения доступа.
7) Юридический поиск (Legal Search). В юридической практике приходится иметь дело с таким большим корпусом документов, что созданы специальные поисковые машины, ориентированные на юридический контекст.
Мультимедийный поиск (Audio and Video Search), сочетающий собственно поиск с распознаванием образов.
9) Categorize, Alert, Profile. Первым шагом к осмысленной работе с данными служат классификация и разделение по категориям данных, сообщение пользователям об изменениях в данных и формирование пользовательских профилей, позволяющих лучше адаптироваться к запросам определенных пользователей.
10) Clustering, Scene Detection, Speaker Identification, Sentiment Analysis. На этом уровне осуществляется полноценная кластеризация данных, обнаружение сюжетов, идентификация говорящих, автоматическое оценивание какого-либо объекта в текстовых сообщениях и другие приемы, приближающие поиск к Data Mining.
MBC объединяет все перечисленные подходы.