« предыдущая статья | Все статьи | следующая »
интернет поиск
Чемпионат по настольному поиску (программы для локального поиска)
Звездочет-русофил
Бесплатный Copernic Desktop Search (www.copernic.com, 2,6 Мб), как будто угадав мои желания, первым делом предложил отметить нужные параметры и каталоги индексации. Разумеется, по умолчанию Коперник готов индексировать все подряд, но при двойном щелчке по нужной области мы вольны выбрать тот или иной тип файлов, либо вообще запретить софтине индексировать данный раздел: Skip all files in this folder and its subfolders. Увы, Коперник соглашается индексировать исключительно весь раздел, отказывая нам в выборе нужных каталогов. Что же, придется смириться. Итак, нам предлагают индексировать Documents, Pictures, Music и Videos. Эти категории подразумевают следующее: все форматы MS Office, документы WordPerfect, PDF-файлы, HTML-страницы, «сермяжные» текстовые расширения TXT и RTF вкупе с другими форматами (.ASP, .C, .CPP, .CS, .H, .INC, .INI, .JAVA, .PAS и .XML). Архивные форматы Коперник знает «на пять баллов»: .GZ, .RAR и .TAR. Добавьте сюда поддержку справочного формата HLP и тэгов в звуковых файлах MP3, OGG, WMA и WAV. Очевидно, дабы совсем сразить автора этих строк, Коперник скромно шепнул о работе с метаданными EXIF в графических файлах форматов JPEG и GIF. После таких возможностей известие об индексации тех же метаданных в видеофайлах (MPEG, QuickTime и Windows Media) воспринялось, как само собой разумеющееся.
Ко всему прочему, Коперник без малейшего труда самостоятельно «вычислил» расположение каталога с почтовыми базами Outlook Express, заодно предложив включить в область поиска контакты из адресной книги. Причем, этот «звездочет» знаком с почтовым клиентом Mozilla Thunderbird - видит Бог, мне это начинает нравиться[7]!
После установки начальных параметров я изменил расположение умолчального каталога с индексными базами (C:\Documents and Settings\ваше_имя\Local Settings\Application Data\Copernic\DesktopSearch) на более толковое (кнопка Options > Advanced > Index > Index folder), после чего Коперник с чувством глубокого удовлетворения занялся своим прямым делом. Правда, «звездочет» предупредил, что способен работать в абсолютной тишине, то бишь, при простое компьютера. Посему отключим всевозможные скринсейверы и дадим программе создать индексные базы.
Время индексации упоминавшегося логического раздела составило 22 минуты, причем, мы так и не смогли «уломать» Коперника исключить из области индексирования ненужные нам папки. Объем индексной базы – 137 Гб. Как видите, «Ищейка» несколько проигрывает зарубежному конкуренту в данном аспекте. Посмотрим, как софтина справится со своей основной работой – поиском файлов и документов. Обратите внимание, что для запроса вовсе не обязательно нажимать кнопку поиска – сей процесс начинается автоматически после ввода искомого текста. Впрочем, запрос можно ввести в программной панели, поселяющейся в системной Панели задач. Еще два небольших плюса в личный зачет.
Первое испытание – поиск по знакомому нам словосочетанию «Антивирусные записки» дает вполне логичный результат: документ найден. Но, как же так? Этот файл у меня наличествует в двух форматах: DOC и RTF. Почему не найден RTF-файл? При повторном запросе Коперник не нашел ни одного документа! Чудеса, да и только. На третьей попытке вновь был найден лишь DOC-файл. Все оказалось прозаично: Коперник таки успешно находил RTF-файлы, но исключительно с текстом, написанным латиницей. Более чем странная русофилия...
Уже без особой надежды ввожу в поле запроса те самые 300 знаков вступления к статье «Второе пришествие SPасителя» и…не может быть! – документ мгновенно найден. Вот уж чего не ожидал, так этого: абсолютно все слова запроса выделены цветом. С гораздо большим интересом прошу Коперника найти мне информацию по композиции «Желтая луна» из альбома Гребенщикова – как говорит нынешняя молодежь, «легко!», причем, западную софтину ничуть не смутили русскоязычные тэги этого MP3-файла. Однако, Коперник вновь выказал редкостное упрямство, отказываясь находить информацию в русскоязычных TXT-файлах и веб-страницах. Причем, поиск в PDF-документах давал отличные результаты. Возможно, мне больше повезет со следующим участником чемпионата.
SoftInform Search Technology ( интернет поиск ) в первую очередь корпоративный инструмент поиска информации в локальной сети предприятия (документов практически любых форматов), информационных системах, СУБД, CRM и так далее. Важным преимуществом данной разработки является консолидация под своим управлением информации из различных источников. В SoftInform Search Technology (интернет поиск) реализована система рубрикации (удобный и быстрый инструмент распределения любых документов по заданной тематике) и автокатегоризации документов – автоматического распределения новых документов по существующим рубрикам в соответствии с общим принципом похожести. Такой подход к организации и консолидации данных позволяет структурировать информационные составляющие любого крупного предприятия под управлением одной программы. Притом, без нужды переводить документы и данные в какой-либо единый формат. Вся информация, доступная для индексирования и дальнейшего поиска может быть распределена, структурирована и отображена в удобном виде.
« предыдущая статья | Все статьи | следующая »
Одной из важнейших задач, которую приходится решать компаниям на сегодняшний день, является быстрый поиск документов в больших объемах данных. Организация доступа к данным напрямую зависит от технологий и программ, обеспечивающих скорость и качество обработки информации. На данный момент существует много и технологий, осуществляющих фразовый поиск (Google, Hummingbird, Verity и другие), но они в отличие от технологии СофтИнформ интернет поиск не решают проблему поиска информации в полной мере.
9 января 2007 года.
Компанией «СофтИнформ» выпущена новая версия программы SearchInform, корпоративной системы, предназначенной для полнотекстового поиска и поиска похожих по содержанию документов в больших объёмах данных.
В новой версии программы, изменения затронули функционал, была улучшена работа с индексами, подключаемыми по сети, что сделало работу программы в локальной сети еще надёжнее.
Подробнее...
»
13 декабря 2006 года.
Компания «СофтИнформ» выпустила новую версию программы SearchInform 3.2.01, корпоративной системы, предназначенной для полнотекстового поиска и поиска похожих по содержанию документов.
Softkey.info
Подробнее...
» Вся пресса интернет поиск
|