Технологии
SoftInform Search Technology – это быстрый и точный поиск похожих по содержанию документов в любых объемах данных, возможность исключить дублирование информации, интеграция в любые прикладные системы, а также возможность разработки широкого спектра приложений как для локальных внутрикорпоративных сетей, так и для глобальных интернет-решений.
Технология работает с распространенными форматами текстовых файлов (txt, doc, rtf, pdf, htm, html), а также поддерживает подключение баз данных из большинства распространенных информационных систем (Access, MS SQL, Oracle, а также любых СУБД, поддерживающих SQL).
SoftInform Search Technology основана на уникальной математической модели анализа структуры документа и выбора похожих слов, словосочетаний и массивов текста. При поиске учитывается все множество слов, встречающихся в документе с задействованием всех словоформ и словаря синонимов.
Программные продукты
Программа полнотекстового поиска документов SearchInform - это программа для быстрого поиска документов среди больших объемов информации - среди документов любых форматов, а также в различных базах данных. Она совмещает в себе возможности фразового поиска с учетом морфологии и словаря синонимов и новой технологии поиска похожих документов SoftInform Search Technology. Программа предназначена для поиска информации в больших объемах данных и существенно повышает качество обработки информации и уменьшает время поиска документов. Скорость поиска документов примерно в три раза выше, чем у существующих систем. Для конкретизации поиска в SearchInform присутствует функция «важных слов», на которые программа будет обращать внимание в первую очередь, проводя дополнительный анализ похожести.
Основные возможности SearchInform
- Фразовый поиск с учетом морфологии и словаря синонимов
- Новая технология поиска похожих документов SoftInform Search Technology
- Высокая скорость индексирования (от 15 до 30 Гб/час),
- Размер индекса 15-25% от реального объема текстовой информации
- Поддержка более 50 распространенных текстовых форматов файлов, электронных сообщений Outlook и TheBat, тэгов mp3 и avi и логов программ мгновенного обмена сообщениями ICQ 99-2005 и Microsoft Messenger)
- Корректная работа с архивами
- Универсальные источники данных (индексирование полей СУБД и различных информационных систем)
|