Корректная работа с локальной сетью Информационная безопасность Поиск похожих документов Скорость индексации Разграничение прав доступа
 
 Домой   Заказать/Скачать   Продукты   Проекты   Наши Технологии   Сотрудничество   Пресса   О Компании   English 
SoftInform Search Technology - это Ваша власть над информацией.

Содержание

Скачать демо-ролик
Скачать презентацию
stretcher

1. Технология поиска SoftInform Search Technology

1.1 Проблемы поиска информации

Одной из важнейших задач, которую приходится решать компаниям на сегодняшний день, является быстрый поиск документов в больших объемах данных. Организация доступа к данным напрямую зависит от технологий и программ, обеспечивающих скорость и качество обработки информации. На данный момент существует много и технологий, осуществляющих фразовый поиск (Google, Hummingbird, Verity и другие), но они в отличие от технологии СофтИнформ не решают проблему поиска информации в полной мере.

Так, например, в базе из нескольких десятков тысяч документов нам нужно найти какую-либо информацию. Используя фразовый поиск, и даже идеально подбирая ключевые слова и фразы, добиться быстрого и адекватного результата практически не возможно. Чтобы получить какой-либо приемлемый результат нам придется просматривать документ за документом, выбирая новые ключевые слова и тратя время на изучение ненужной нам информации. Но гораздо проще было бы, найдя хоть один более-менее удовлетворяющий нас по тематике текст, нажать кнопку поиска похожих на него документов…

1.2 SoftInform Search Technology. Поиск похожих документов

SoftInform Search Technology – технология поиска и обработки информации, содержащейся в текстовых файлах на компьютере пользователя и в локальной сети предприятия, базах данных и информационных системах. Она включает в себя все инструменты, необходимые для структуризации разрозненной информации в рамках предприятия и предоставляет собой эффективное решение любых проблем поиска и консолидации информации.

Основными преимуществом и отличием SoftInform Search Technology от существующих аналогичных технологий и систем поиска является запатентованная компанией СофтИнформ функция поиска документов, похожих по содержанию на текст запроса.

При поиске похожих по содержанию документов задействовано все множество слов встречающихся в документе с учетом всех словоформ и словаря синонимов. После обработки запроса в результирующем списке (с указанием процесса релевантности) выводятся документы максимально похожие на заданный фрагмент текста. 100% совпадения – найден документ-дубль. Документ же с меньшим процентом совпадения, соответственно, похож по содержанию на текст запроса. Следует отметить, что технология достаточно интеллектуальна для того, чтобы с высокой степенью точности определять релевантность искомого документа по отношению к запросу, не зависимо от изменений (удаление части текста, замена), внесенных в используемый в запросе текст.

1.3 Основные возможности SoftInform Search Technology

На данный момент ПО на основе SoftInform Search Technology является наиболее функциональным и быстрым по сравнению с различного рода аналогичными технологиями и разработками.

Высокая скорость индексирования информации. Оптимизация процесса индексации и структуры создания индекса позволили увеличить скорость индексации данных до 30 Гб в час даже на не очень производительных офисных компьютерах.

  1. Размер создаваемого индекса 20-25% от размера чистой текстовой информации
  2. Поддержка более 50 распространенных форматов файлов (включая архивы, PDF, MHT, CHM, MDB и т.д.). Количество поддерживаемых форматов обновляется в каждой новой версии ПО на базе технологии SoftInform Search Technology
  3. Индексирование и поиск информации в электронных сообщениях MS Outlook, Outlook Express и TheBat!, а также в логах программ мгновенного обмена сообщениями ICQ 99-2005 и MS Messenger)
  4. Возможность консолидации информации на предприятии из различных источников (поиск и обработка информации из различных баз данных, информационных систем и так далее)
  5. Разграничение прав доступа пользователей (NTFS аутентификация прав доступа)
  6. Соблюдение информационной безопасности на предприятии
  7. Языконезависимость. Технология не зависит от языка, все языковые компоненты могут присоединяться как плагины

Организация ядра технологии позволяет адаптировать SoftInform Search Technology (при внесении минимальных корректировок) под любую базу данных или информационную систему, благодаря концепции источников данных. Причем, источники данных, доступные для индексации нашей программой могут быть различны и могут находиться в разных местах.

1.4 Масштабируемость технологий

На сегодняшний день поддерживается масштабируемость, причем сразу по нескольким направлениям Можно масштабировать как для увеличения скорости отработки запросов, так и для увеличения объема индексируемых данных. Проведенные тесты показали, что  использование 10 компьютеров вместо одного увеличивает скорость реакции системы примерно в 6 раз.

1.5 Круг потенциальных клиентов для применения технологий SearchInform

Поисковые технологии являются ядром на базе которого реализуются крупные заказные проекты информационной направленности и позволяют решать достаточно актуальные задачи корпоративных клиентов, которые на сегодня не могут решить наши конкуренты.

Фактически любая компания где более 20 компьютеров и идет активная работа с текстовой информаций (неважно что это система документооборота, нужные для аналитики документы на диске и т.д.) потенциальный клиент.

Еще более критично внедрение информационной системы на базе технологии SearchInform для крупных клиентов. Это позволит им без замены  всех существующих у них систем на новую единую систему - консолидировать информацию для поиска. То есть SearchInform успешно устанавливается на уже существующие системы и упорядочивает работу с информацией.