Инструкция пользователя. 23




Скачать 346.91 Kb.
Название Инструкция пользователя. 23
страница 1/10
Дата публикации 22.09.2014
Размер 346.91 Kb.
Тип Инструкция
literature-edu.ru > Информатика > Инструкция
  1   2   3   4   5   6   7   8   9   10

Оглавление


5Обзорная часть. Обзор методов, алгоритмов систем информационного поиска. 2

5.1.Общий обзор систем информационного поиска. 2

5.2.Отличия от аналогов 4

5.3.Ожидаемые результаты 5

5.4.Используемые методы и алгоритмы. 6

5.5.Области применения разработки: 6

6Разработка методов информационного поиска на основе методов интеллектуального анализа данных. 8

6.1.Алгоритм PageRank 8

6.2.Наивный байесовский классификатор. 12

7Разработка информационного и программного обеспечения системы информационного поиска. 15

7.1.Общие сведения о разработанной информационной системе. 15

7.2.Подсистема поисковых агентов. 17

7.3.Подсистема сбора, анализа и хранения информации. 21

8Опытная эксплуатация и тестирование системы информационного поиска. 23

8.1.Инструкция пользователя. 23

8.2.Пример результатов работы поисковой системы по запросу Rammstein с учетом механизма PageRank 23

9Обоснование использования библиотеки Lucene в качестве основного поискового решения. 25

9.1.Общие сведения о библиотеке Lucene 25

9.2.Аналоги библиотеки Lucene. 25

9.3.Цели и преимущества использования Lucene. 26

9.4.Дочерние проекты Lucene. 27

9.5.Проекты и фирмы, использующие данное поисковое решение. 28

9.6.Схема работы. 29

9.7.Практическое использование Lucene. 32

9.8.Выводы. 34

10Разработка методов снижения утомляемости оператора многопрофильной системы информационного поиска. 36

10.1.Общие сведения. 36

10.2.Общая характеристика рабочего места оператора 37

10.3.Проблемы перегрузки зрения. Основные требования к освещению и цветовому оформлению помещений. 39

10.4.Нагрузка на костно-мышечный аппарат. Снижение физических нагрузок. 43

10.5.Требования к микроклимату и ненормированный уровень шумов. 44

10.6.Специфика факторов утомляемости оператора многопрофильной системы интеллектуального поиска 45

10.7.Выводы. 45

Исходный код программы. 47


5Обзорная часть. Обзор методов, алгоритмов систем информационного поиска.

5.1.Общий обзор систем информационного поиска.


Количество электронных документов сегодня увеличивается с нарастающими темпами. Этому способствует проникновение компьютерных и интернет-технологий в повседневную жизнь. Это стало мощнейшим стимулом развития информационного поиска. Сегодня в мире миллионы пользователей, огромные базы данных.

Веб-технологии открыли доступ к публикации информации миллионам пользователей. Люди делятся фотографиями, текстами, печатают мысли в блогах и социальных сетях, скачивают музыку, ищут приложения для мобильных устройств, пишут отзывы на форумах и покупают бытовую технику в сети. Соответственно именно благодаря работе с такими большими массивами данных сделали состояние такие корпорации, как Microsoft, Amazon, Google, Twitter, Facebook. Им приходится скачивать и просматривать терабайты и петабайты информации для ее анализа, категоризации и выдачи пользователю. Поэтому крупномасштабный массив информации, в котором ведется поиск, может содержать большое количество повторяющихся символов и неочевидных и скрытых смыслов. Интернет стал бесконечным хранилищем информации, поэтому традиционные хранилища не могут вместить всей необходимой информации и продолжать работать на таком же эффективном уровне. Из-за этого возникла необходимость упорядочить и систематизировать получаемую информацию, проводить ее анализ. Это было бы невозможно сделать без поисковых систем.

Работая со сложно структурированными данными, следует учитывать, что они характеризуются:

1) внутренней интерпретацией, которая позволяет компьютеру получать доступ к информации, характеризующей их содержание, модели организационных единиц с процедурами анализа запроса и поиска образуют базы данных;

2)наличием внутренней структуры связей (внутренняя иерархия, структура связей определяется взаимосвязями между слотами внутри фрейма);

3) наличием внешней структуры связей, которая определяет классифицирующие отношения быть элементом класса и содержать в себе элементы; содержит также ассоциативные отношения;

4) шкалированием (для фиксации соотношений отдельных информационных единиц используются метрические, оппозиционные шкалы);

5) погружением в пространство с семантической метрикой (семантическая близость понятий внутри кластера важна для построения когнитивных систем в памяти компьютера);

6) наличие активности: необходимо выделить предметную область, в которой работает компьютер, а для интерпретации законов и соотношений в этой области компьютером необходимы модели представления.

В связи с тенденцией интеграции локальных сетей с глобальными, с ростом объемов информации сетевых ресурсов и баз данных, существенно возросла важность проблемы релевантного поиска в источниках различного вида. Однако применяемые в существующих системах методы не позволяют достичь высокой полноты и точности поиска. Одной из причин является узкая специализация систем поиска, которые не позволяют решать широкий спектр задач поиска одновременно в нескольких информационных источниках, таких как ресурсы глобальных и локальных вычислительных сетей, базы данных, локальные документы на жестких дисках и т.д.

Целью данной работы является создание многопрофильной системы поиска на основе интеллектуальных методов анализа данных, которая может получать информацию из источников различного типа (Интернет, локальная база данных) и обеспечивать выборку необходимой пользователю информации. Система должна обеспечивать сбор, хранение, анализ и интерпретацию данных с учетом синтаксиса и семантики русского языка. Система может применяться для выдачи релевантных документов по неструктурированным запросам пользователей, формирования определенных предпочтений и «подстановку» необходимых документов под эти предпочтения. Дополнительную сложность решению задачи придает разнообразие электронных документов: юридические акты, учебники, неформальное общение пользователей, статьи, обзоры, рецензии и т.д. Несмотря на то, что многие источники информации содержат неструктурированные данные, каждый из них имеет скрытую структуру, подчиненную, как правило, законам и правилам того языка, на котором был написан документ, что позволяет, выделяя эту скрытую структуру, находить необходимую информацию и понимать общий смысл документа. Это возможно с применением элементов теории графов, средств математической статистики, линейной алгебры и теории вероятностей.
  1   2   3   4   5   6   7   8   9   10

Добавить документ в свой блог или на сайт

Похожие:

Инструкция пользователя. 23 icon Руководство пользователя 6 0 (05. 05. 2014)
Инструкция по заполнению уп для Начальной ступени образования по новому стандарту 234
Инструкция пользователя. 23 icon Инструкция для участников
Настоящая инструкция разработана на основании Порядка проведения единого государственного экзамена (далее – егэ), утвержденного приказом...
Инструкция пользователя. 23 icon Должностная инструкция учителя предметника
Настоящая должностная инструкция разработана на основе тарифно-квалификационной характеристики учителя, утвержденной приказом
Инструкция пользователя. 23 icon Инструкция по оценке состояния рельсовой колеи путеизмерительными...
Положение о системе ведения путевого хозяйства ОАО «Российские железные дороги». Утверждено распоряжением ОАО «ржд» 02. 05. 2012...
Инструкция пользователя. 23 icon Инструкция по противодействию терроризму и действиям в экстремальных...
Настоящая инструкция позволяет администрации колледжа и педагогам правильно ориентироваться и действовать в экстремальных и чрезвычайных...
Инструкция пользователя. 23 icon Статистические вычисления в среде Excel. Библиотека пользователя
Вспомогательные функции, используемые при вероятностных и статистических расчетах 177
Инструкция пользователя. 23 icon Календарный план и Перечень работ
Матрица схожести компонент все со всеми, рассчитанная с мерами и параметрами пользователя. 3 уровня подробности информации
Инструкция пользователя. 23 icon Руководство пользователя 6
Стек структура данных, представляющая собой список элементов, организованных по принципу lifo (англ last in — first out, «последним...
Инструкция пользователя. 23 icon Настоящая инструкция разработана на основании Порядка проведения...
Настоящая инструкция разработана на основании Порядка проведения единого государственного экзамена (далее – егэ), утвержденного приказом...
Инструкция пользователя. 23 icon Инструкция по применению Положения о порядке присвоения ученых званий...
Настоящая инструкция определяет порядок применения утвержденного постановлением Правительства Российской Федерации от 29. 03. 2002...
Литература


При копировании материала укажите ссылку © 2015
контакты
literature-edu.ru
Поиск на сайте

Главная страница  Литература  Доклады  Рефераты  Курсовая работа  Лекции