УДК 004.023
Рыльников А.Г., аспирант кафедры САПР и ПК ВолгГТУ
Фоменков С.А., д.т.н., проф. кафедры САПР и ПК ВолгГТУ
Построение объектно-ориентированной онтологии предметной области: физические знания
Creation of object-oriented ontology of knowledge field: physical knowledge's
В данной статье описываются принципы и подходы к построению онтологии знаний по физике. Онтология может быть применена для создания автоматизированной системы поиска физических эффектов по запросу на естественном языке. Также в статье приводятся описание подхода построения и выгоды от применения этого подхода. Этот способ может быть использован для получения онтологий других областей знаний.
This article describes rules and approaches to build the ontology of physics knowledge's. The ontology may be applied to create automatic natural language searching system of physical effects. Also the article give a describing of approach and benefits to use it. This method can be used to give an ontology in other knowledge fields.
Физические знания представляют собой некоторую совокупность понятий и суждений о реальных физических явлениях. Ученые, в первую очередь, нуждаются в постоянном текущем информировании о новых и существующих экспериментальных данных в своих и смежных предметных областях. Такими данными являются количественные зависимости между физическими величинами конкретных объектов, а также различные явления и эффекты, экспериментально наблюдаемые в физических объектах.
Для повышения эффективности работы с этими данными были разработаны различные компьютерные системы для хранения и поиска этой информации. В качестве модели представления данных в этих системах используется модель описания физического эффекта (ФЭ). В различное время этой проблемой занимались: Коллер Р, Альтшуллер Г.С., Половинкин А.И.
В частности, на кафедре "САПР и ПК" ВолгГТУ была разработана система поиска ФЭ. Для поиска использовался метод дескрипторного поиска, что заставляло формализовать запросы в виде модели ФЭ. Это требовало от пользователя глубокого знания теории ФЭ и дополнительных затрат на преобразование своего запроса в термины системы.
Подобная ситуация негативно сказывалась на эффективности применения автоматизированной системы. Для повышения эффективности было принято решение реализовать в системе поиск по запросу на естественном языке. В связи с этим стало необходимым разработать онтологию представления физических знаний, которая максимально полно отражает физические знания и удобна для использования в компьютерных системах, что, в конечном счете, позволит применять методы семантического поиска для отыскания необходимых ФЭ. Это повысит эффективность использования системы поиска [2].
Обычно для описания онтологии используют различные тезаурусы и поля знаний. В основе тезауруса лежит система понятий, соответствующая некоторой ограниченной картине мира. Однако в настоящее время общенаучная картина мира не разработана [1]. С помощью тезаурусов описываются термины предметной области и указываются их взаимосвязи друг с другом. В силу этого термины получаются равнозначными с точки зрения семантики, имеют общую структуру описания и образуют древовидную структуру.
При разработке онтологии физических знаний в данной работе была предпринята попытка отказаться от тезауруса как основы систематизации знаний. Вместо него предлагается использовать объектно-ориентированный подход к описанию онтологии. Применение объектного подхода представляется более наглядной, структурированной и легко формализуемой методологией для построения знаний.
В рамках данной методологии предметная область представляется в виде классов понятий, например: металл, полупроводник, длина волны, напряжение и т.п. Каждый из классов обладает рядом характерных для него свойств. В рамках объектно-ориентированного проектирования применяются техники абстрагирования и наследования, для построения дерева иерархии классов. В построенной онтологии классы также образуют дерево иерархии, наследуя свойства от своих "родителей". Стоит заметить, что в ходе работы было принято решение использовать возможность множественного наследования классов, для исключения проблем отнесения классов к разным способам абстракции.
Наследование является одним из способов представления знаний. Объединяя разные классы под некоторым общим классом-родителем, можно описывать свойства целой группы понятий.
Справочные знания могут быть включены в данную онтологию с помощью описания фактов. Некоторый факт области знаний будет представляться в виде определенных значений свойств соответствующего класса. Например: "электрическая проводимость золота равна 43,5 МОм/м" в терминах предлагаемого подхода будет выглядеть как:
"Золото"."проводимость_электрическая"=43500000,
где "Золото" - это класс, описывающий материал – золото;
"проводимость_электрическая" – свойство класса "золото".
Следует отметить, что свойство "проводимость_электрическая" в свою очередь является классом и также имеет свои свойства. В частности у него есть свойство – "единица_измерения", значение которого для этого класса "Ом/м".
У каждого класса есть специфическое свойство "составные части". С помощью него описывается структура понятия. Например, составными частями ФЭ являются: входное физическое воздействие, выходное физическое воздействие и физический объект. При наследовании структуры действует правило: каждый элемент структуры родительского класса переходит в наследуемый класс в неизменном виде, либо класс элемента заменяется классом, который является дочерним по отношению к классу элемента. Например, в классе "длинноволновый фотовольтаический эффект", который является дочерним по отношению к классу "физический эффект" элемент "физический объект" заменяется элементом "полупроводник", который является дочерним по отношению к классу "физический объект".
Кроме свойств, классы имеют методы. В методах описана последовательность действий, таких как: изменение свойств, создание объектов, операции проверки условий. Методы отражают такие связи области знаний, как: последовательность течения явления, "участники" явления и условия выполнения.
Таким образом, выбранная модель описания знаний, отражает различные связи между понятиями физических знаний и вместе с тем имеет простоту и наглядность. В связи с этим, по сравнению с обычными способами описания онтологий, данный способ представляется более перспективным и легко встраиваемым в различные системы, которым необходимы эти знания.
Рассмотрим теперь более подробно полученные результаты. На Рис. представлена часть полученной схемы иерархии классов.
Рис. Иерархия классов онтологии физических знаний
Класс "физический объект" представляет собой описание любых веществ, которые могут выступать как компонент B в модели описания ФЭ.
Класс "физические воздействия" описывает различные физические воздействия. У этого класса одно свойство - "признак входа". Оно может принимать значения "входное" и "выходное". Дальнейшие потомки наследуют это свойство и расширяют список свойств, специфичными для них свойствами. Эти свойства являются объектами, наследованными от класса "физическое свойство".
По существующим словарям, составленным для автоматизированной системы поиска ФЭ, была построена иерархия классов наследованных от класса "физический объект". Остальные связи и факты из области физических знаний были добавлены в онтологию путем автоматизированного анализа описаний ФЭ в программе, специально разработанной для семантического анализа и поиска ФЭ по запросу на естественном языке.
Рассмотрим представление ФЭ с помощью описанной онтологии. Для примера возьмем описание фотовольтаического эффекта: "Длинноволновый фотовольтаический эффект это возникновение фотоЭДС в контакте полупроводника с металлическим электродом при освещении его светом, длина волны которого больше длины волны края поглощения полупроводника". Схема представления этого эффекта показана на Рис.
Рис. Представление фотовольтаического эффекта в разработанной онтологии.
На рисунке курсивом отмечены свойства объектов, жирным - методы объектов, а обычным – составные части. Таким образом, построенная онтология позволяет описать физические эффекты достаточно полным образом и вместе с тем представленная схема гораздо более формально описывает этот объект, чем его текстовое описание. Как видно из схемы помимо 3х компонентной структуры в нее вошли в неявном виде и ограничения, т.е. если зафиксировать физ. объект как полупроводник, например кремний, то край поглощения у него 10.4*107 м. Значит, длина волны света должна быть больше этого значения.
Как было отмечено выше, построение онтологии осуществлялось на основе автоматизированного анализа описаний физических эффектов, которые имелись в банке данных. Всего было проанализировано 1300 эффектов. Также были использованы словари входов/выходов и объектов физического эффекта.
В результате была построена онтология, содержащая порядка 1000 понятий предметной области. Также в онтологии присутствуют связи различных понятий, отражающие соотношения понятий в рамках конкретных физических эффектов.
Данная онтология является основой для разрабатываемой системы поиска физических эффектов по запросу на естественном языке. В рамках этой работы, был разработан алгоритм автоматического представления запроса на естественном языке в терминах объектно-ориентированного представления физических данных и осуществления поиска.
К перспективам использования данной онтологии можно отнести возможность построения обучающих систем. Отраженные в ней зависимости позволяют строить различные наглядные представления физических знаний с разной степенью детализации, а в дополнении с алгоритмом поиска по запросу на естественном языке, можно получить обучающую систему в виде "вопрос-ответ", с произвольными вопросами из области физических знаний.
Еще одним направлением использования описанной онтологии является разработка система автоматизации начальных этапов проектирования, где требуется построить физический принцип действия, проверить ограничения, выбрать материал и т.п.
Использованная литература
Кобозева И.М. Лингвистическая семантика: изд. 4-е. – М.: Книжный дом "ЛИБРОКОМ", 2009. - 352с.
Журнал «КомпьютерПресс» №1 2008г. (217). ООО «Компьютер пресс» с 24-25.
|