Управление информацией о предметной области




Скачать 69.07 Kb.
Дата11.08.2016
Размер69.07 Kb.

ISBN 5-89838-246-1 Вестник Брянского государственного технического университета. 2006. № 4 (12)


Математическое моделирование

и информационные технологии
УДК 004.738.5

В.И. Аверченков, П.В. Казаков


УПРАВЛЕНИЕ ИНФОРМАЦИЕЙ О ПРЕДМЕТНОЙ ОБЛАСТИ

НА ОСНОВЕ ОНТОЛОГИЙ

Рассматривается новый подход к управлению информацией о предметной области на основе онтологий. Отмечаются возможности онтологий, а также особенности их создания. Рассматривается пример проектирования онтологии для заданной предметной области.


В настоящее время предпринимаются попытки преобразования информации самого различного вида и содержания в электронную форму для ее последующего централизованного хранения и обработки. Для этого постоянно разрабатываются и совершенствуются компьютерные технологии, позволяющие организовать управление такой информацией в виде, наиболее приближенном к ее естественному восприятию человеком. В таких условиях особую актуальность получает идея компьютеризации знаний о целых предметных областях, что позволит повысить качество работы с программами вследствие наделения их интеллектуальными свойствами, а также создать условия для взаимодействия автономных электронных агентов, выполняющих поиск информации в компьютерных сетях.

Центральным компонентом таких систем стали онтологии, создание которых представляет собой методологию кодирования и представления декларативных знаний [1].

С точки зрения информатики онтологию можно определить как набор определений (на формальном языке) фрагмента декларативных знаний, ориентированный на совместное многократное использование различными пользователями в своих приложениях. Из этого определения следует, что онтология включает комплекс понятий   от самых общих до наиболее конкретных,   охватывающий полный спектр объектов и отношений, включая события и процессы, а также значения (атрибутов и отношений), определяемые, если необходимо, во времени и пространстве. Эта система объектов связывается как универсальными зависимостями типа «общее-частное», «часть-целое», «причина-следствие» и т.п., так и специфическими для соответствующей предметной области. Другими словами, онтология – модель предметной области, использующая все допустимые средства представления знаний, релевантные для этой предметной области.

Можно выделить следующие причины, когда возникает потребность в создании онтологий:

- для совместного использования людьми или программными агентами общего понимания структуры информации;

- для возможности повторного использования знаний в предметной области;

- для того, чтобы сделать допущения в предметной области явными;

- для анализа знаний в предметной области.

Онтологии можно применять в качестве строительных блоков компонентов баз знаний, схемы объектов в объектно-ориентированных системах, концептуальной схемы баз данных, структурированного глоссария взаимодействующих сообществ, словаря для связи между агентами, определения классов для программных систем.

Важно отметить, что, как правило, создание онтологии предметной области само по себе не является главной целью. Разработка онтологии напоминает процесс определения набора данных и их структуры для использования другими программами.

Онтологии включают описание как очень общих, так и специфических для конкретной предметной области терминов и могут быть формализованно
записаны как O = <X, R, F>, где X – конечное непустое множество понятий (терминов) предметной области; R – конечное множество отношений между понятиями X; F – конечное множество функций интерпретации, заданных на понятиях X и (или) отношениях R.

Для такой формализации онтологии возможны следующие частные случаи.

1. R = Ø, F = Ø. При этом онтология представляет собой простой словарь, и ее практическое использование целесообразно в том случае, если термины принадлежат очень узкой предметной области и их смыслы уже заранее согласованы в пределах некоторого сообщества. Примером такой ситуации могут служить индексы поисковых машин сети Интернет.

2. R = Ø, F ≠ Ø. Здесь каждому элементу множества X может соответствовать функция интерпретации. При этом часть таких интерпретирующих терминов задаются процедурно, а не декларативно, т. е. смысл терминов предметной области может динамически меняться в зависимости от перехода между прикладными областями.

В общем случае (X ≠ Ø, R ≠ Ø, F ≠ Ø) основной акцент в онтологии делается на задание семантических отношений, имеющихся в предметной области, вместе с созданием единой иерархии понятий, унификацию терминов и правил их интерпретации.

Заметим, что в настоящее время не существует единственного «правильного» способа разработки онтологии. Чаще всего используется итерационный подход, когда, начиная с некоторого чернового варианта, онтология постепенно уточняется с добавлением к ней новых деталей [2].

Как методология инженерии знаний информация в онтологии, как правило, представляется в виде семантической, фреймовой сети. При таком описании узлами сети являются понятия предметной области, а дуги определяют их отношения. Для конкретизации таких понятий они организовываются в иерархию классов, правила проектирования которой близки к технологии объектно-ориентированного программирования. Отличие состоит в том, что объектно-ориентированное программирование сосредоточивается главным образом на операторных свойствах класса, тогда как разработчик онтологии принимает решения, основываясь на структурных свойствах класса [4].

Для описания классов онтологии используются фреймы, представляющие собой именованную структуру данных, состоящую из слотов, с помощью которых описываются свойства понятий для их конкретизации.

Одним из наиболее перспективных направлений в применении онтологий является организация на их основе электронных ресурсов для интеллектуализации работы поисковых систем сети Интернет. В этом случае онтологии предлагается использовать для аннотирования содержимого Интернет-документов, а также для повышения уровня «компетентности» электронных агентов при анализе распределенной информации в хранилищах данных [3]. В частности, для этих целей был разработан проект онтологии для прикладной области «Искусственный интеллект». Областью применения такой онтологии могут быть образовательные или информационно – поисковые системы.

Согласно принципам разработки онтологий для заданной предметной области были определены следующие классы для наиболее общих понятий: «Технологии искусственного интеллекта», «Интеллектуальные системы», «Программное обеспечение», «Области применения», «Источники информации». Далее каждый из классов был уточнен множеством подклассов, например «Интеллектуальные системы»: «Экспертные системы», «Системы анализа естественного языка», «Системы обработки естественного языка», «Системы анализа изображений» и др. На рис.1 приведены верхние уровни таксономии основных понятий предметной области.

Дальнейший шаг связан с выделением понятий каждой категории и организацией связей между ними, он осуществляется непосредственно экспертом в данной предметной области, поскольку автоматическая генерация онтологий в настоящее время затруднительна. Каждый из представленных на рис. 1 классов включает в зависимости от уровня сложности их описания либо группу связанных с ней понятий, либо вложенные подклассы для более подробной детализации. Так, категория «Интеллектуальные системы» включает группу уточняющих и расширяющих это понятие подклассов, представленных на рис. 2.

Рис. 1. Таксономия классов понятий предметной области


Для дальнейшего уточнения понятий должна быть описана внутренняя структура классов через заполнение соответствующих слотов. С этой целью был определен список терминов, связанных с каждым из понятий и образующих тезаурус, или словарь предметной области.

Описанная таким образом онтология может быть эффективно использована в качестве посредника между пользователем и поисковой системой. При этом взаимодействие с онтологией предполагается на следующих этапах:

- формирование поискового образа релевантного документа;

- построение запроса к поисковой системе;

- формирование списка релевантных документов.

Практическая реализация этого подхода должна позволить пользователю на основе заданного ключевого слова получать информацию не просто в виде отдельных фрагментов (более или менее соответствующих условиям поиска), а как взаимосвязанные, логически выверенные данные этой предметной области, представленные в форме, удобной для статистической обработки и автоматизации процессов принятия решений.







Рис. 2. Таксономия класса «Интеллектуальные системы»

Таким образом, создание онтологий является перспективной технологией управления информацией о предметной области. Ее использование представляет собой подход к структуризации и систематизации знаний, в частности для повышения интеллектуальности информационно-поисковых систем. В то же время отсутствие унифицированных правил формирования онтологий приводит к тому, что их проектирование становится исключительно творческой процедурой, зависящей от множества субъективных факторов. Следствиями этого являются проблема логической верности построенных онтологий, а также ограниченные возможности применения онтологий в качестве универсального средства описания декларативных знаний предметной области. Тем не менее онтологии остаются важной технологией структуризации и систематизации информационного пространства сети Интернет, совершенствование которой может привести к новому уровню представления информации.
СПИСОК ЛИТЕРАТУРЫ
1. Noy, N. Ontology Development 101: A Guide to Creating Your First Ontology / N. Noy, D. McGuinness // Stanford Knowledge Systems Laboratory Technical Report KSL-01-05 and Stanford Medical Informatics Technical Report SMI.-2001.

2. Аверченков, В.И. Применение онтологий при создании предметно-ориентированных электронных ресурсов / В.И. Аверченков, П.В. Казаков // Информационные технологии в науке, образовании и производстве: материалы междунар. науч. –техн. конф. – Орел: ОрелГТУ, 2006.   С. 6-11.

3. Аверченков, В.И. Мониторинг и системный анализ информации в сети Интернет: монография / В.И. Аверченков, С.М. Рощин. – Брянск: БГТУ, 2006. – 160 с.

4. Гаврилова, Т.А. Базы знаний интеллектуальных систем: учеб. пособие для вузов / Т.А. Гаврилова, В. Ф. Хорошевский. – СПб.: Питер, 2000. – 382с.


Материал поступил в редколлегию 25.09.06.






База данных защищена авторским правом ©uverenniy.ru 2016
обратиться к администрации

    Главная страница