А. А. Красилов информатика в семи томах том Информатика смысла Машинная лингвистика


Основной тезис для построения СеГ



страница6/23
Дата01.08.2016
Размер4.61 Mb.
1   2   3   4   5   6   7   8   9   ...   23

2.1.2. Основной тезис для построения СеГ. Основной тезис и основные аксиомы для построения СеГ представляются следующим образом. Исходный смысл содержится только в термине, который может быть составлен и из одного слова. Каждое слово не несет смысла, если оно не является термином. По правилам СеГ можно определить смысл каждой последовательности терминов (фразы), если не нарушены ее правила. Смысл всего текста состоит в том, чтобы быть истиной. Если текст имеет смысл лжи, то он содержит некоторое противоречие. Таково требование для каждого текста и требование Интеллсист к фразам, передающим знание ВМ.
В процессе построения правил СеГ необходимо определить объекты (в частности, слова) и понятие о знании. Определение объектов является скорее техническим делом. А вот определение знания требует некоторого усилия для преодоления классического (или общеупотребительного) понимания этого термина. При этом надо учитывать, что определение знания обычно формировалось человеком для человека, умеющего интуитивно осмысливать или понимать каждое понятие. Теперь определение знания надо построить так, чтобы возникло понимание определения системой (можно пока воспринимать термин «понимание компьютером» или «понимание системой» в кавычках). Заметим, что после формирования «нового» определения знания, станет ясным, что оно годится и для человека, иначе он не приобретет возможность общения с ВМ.
Итак, главная цель описания СеГ состоит в определении сущности алгоритма для понимания текстов расширенного русского языка по правилам этой грамматики. Другой язык может рассматриваться по аналогии с русским языком, для него также может быть построена СеГ на основе универсальной грамматики, внутреннего представления текстов в Интеллсист, на базе языка Лейбниц.
В основе разрешения вопросов или проблем в деятельности человека лежат знания. Каждый факт, рассуждения о фактах или правила вывода новых фактов выражают знания. В общении между людьми знания выражаются на каком-либо ЕЯ. Для разрешения вопросов или проблем с помощью ВМ необходимо иметь средства для представления знаний. Сегодня в большинстве случаев применение информатики связано с представлением знания программами, пиктограммами, таблицами, диалоговыми фразами или рисунками. Эти средства имеют определенный уровень интеллектуальности и, конечно же, используются в Интеллсист. Для обучения ВМ чаще всего используются процедурные представления, имеющие вполне определенные недостатки (см. т.7), компенсируемые многократным автоматизируемым составлением программ. Существуют формальные и специальные или формализованные языки представления знаний [Брябрин81, Восилюс80, Гришин82, Дюбуа90, Кирсанов82, Клещев82, Кондрашина89, Коэн75, Минский79, Осуга89, Предстинт80, Хельбиг80], которые должен знать пользователь помимо своего профессионального языка. Будем использовать ту часть ЕЯ, которая ориентирована на пользователя, являющегося специалистом в некоторой области знаний.
Представление знаний в памяти Интеллсист требует понимания того, что знания, передаваемые текстами ЕЯ, разложимы на элементы, которыми может оперировать Интеллсист. Элементарным знанием является пара <имя понятия, смысл-значение>, представляющая простой факт. Имя изображается термином, а значение имеет двоякую форму представления: внутренняя форма, которую можно понять только при анализе кодов в ячейках памяти Интеллсист, и внешняя форма, которая выражается лексемами. В примере “погода холодная” термин погода - имя, а термин холодная - значение. Логическая связь или отношения (композиция) фактов образует простое знание - часть законченной мысли, представленная фразой. Внешнее представление простого знания выражается формулами, а внутреннее представляется альтернативами совместных элементарных знаний. Простое знание служит для представления некоторой законченной мысли. В примере “погода холодная и идет дождь” использованы два факта и логическая связка “и”. Логическая совокупность (композиция) простого знания, обычно представляемая набором предложений ЕЯ, называется абзацем, который выражает законченную мысль. Отдельная законченная (формулировкой) мысль называется прикладной аксиомой, в которой пользователь уверен, что она является истиной. Прикладная аксиома определяет некоторый предмет, его свойства, явление или действия с предметами. Совокупность прикладных аксиом определяет БЗ. При анализе всего введенного в память Интеллсист знания прикладная аксиома может войти в противоречие с ранее введенными аксиомами, тогда Интеллсист обнаружит факт противоречия, а пользователь решает, как выйти из такой ситуации. Важно автоматически обнаружить такие противоречия и локализовать.
В БЗ для Интеллсист заведомо введены фундаментальные знания (они обычно содержатся в книгах и учебниках школы или вуза), а затем вводятся конкретные знания, содержащиеся в запросах на разрешение вопросов или проблем. Запросы пользователь формирует сам, включая дополнительные знания, касающиеся данной проблемы. В БЗ накапливаются две вещи: понятия, в которых пользователь выражает профессиональные базовые знания, и прикладные аксиомы, логически связывающие понятия. Эти два главных атрибута представления знаний рассматриваются ниже подробно.
Понимание текстов связано с определением терминов. Вообще же понимать текст необходимо для передачи не только знания, но и команд или вопросов (задач, проблем или заданий). Понимание команд также считается необходимым для общения с ВМ, как и понимание рассудительных текстов. А понимание вопросов относится к пониманию запросов к знаниям. Вопросы могут передавать знания и задание на логическое извлечение знания из хранилища - из БЗ. Большая часть терминов определяется в БЗ. Пользователь в своем запросе может ввести свои термины для решения частных задач.
Имеется и некоторая сложность понимания СеГ, которая вызвана тем обстоятельством, что в ней вводятся понятия, которые широко используются специалистами различных направлений. Однако вводимые понятия обобщены так, что они являются легко познаваемыми. Лексическое расширение СеГ по сравнению с СиГ будет общепонятным. А введение новых грамматических категорий постепенно поясняется в Информатике или в инструментарии Интеллсист.
2.1.3. Отладка знаний и язык. Поиск противоречий между элементами знания содержится в проблеме отладки БЗ (одна из сторон экологии знания), которая состоит в определении локальной или глобальной непротиворечивости, независимости и полноты конкретных знаний. Проблема отладки разрешается следующим образом. При последовательном вводе знаний по абзацам каждый раз решается логическое уравнение (пусть пока не смущает читателя этот термин, см. т.5), по его решению определяются свойства БЗ и вводимого дополнения к БЗ. По дополнению можно судить о непротиворечивости и/или независимости добавляемого знания. Не следует сбрасывать со счетов традиционные методы отладки знаний. К ним относятся: установление грамматической правильности фраз ЯПП и использования понятий, контроль над точным выполнением количественных ограничений, алгоритмическая, системная и концептуальная отладки. Все эти методы, как обычно, имеют программную реализацию и осуществляются автоматически. Смысловая отладка знания в Интеллсист по существу реализуются автоматически или с участием пользователя на этапе ввода знаний для внесения изменений в соответствии с СеГ. Отладка знаний именуется еще исследованием по экологии знаний [Красилов97б].
Экология знаний предполагает чистоту знаний. Знания могут быть засорены повторами или противоречиями. Повторы фактов или утверждений о фактах легко устраняются, они никогда не изменят базового или пользовательского знания. На них следует обращать внимание только для того, чтобы с какой-либо точки зрения охарактеризовать источник знания, что относится к области эмоциональных исследований, на повторы следует обращать внимание еще для того, чтобы рассмотреть знания с позиции «не содержатся ли в текстах описки или даже ошибки». Искажение хорошего текста может породить повторение, которое будет обязательно проигнорировано в Интеллсист при использовании знаний. Конечно же, важнее проблема поиска противоречий. Интеллсист автоматически находит локальные или глобальные противоречия. Локальные противоречия возникают часто, они могут быть и полезными для «чистки» знания. Глобальные противоречия требуют существенного пересмотра знаний и принятия решений человеком относительно дополнительного или имеющегося знания. В полной мере к экологии знаний можно отнести проблему его полноты. Достаточно ли знаний ВМ для решения им заданий? Этот вопрос разрешается только после попытки решить задание. Если решение состоит из новых (или известных) фактов, то знание полно, иначе оно требует пополнения, поскольку решение содержит утверждения о фактах. Интеллсист подскажет, в какой части такое пополнение необходимо осуществить.
Проблемы использования различных видов знания чрезвычайно важны. Они должны учитываться в языке знаний (в ЯПП). Уже упоминалось, что в современных ВМ используется алгоритмическое (процедурное) знание, обычно представленное программами. Кроме этого вида знаний имеются:

  • лингвосемиотические знания (описательные, плохо формализуемые),

  • семантические знания (или языковые, реализуемые через трансляторы ФЯ),

  • концептуальные знания (понятийные, используемые в системах программирования вручную),

  • фактографические знания (данные из базы, используемые через системы управления БД - СУБД),

  • теоретические знания (или логические, используемые также вручную или через систему управления БЗ - СУБЗ)

  • кибернетические знания (технологические, конструкторские или системные), которые учитываются (или не учитываются) в процессах разрешения организационных или конструкторских проблем.

Из перечисления видов знаний (подробнее см. т.1) видно, что многие виды знаний не используются в программировании автоматически и чаще всего только косвенно учитываются при построении алгоритмов. СеГ (как и СиГ) предусматривает использование всех видов знаний.
Сложность использования всех видов знания вызвана тем, что применение процедур ручного перехода от представлений различных видов знания к алгоритмическому виду приводит к потере части знания. Например, программисту было задано решить задачу об устойчивости двух фирм. Имеется некоторое понимание у программиста о методе решения этой задачи, поэтому он проявляет инициативу и решает задачу подходящим образом, не задумываясь над огромными материалами о деятельности фирм. Другой подход состоит в том, чтобы для Интеллсист сообщить все знания всех видов и сформулировать ему задание в пользовательской постановке. Кроме этого надо заметить, что знания могут быть представлены не только символами, но и графически или предметно. Знаниями, представленными графически, сегодня занимаются плотно и успешно. Хуже обстоит дело с предметным знанием. Еще слабы программы, анализирующие видеозаписи, они не извлекают в полной мере все знания, которые заложены в картинках. Можно утверждать, что имеется огромная перспектива использования знаний, представленных графически или предметно после освоения знаний, представленных символами.
Языки знаний определяют способ хранения знаний в памяти ВМ. Построенная СУБЗ для Интеллсист отличается от СУБД объектами и способами представления взаимосвязь фактов в отличие от способов представления таблиц. Конечно, СУБД используется для хранения данных первичных или новых фактов, но не для представлений знания. Так как операции со знаниями существенно отличаются от операций над таблицами, СУБД не может использоваться для этого эффективно. СУБЗ Интеллсист обеспечивает быстродействие логического вывода с реальной скоростью 500 - 5000 операций логического вывода в секунду (в зависимости от мощности ВМ), поскольку система учитывает связи фактов, а СУБД учитывает сами факты, имеющие только косвенные связи. СУБД может обеспечить быстродействие Интеллсист в 10 - 100 операций в секунду (под операцией здесь понимается один шаг логического вывода решения логического уравнения или применение одного правила СеГ). Правила СеГ диктуют такой подход к хранению знаний.
Для передачи знаний в память Интеллсист необходимо определить понятие смысла текстов, чтобы передавать осмысленные знания. Смысл в толковых словарях определяется несколькими вариантами:

смысл - это внутреннее содержание, значение чего-либо, постигаемое разумом;

смысл - это цель, разумное основание;

смысл - это то же, что и разум (понять смысл чего-либо; слово в прямом и переносном смысле; в этом нет смысла; жизнь получила новый смысл; иметь здравый смысл; в подлинном значении слова).



Действительно, разностороннее определение понятия смысла важно, поскольку человек находится в различных сферах деятельности и требует разного толкования этого понятия. По нашей традиции дадим 7 определений понятия смысл.
2.1.4. Источники проблемы смысла. Источники проблемы смысла находятся в следующем. До сих пор понятие смысла в большинстве случаев находилось вне грамматики ЕЯ. Попытки поиска смысла высказываний из применяемых правил СиГ приводили к небольшому успеху [Хомский96]. Почти единственным способом вычисления смысла на основе СиГ является построения разнообразных графов связей слов или словосочетаний. Поэтому существующие грамматики ЕЯ называются синтаксическими. Конечно, грамотно составленный текст точнее передает смысл высказывания. Наша главная задача состоит в построении Интеллсист, понимающей ЕЯ. Для решения задачи необходимо иметь четкое представление о способах передачи для Интеллсист смысла текстов. Есть убежденность в том, что (как уже говорилось) синтаксическая грамматика не может полностью обеспечить нас средствами передачи смысла высказываний. Рассматривая тексты можно найти ошибки только благодаря тому, что понимаем смысл текста. Без понимания текста весьма сложно найти ошибки, в особенности логические. Иногда в бессмысленном тексте можно обнаружить ошибку. Например, перед «что» должна стоять запятая. Но что же это значит? Смысл вопроса понятен, хотя перед словом «что» нет запятой. Для определения смысла высказывания необходим новый подход к построению грамматики ЕЯ. Имеющуюся грамматику будем квалифицировать как синтаксическую, а предлагаемую грамматику будем называть семантической.
Итак, фундаментальная проблема информатики смысла заключена в поиске способа понимания смысла любого текста, построенного по правилам СиГ. На тексты ЕЯ будут накладываться некоторые ограничения. Проблемы смысла текстов на ЕЯ решались и решаются различными методами. Сошлемся лишь на исторические публикации [Бектаев74, Бидер76, Богодист74, Рубашкин89, Сильдмяэ80 и Фреге77, а также Хомский96]. Что роднит все современные исследования смысла текстов? Главная методическая характеристика понимания смысла авторами сводится к применению СиГ для определения смысла. Но ведь она дает правила образования фраз и ее частей (слов). Действительно, определенная комбинация слов (понимаемый термин или граф связи) позволяет построить картину смысла. Такой методике можно возразить. Во-первых, та же комбинация слов в другом контексте или в другой области знаний имеет почти или совсем другой смысл, во-вторых, последовательность комбинаций слов теряет первоначальный смысл, и она не определяет смысл всего текста. Необходим другой подход для определения смысла текстов. С имеющимися представлениями о смысле тексты знаний нельзя передать для Интеллсист.
Что является основополагающим в методе разрешения проблем информатики относительно смысла текста? Будем исходить из положения, что каждый текст является средством передачи известного или нового знания. Второе положение состоит в том, что каждый текст имеет одну из двух ипостасей: он является истинным или ложным высказыванием (и третьего не дано) или он является командой для выполнения. (И третьего не дано.) В связи с этим понимание структуры знания лежит в основе построения информатики смысла. Зерном структуры знания является элементарное знание, которое обычно квалифицируется как факт. Например, «ему 17 лет» - факт, который отражает характеристику некоторого существа. Производными от фактов являются утверждения о фактах или правила построения новых фактов. Утверждения и правила сыграют главную роль в методе понимания смысла текста. Из таких положений и зерен строится всякое понимания смысла знания, передаваемого текстом.
Следующий шаг в изучении структуры знания состоит в анализе простого знания, построенного из фактов. Простое знание обычно представляет собой композицию элементарного знания и отношений между фактами - утверждения о фактах. Простое знание имеет смысл, поскольку каждый факт имеет смысл и результаты отношений также имеет смысл, вполне определенный по правилам СеГ. Простое знание - это часть текста, которая здесь именуется абзацем. Абзац может состоять из одного предложения, поэтому простое знание можно передать одним предложением. К примеру, «ему 17 лет, а ей 16 лет».
Особое положение в представлении знания имеют тексты, содержащие команды. Любой текст из команд также может пониматься как структура из элементарного знания - отдельно взятая команда и из простого знания - последовательность команд. Необходимо иметь в виду, что выполненная команда порождает истину, а невыполненная - ложь (и третьего не дано). С командными языками редко имеют дело (исключая программистов, руководителей или военнослужащих). Для языка профессиональной прозы нет существенных различий в указанных двух ипостасях. Смесь двух ипостасей допускается в диалоге людей и в диалоге человек-ВМ.
Сложное знание (или знание вообще) представляется последовательностью простых знаний (абзацев или череды команд). Каждый полный текст - это сложное знание, являющееся истинным или ложным. Конечно, истинное знание по традиции считается полезным, а ложное знание требует пересмотра исходных фактов или отношений фактов для исправления полученной ситуации (квалификации или отладки знания). Не исключается из рассмотрения сложное ложное знание, которым практически не занимаются. Но теоретическое значение ложного знания велико. Если изучение ложного знания представляет интерес, то все факты и отношения фактов, имеющих истинное значение, необходимо снабдить отрицанием для того, чтобы Интеллсист могла переработать такое знание и вывести новые ложные факты. В основном Интеллсист исследует только истинное знание, поскольку в нее заложены соответствующие алгоритмы.
Знание, полученное человеком или Интеллсист из элементарного, простого или сложного знания, представляет смысл того или иного высказывания, получаемого по правилам СеГ. Таково самое общее определение смысла. Это определение скорее является человеческим, а не машинным. Нам необходимо понимание, которое пригодно для переработки знания на ВМ. Для этого необходимо разрешить проблему смысла, которая именуется как проблема формализации знания (или смысла). Вот тут каждый может сталкиваться с основной проблемой информатики смысла. К этому надо добавить, что не до конца ясны понятия интеллект, интеллектуальный или интеллектуализация. Может быть поведение, подобное поведению человека, называют интеллектуальным? Может быть интеллектуальность - это предотвращение экспоненциального роста времени поиска необходимых сведений? Можно сомневаться в том, что создание модели мозга приведет нас к пониманию интеллекта. Модель мозга - это основной объект моделирования, медицины и психологии. На наш взгляд к пониманию этих понятий приведет анализ этапов формализации знания. Кратко рассматриваемая ниже последовательность этапов лежит в основе ИП. Именно эти этапы легли в основу создания средств и ИИС и собственно Интеллсист.
2.1.5. Процесс формализации знаний. Итак, подведем также предварительные (так как необходимы еще обоснования) итоги рассмотрения процесса формализации знания путем перечисления опорных действий над знаниями. Именно на основе СеГ строятся алгоритмы понимания (осмысления со стороны ВМ) текстов. Семь обобщающих пункта итожат рассмотрение проблемы формализации с позиций освоения знаний для Интеллсист или технологии ИП. Процесс формализации изложен по шагам во введении к тому 4. Имеются отличия двух описаний процесса, которые состоят (здесь) в обобщенном описании процесса и в конкретном описании процедуры формализации (в томе 4). Повторы некоторых операций формализации здесь и там должны способствовать только запоминанию на основе правил сопоставления.
1. Процесс формализации начинается (первый этап) с построения словаря из слов, лексикона из терминов и других словарей. При неточном определении понятия величины или операции в лексиконе (соответственно предметной и проблемной областей знания) реализуется неточная формализация этого понятия. При постепенном доопределении понятия в процессе разрешения запроса автоматически осуществляется постепенная автоматическая формализация этих понятий величины или операции. Центральным местом всякой формализации является проблема определения понятия. Каждое понятие необходимо выделить и составить его характеристики или выявить его атрибуты (например, термин, определение, значение и др.). Каждому понятию сопоставляется структура и конкретные характеристики, им предписывается присущий им смысл - значение понятия. В этом состоит первый этап формализации. Почти все авторы уделяют внимание этому этапу формализации [Гришин82, Дюбуа82, Прад90, Клещев82, Кондрашина78, Минский87, Минский79, Осуга89, Предстинт80, Рубашкин80 и Ыйм80]. Наиболее сложной частью определений понятий является выбор или формирование структуры каждого понятия. По структуре понятия значительно проще решается задача выбора конкретных характеристик. Совокупность понятий классифицируется на понятия предметной области и понятия проблемной области. В предметной области рассматриваются терманды и множества их значений, в проблемной области - термации и множества их значений.
2. Второй этап формализации состоит в построении отношений понятий и формирование нового (возможно подразумеваемого) понятия, являющегося производным от исходных понятий. Композиция понятий может быть сколь угодно сложной, что зависит от сложности решаемых задач, разрешаемых вопросов или проблем. Композиции понятий выражаются фразами естественного (или искусственного, что не исключается) языка и содержательно представляют знания, несущие смысл, который передается друг другу или для Интеллсист. Отношения понятий - это факты, утверждения о фактах или правила формирования новых фактов. Проблема представления знаний или отношений считается решенной, если выбран ЯПП вместе с лексиконом. Отношения «складываются» в БЗ, которая служит основой разрешения всех запросов.
3. Третий этап является скорее техническим и состоит из ввода знаний для Интеллсист. При этом должна осуществляться формальная отладка знаний на точность использования СеГ. Здесь важным действием является процедура построения ответов на вопросы Интеллсист, связанными с частичным определением понятия. При этом должна осуществляться отладка знаний по восьми номинациям, свойственным всем системам обработки текстовой информации. Здесь главным элементом отладки является концептуальная отладка, реже используемая в программных системах.
4. Четвертый этап состоит в установлении правильности знаний. Этот процесс называется отладкой знания (или экологической проверкой чистоты знания). Знание, как в целом, так и в отдельных частях должно удовлетворять требованиям непротиворечивости, возможно независимости и полноты для построения окончательных ответов на запросы в контексте исследуемого знания. Для пользователя знаниями этот этап самый плодотворный. Дело в том, что любое знание, предоставленное пользователю для разрешения запросов, не содержит конкретного знания, используемого для решения его задач. Интеллсист должна автоматически определять фундаментальные свойства используемого знания. Процесс формализации продолжается при анализе вводимых знания или запроса в память Интеллсист, а также при грамматическом анализе их. При вводе неполного (или частично определенного) знания реализуется частичная формализация, а пополнение БЗ может привести к более точной формализации знания. Итак, этап состоит в установлении правильности знаний. Для пользователя знаниями этот этап самый плодотворный. Дело в том, что любое знание, предоставленное пользователю, не содержит конкретного знания, используемого для решения его задач. Интеллсист должна автоматически определять фундаментальные свойства используемого знания.
5. Пятый этап является логическим и состоит из автоматического построения ответов на запросы к знаниям для получения новых фактов, которые будут использованы при принятии жизненно важных решений. Логический вывод может оборваться из-за ошибок. Тогда участие человека необходимо. Запросы могут быть анкетными, шаблонными или произвольными. Интеллсист разрешает только такие запросы или композиции таких запросов. Этого практически достаточно для решения любых заданий, задач, вопросов или проблем. Основа пятого этапа - составление и отладка запроса.
6. Процесс формализации завершается (шестой этап) получением нового знания в результате выполнения пяти предыдущих этапов. Некоторые этапы могут опускаться, если использованы анкеты или шаблоны. При логическом выводе разрешения запроса получается новое знание, которое не содержалось в базе. Новое знание доопределяет и окончательно формализует исследуемые понятия, уточняемые в этом процессе.
7 Седьмой этап является организационным и состоит в построении технологии использования результатов из логического вывода ответа на запросы. Сюда можно отнести проблемы принятия решений человеком и документирование. Надо добавить, что авторов знаний, инструментария и Интеллсист всегда интересует критика достижений в области ИП. Седьмой этап необходим при статистических исследованиях, он состоит в собирании общих или статистических данных об использовании количественных атрибутов интеллектуальной деятельности.
Авторов знаний, инструментария и Интеллсист всегда интересует критика достижений в области ИП. Седьмой этап необходим систематическим исследованиям, он состоит в собирании общих или статистических данных об использовании атрибутов интеллектуальной деятельности. По этим атрибутам можно определить сложность запроса и объемы словарей.
В заключении отметим, что здесь по существу затронута проблема знания о знании, которая ставит вопросы о представлении форм образования самого знания. Проблема в равной мере относится и к командным языкам. Считаем, что главная проблема выражения связи языка и смысла поднята и указан путь ее разрешения. Остается техническая проблема формализации смысла текстов ЕЯ.

Каталог: files
files -> Чисть I. История. Введение: Предмет философии науки Глава I. Философия науки как прикладная логика: Логический позитивизм
files -> Занятие № Философская проза Ж.=П. Сартра и А. Камю. Философские истоки литературы экзистенциализма
files -> -
files -> Взаимодействие поэзии и прозы в англо-ирландской литературе первой половины XX века
files -> Эрнст Гомбрих История искусства москва 1998
files -> Питер москва Санкт-Петарбург -нижний Новгород • Воронеж Ростов-на-Дону • Екатеринбург • Самара Киев- харьков • Минск 2003 ббк 88. 1(0)
files -> Антиискусство как социальное явлеНИе
files -> Издательство
files -> Список иностранных песен
files -> Репертуар группы


Поделитесь с Вашими друзьями:
1   2   3   4   5   6   7   8   9   ...   23


База данных защищена авторским правом ©uverenniy.ru 2019
обратиться к администрации

    Главная страница