А. А. Красилов информатика в семи томах том Информатика смысла Машинная лингвистика


Каждый человек работает в одной или



страница4/23
Дата01.08.2016
Размер4.61 Mb.
1   2   3   4   5   6   7   8   9   ...   23

Каждый человек работает в одной или

нескольких областях деятельности,

используя соответствующие области

знания и способы их представления.

1.3. Сравнение языков автокод, высокого уровня и ФРАК
Принципиальная возможность формирования языков ФРАК определяется наличием однозначного соответствия между компонентами архитектуры ВМ и основными понятиями языков высокого уровня, которые проектировались под прямым воздействием архитектур с учетом запросов практики применения ВМ. Заметим, что языки семейства ФРАК целесообразно писать не только для программирования ВМ, но и для программирования виртуальных или математических машин, для любых процессов, которые моделируются на ВМ. Можно указать такие примеры ММ как МГР [Красилов78а], ММ диалога [Красилов81б, 89а] и пакеты прикладных программ [Ершов82, Тамм77].
Важной информатической мыслью, возникающей в связи с конструированием языка ФРАК, является следующая: каждая программа (независимо от средств ее изображения) адекватна формуле со скобочной структурой. Каждая лексема (представляющая данные или величины) программы является операндом соответствующей формулы, а каждый ограничитель (запятая, точка с запятой или зарезервированное слово) программы является операции соответствующей формулы. Такое толкование любой программы унифицирует алгоритмы трансляции, обеспечивает проблему аналитических выкладок с текстами программы и указывает на принцип построения синтаксиса языка ФРАК [Красилов73б, 85а].
Процедура конструирования языка ФРАК состоит в формировании его синтаксиса, семантики и прагматики при последовательном изучении архитектуры ВМ, языков высокого уровня, выполнении принципов, требований и пользовательских запросов по области применения ВМ. Преимущества языка ФРАК (как указывалось) для системного программирования вытекают, например, из-за возможности доступа ко всем элементам архитектуры ВМ с помощью средств ЯВУ. Конечно, предлагаемые возможности языка ФРАК обладают одним существенным недостатком - язык является машинно-ориентированным.
Ниже используется табличный метод сопоставления языков, который способствует определению места языка ФРАК среди языков программирования. Сопоставление, представленное в табл.2.3, отражает только главные понятия языков и решает задачу выявления преимуществ одного сорта языков перед другими (автокод ныне именуется языком ассемблера).

Таблица 2.3. Сравнение автокода, языков высокого уровня и ФРАК




п/п

Автокод

ЯВУ

Язык ФРАК

1

Символьные имена

Символьные имена

Символьные имена

2

Управление памятью

Автоматическое распределение памяти

Автоматизированное распределение памяти

3

Аббревиатура операций

Универсальные средства выбора обозначений

Универсальные средства выбора обозначений

4

Машинная семантика

Семантика не зависит от конкретной ВМ

Семантика отражает свойства данной ВМ

5

Полное отражение системы команд

Неадекватность средств языка и ВМ

Соответствие система команд языковым примитивам

6

Форматная запись программы

Бесформатная запись программы

Свободный формат записи программы

7

Любая степень оптимизации рабочей программы

Уступка оптимизации рабочей программы изобразительным средствам

Оптимизация зависит от пользователя

8

Ограничители избыточны

Ограничители порождают команды

Ограничитель - команда ВМ

9

Описание предшествует использованию

Описание и использование независимы

Описание предшествует использованию

10

Трансляция за 1 - 2 прохода

Многопроходная трансляция

Трансляция за 1 - 2 прохода

11

Отсутствие рекурсий операторов

Декомпозиция формул и операторов

Декомпозиция формул и операторов

12

Прямая связь с операционной системой

Ограниченная связь с операционной системой

Прямая связь с операционной системой

13

Отсутствует динамическая память

Имеется динамическая память

Частично имеется динамическая память

14

Локальность контроля

Контроль формализован

Контроль формализован

15

Машинный уровень реализации автоматизации

Необходимы средства автоматизации

Необходимы средства автоматизации

Из приведенного сравнения видны многие существенные преимущества языков ФРАК перед автокодом и некоторые преимущества перед языками высокого уровня, отсутствуют недостатки по сравнению с автокодом и имеются некоторые недостатки по сравнению с ЯВУ. Оценивая сопоставления необходимо иметь в виду, что языки ФРАК ориентированы на системное программирование, а ЯВУ предназначен для программирования в прикладных областях применения ВМ. Язык ФРАК - эффективный инструмент программирования операционных, транслирующих и управляющих систем.


Языки ФРАК нашли практическое применение. Кроме уже упомянутых языков PL 360 для ЭВМ фирмы IBM, PL-БЭСМ-6 для указанной в названии ЭВМ, известны язык Эль-76 для ЭВМ Эльбрус, язык Ассоль для ЕС ЭВМ, языки ФРАК-Гелий и ФРАК-Пламя для встроенных технических систем. Последние два языка ориентированы на системное программирование управляющих встроенных ВМ и использованы при разработках технических систем управления. Известны и другие языки ФРАК. Ниже будет рассмотрен язык ФРАК для МГР текстов (программ).
Эффективность применения языков ФРАК стала возможной благодаря следующим факторам:

  • он является высокоуровневым языком типа ПЛ/1 или Алгол;

  • он «заставляет» программировать оптимально в соответствии с возможностями ВМ и квалификацией программиста;

  • он обеспечивает высокую степень автоматизации программирования в соответствии с формализованной технологией и методологией информатики, применением корреляционной зависимости команд.

Из сказанного следует, что язык ФРАК является алгоритмической моделью архитектуры ВМ с позиции пользователя. Такой взгляд позволяет сделать вывод о возможности проектирования ВМ по алгоритмическому описанию архитектуры, что заведомо обеспечит современный уровень программирования на будущей ВМ. (Если мир компьютеров не будет ориентироваться на единую архитектуру.) Сформулированный подход к проектированию ВМ позволяет оптимально решать проблемы соотношения аппаратных и программных средств, обеспечивающих полноту охвата классов решаемых с помощью ВМ задач.



1.4. Основа общения - язык, о способах задания языков
Самое общее определение языка дается так: множество знаков и множество правил образования слов и текстов из слов с помощью знаков. Совокупность правил вместе с алфавитом букв, цифр и знаков препинания составляет грамматику, именуемая грамматикой, например, русского языка. Грамматика определяет метапонятия - грамматические категории, которые выделяют подмножества слов или текстов и образуют словарь метапонятий, который является частью языка. Любой язык задается своими алфавитом и грамматикой.
ФЯ также определяются алфавитом и грамматикой. Обычно используют порождающие грамматики, для которых метаязыком является формализм Бэкус-Наура, возникший по работам, представленным в публикации [Хомский61] для описания языков программирования. Здесь используется чуть видоизмененный формализм под названием язык Марков. Будем рассматривать распознающие грамматики для описания любых языков [Красилов74в, 75а, 78а, 79а, 83б, 86а]. Основы распознающей грамматики рассмотрены в главе 5.
Общение в системе человек-ВМ использует все языковые средства: ЕЯ и его подмножества, ФЯ и их модификации, разнообразные командные языки и языки меню для программирования работ системы, языки сценариев и др. Любой из перечисленных языков описывается с помощью грамматики. Возникновение грамматик выдвинуло проблему ее представления. По современному пониманию грамматика состоит из алфавита символов, алфавита грамматических понятий (категорий), правил построения частей текста (синтаксис) и правил понимания текстов (семантика). В исключительных случаях, в научных целях или в формальных грамматиках, язык может определяться конечным набором слов. В таких случаях грамматика не формируется и проблемы представления грамматики не существует. Современные языки имеют определенную степень сложности, ограниченный алфавит, словари большого объема и требуют задания или определения грамматики. Словари и грамматика определяют способ задания языка. Все ЕЯ определяются грамматиками.
Самый простой способ задания языка общения в некоторой системе состоит в декларировании применения ЕЯ. Следует указать пороки такого задания (см. п.1.5). Они частично здесь изучаются. Из ЕЯ выделяется очерченное подмножество, с помощью которого можно передать для Интеллсист осмысливаемые системой тексты.
Особое место занимает язык меню, передающий для Интеллсист глобальную последовательность действий пользователя при сообщении им задания на поиск новых фактов или новых правил построения фактов. Средства построения и реализации языка меню включают использование дерева подработ Интеллсист, пиктограммы выбора работ, аналоги или стандарты последовательностей работ или формальная запись выполняемых последовательностей работ. Так поступают в разработках всех современных программных систем.
Любой язык может задаваться одним из способов:

  • описательно так, как это реализуется в учебниках,

  • на образцах так, как это делается в статьях,

  • может представляться формально так, как это делается в информатике,

  • грамматикой так, как это делается в лингвистике,

  • может определяться метаязыком так, как это делается при описании некоторых языков программирования,

  • может определяться в форме распознающей грамматики - графом языка так, как рассматривается в главе 5.

Имеется широкий спектр разнообразных средств определения языков различного назначения.

1.5. Языки профессиональной прозы
Средством общения людей является ЕЯ. Имеется большое число отличительных черт, выделяющих ЕЯ по сравнению с ФЯ, широко распространенных в общении людей различных профессий с ВМ. Это наиболее важная черта ЕЯ для применений Интеллсист. (Они же и определяют сложность ЕЯ.) Имеется в виду сложность ЕЯ, которая определяет невозможность реализации средств ЕЯ [Бакланов78, Белый10, Виноград76, Калугина79, ПоповЭ82] в «глобальных» Интеллсист. Вначале определим сложности в использовании ЕЯ.
Основные атрибуты сложности ЕЯ препятствуют его изучению и использованию для построения машинных систем работы с текстами ЕЯ. Отметим лишь некоторые. Значительные размеры контекста для определения смысла понятия, многозначность слов или понятий, большое число грамматических категорий СиГ и огромный размер словаря терминов (да и слов также) - это основные атрибуты сложности ЕЯ для Интеллсист. Первая сложность состоит в том, что понятие в ЕЯ имеет обширный контекст его определения. Это означает, что каждое понятие имеет определение, но оно локализуется весьма сложно (возможно и не в данном тексте). Например, контекстом данного понятия может быть память человека (порождение нового слова или термина), контекстом может быть содержимое книг библиотеки и др. Вторая сложность состоит в том, что ЕЯ использует синонимы таким образом, что некоторые два синонима могут иметь различные значения в некоторых контекстах с другими терминами. Их смысл определяется также по обширному контексту. Еще одна (третья) сложность использования ЕЯ: число грамматических категорий СиГ оценивается несколькими сотнями, что порождает сложности понимания ЕЯ для Интеллсист. Кроме этого, подавляющая часть грамматических категорий СиГ не способствует определению смысла текста. Работа с ЕЯ в условиях ограниченной памяти или быстродействия алгоритмов (для передачи знаний или для перевода текстов) представляет большую проблему. И, наконец, последняя (четвертая) сложность: наличие огромного словарного запаса ЕЯ. Для решения проблем пользователя конкретной специальности огромный запас слов или терминов просто не нужен. Этих четырех черт ЕЯ достаточно для понимания сложности работ с ЕЯ.
Охват всего ЕЯ пока немыслим. Попробуем взять часть ЕЯ, которой пользуются специалисты (все люди) в данной области знания. Такую часть ЕЯ будем именовать ЯПП. Во-первых, каждому специалисту достаточен такой язык, поскольку он решает свои проблемы по своей специальности. Во-вторых, такое ограничение приемлемо в любой Интеллсист. Наконец, в третьих, использование ЯПП постепенно приближает нас к ЕЯ и составляет существенный шаг в открытии доступа к ВМ для любого пользователя. Основные принципы, характеризующие ЯПП по сравнению с ЕЯ, можно сформулировать так:
Определение понятий ЕЯ помещается в памяти человека или находится в контексте большого объема (включая книги библиотеки), а определение понятия ЯПП помещается в памяти ВМ (в лексиконе) или помещается в тексте малого объема (в описании данного знания, передаваемого ВМ). Контекст можно определить формально так. Контекст - это часть текста, в котором помещено определение понятия и его использование. Контекст ЕЯ охватывает данный текст и еще ряд текстов, не доступных в данный момент для изучения контекста. Контекст каждого понятия ЯПП должен помещаться в памяти машины таким образом, чтобы программы осуществляли идентификацию каждого понятия, заданным в текстах терминами. Для создания таких контекстов формируется лексикон. Практически это означает, что вместе со знаниями (с БЗ) ВМ передается лексикон, содержащий определения каждого понятия.
Избыточного текста в ЕЯ не существует. Кажущийся избыточным текст передает эмоции человека, его состояние и умение, что обеспечивает передачу некоторого смысла. В ЯПП могут использоваться избыточные слова и тексты для передачи эмоциональной информации. Избыточные слова и тексты не создают контекста и могут не рассматриваться при анализе текстов ЯПП. Конечно, это утверждение верно в том случае, если лексикон не содержит в своем составе избыточных слов. По-видимому, если система учитывает избыточные слова, то это есть программная система (или Интеллсист), которая воспринимает и изучает, например эмоции человека.
В информатике при формировании нового языка поступают в соответствии со следующими основными шагами:

Первый шаг - наложение ограничений на ЕЯ по указанным четырем чертам.

Второй шаг - расширение ограниченного ЕЯ формализованными языками и ФЯ.

Третий шаг - ориентирование языка на данную профессию для передачи знаний этой профессии, а не любых знаний (вообще).



Эти три шага позволяют построить новые классы языков ЯПП. Такие языки не рассматривают некоторые грамматические категории, которые выражают эмоции как средства передачи интимных знаний (хотя для некоторых профессий такие средства могут использоваться для передачи ВМ знаний). Слово «проза» ограничивает нас от применения, например стихотворных форм для передачи знаний в задании для ВМ (хотя и они могут использоваться некоторыми профессиями для передачи знаний). Рассмотрим указанные три шага формирования ЯПП, а также некоторые принципы, характеризующие ЯПП.
Относительно первого шага. Языки, используемые специалистами данной профессии, уже имеют ограничения, как по составу словаря, так и по грамматической форме построения текстов. Действительно, воспользуемся тем обстоятельством, что люди одной и той же профессии для точного понимания смысла профессиональной деятельности используют ЯПП. Использование слов других профессий в данной профессии приводит к формированию языка новой профессии, рождаемого на стыке двух профессий. Определение каждого понятия введено в память ВМ либо непосредственно через словарь (лексикон), либо оно дано в ограниченном контексте. Синонимы используются широко с таким ограничением: каждый синоним имеет одно фиксированное значение, определяемое ведущим понятием. Число используемых грамматических категорий ограничено десятками, они чаще всего не совпадают с грамматическими категориями ЕЯ.
Относительно второго шага. Подключение ФЯ и/или формализованного языка является естественным шагом в каждой профессии. Формализация знаний в любой форме присуща каждой профессии, она отражается и в используемом языке. Формализация языка профессии - один из методов процесса абстракции.
Наконец, относительно третьего шага. Язык профессии отражается в лексиконе (словаре терминов), в грамматическом строе фраз ЯПП и при определении единственного значения каждого синонима. Все сказанное определяет смысл ЯПП. Этим проблемам будет отведено место далее.
Мы выбираем вариант формулировки языка по СеГ русского языка (или любого другого ЕЯ). СеГ является основой для построения ЯПП, который является средством для внешнего представления знаний специалистов данной профессии при вводе их в память ВМ для обработки «старого» и выработки нового знания. Для описания свойств ЯПП будем использовать концепции понятия, термина и слова. Каждое понятие имеет свое определение, оно изображается некоторым термином, состоящим из слов, лексем и знаков (в самом общем смысле понимания этого понятия). Слово- это последовательность букв и цифр, некоторое число или выделенный символ (в ФЯ такие конструкции именуются лексемами). Любое знание можно представить на ЯПП (может быть за исключением графического знания). В соответствии с определением понятия для изображения знания необходимо формировать утверждения, представляющие факты, правила получения новых фактов и т.п. Концепций понятия, термина и слова для построения утверждений и описания фактов вполне достаточно.
Главные преимущества естественным образом вытекают из сказанного о ЯПП. Применение ЯПП не связано с использованием руководств по Интеллсист. Зачем изучать руководящий материал, если ВМ понимает родной язык специалиста. ЯПП обеспечивает автоматический контроль над правильностью использования слов и знаков, что не характерно для ЕЯ. Интеллсист обеспечивает автоматизм выявления недостающего знания и поиска ошибок.
Грамматика ЕЯ характеризуется сотнями категорий (простой подсчет показывает, что имеется более 250 грамматических категорий в русском языке). Грамматика ЯПП характеризуется десятками категорий (это часть определения ЯПП, лексикона и всех вспомогательных данных). Следовательно, по сравнению с ЕЯ при анализе текстов ЯПП можно игнорировать значительное число форм, поддерживающих «ненужные» для ЯПП категории. Среди грамматических категорий ЯПП могут быть категории, почти совпадающие с грамматическими категориями ЕЯ, например синонимы.
Эмоциональная окраска фраз в ЕЯ, передающая знания, может быть уточнена с помощью вопросно-ответной системы. Не все знания, передаваемые эмоционально, могут помещаться в данном тексте. Вопросы, формируемые ВМ (а точнее Интеллсист), требуют от пользователя простого ответа типа «да» и «нет». Интеллсист может проявить настойчивость и сформулировать несколько вопросов. Ответы на вопросы Интеллсист или инструментария Интеллсист произведут уточнение исходного текста, учтут знания, передаваемые эмоциями.
Избыточные слова ЕЯ, если они не передают знания, игнорируются при вводе фраз в память ВМ, они отсутствуют в лексиконе и, следовательно, не входят в ЯПП. Избыточные слова в ЯПП не изменяют знания и игнорируются. Избыточные слова передают знания, но они (знания) не относятся к данному предмету исследования. Именно поэтому игнорирование таких терминов допустимо, несмотря на то, что в другом ЯПП они будут играть существенную роль.
Определение понятия должно находиться в памяти ВМ (или в доступном для Интеллсист месте), а совокупность определений (вместе с терминами) должна составлять лексикон предметной и проблемной областей знаний в данной профессии. Это требование предполагает разделы лексикона: стандартная, профессиональная, меняющаяся и пополняемая части. Каждое понятие определяется в лексиконе. Определение понятия должно находиться в БЗ, что несколько уменьшает контекст данного понятия. Термин, обозначающий понятие, может характеризоваться базами слов без учета грамматических категорий изменяемости этих слов. База слова понимается в обобщенном смысле: зафиксированная часть слова или все слово, обозначающие понятия и не учитывающие категории их изменчивости. База и конец слова - новые грамматические категории, относящиеся к грамматике ЯПП.
Кратко определим ЯПП так: ЯПП - это часть ЕЯ, используемая в данной профессии и использующая фиксированный (но расширяемый) лексикон, содержащий определения терминов, и формализованные языки или ФЯ как часть определения языка. Более точное определение дано выше в форме объяснения и сопоставления с ЕЯ. К преимуществам ЯПП следует отнести такие факторы, которые сформулированы более четко и полнее (чем ранее) в перечислении, данном ниже.

1.Поскольку лексикон ЯПП задается заведомо, легко реализовать синтаксический контроль над правильностью синтаксического представления знаний в этом лексиконе. Так реализуется автоматическая отладка текстов. Лексикон задается при первичном формировании знаний в памяти ВМ.

2. ЯПП поддержан ФЯ (языком Лейбниц), что также обеспечивает автоматизацию синтаксической и семантической отладки текстов знаний. Поддержка подкрепляется тем обстоятельством, что для текстов знаний подключается транслятор ЯПП на ФЯ, который контролирует тексты автоматическими средствами.

3. Для специалиста, работающего в данных предметной и проблемной областях, ЯПП является естественным профессиональным языком с возможными включениями формализованных или ФЯ его специальности. Это обеспечивает упрощение специалисту в общении его с ВМ по элементам знания при наполнении базы знаниями.

4. При выполнении условий предыдущих пунктов создается ситуация общения специалиста с ВМ без участия знаниеведа. Это обстоятельство обеспечивает отторжение разработок знаниеведа для пользователя Интеллсист. Роль отторжения велика. Интересна, например, проблема секретности знаний или их индивидуализация.

5. Освоение любой Интеллсист должно обходиться без емких руководств. Для использования Интеллсист должно быть достаточно самой системы, которая общается с пользователем на его ЯПП. Обучение должно предусматривать исключение из практики применения Интеллсист пособий и руководств, особенно в тот момент, когда идет производственная работа (как с играми на ВМ).

6.Система составления и использования лексикона предусматривает возможность пополнения его новыми терминами в процессе эксплуатации самой Интеллсист для решения данного задания. Развитие ЯПП является естественной основой для любой науки.

7.Настройка Интеллсист проходит стадии: набор текстов знания, прогон текстов для выборки и формирования лексикона, прогон знаний при вводе его в БЗ, контрольный ввод знаний в базу. ЯПП обеспечивает параллельную работу с лексиконом и знаниями, что продуктивно может использоваться для формирования самого знания.


Перечисленные выше преимущества по существу не оправдывают процедуру выделения ЯПП из ЕЯ лингвистом или знаниеведом. Они лишь показывают на удовлетворение запросов пользователя, который желает вести общение с ВМ в его профессиональном лексиконе, и заинтересован в быстром решении своих задач.
Написание сценария предшествует разработке программ.

1.6. Языки сценариев
Особое место в информатике занимает проблема организации общения в системе человек-ВМ. Это объясняется высокой динамичностью самого общения, непрерывным поворотом событий и естественным распределением по времени и месту. Так можно перечислить главные отличительные черты технического общения от литературного, в котором только эмоциональная окраска и перемещения действующих лиц варьируются динамически, а сценарий зафиксирован или частично модифицирован режиссером. Далее везде будем иметь в виду технический сценарий, в состав которого могут входить и литературные сценарии.
Основными компонентами диалога являются:

- состав «действующих лиц» (пользователи, системы, машины),

- содержание диалога (ввод-вывод, помощь пользователю, автоматическое управление диалогом, красота общения, возможность расширения),

- режимы работы (среднее время ожидания, повторяемость и способы подачи реплик),

- средства выполнения (окна, клавиатура, мышь),

- средства подсказок (раздел справки, плавающий вопрос, динамика показа),

- сервис диалоговой работы, который минимизирует время диалога,

- схема диалога (последовательность основных пунктов).

Эти компоненты являются одновременно структурой диалога и общими требованиями к способам построения диалоговой подсистемы или сценария работ в системе.
Требования к диалоговой системе следует выделить особо. К ним относятся:

- гибкость: учет разнообразных запросов и потребностей пользователя,

- ясность: возможность построения модели системы, предсказуемость,

- простота: терпимость к ошибкам пользователя, доброжелательность,

- обучаемость: подсказка и предложения по решению вопросов,

- надежность: ошибки пользователя не влияют на качество работы системы,

- естественность: приближенность к естественному общению человека с человеком,

- системность и ограничения должны быть минимальными.


Каждый диалог реализуется по сценарию. Театральный сценарий отличается от технического сценария, который можно определить так: технический сценарий - это род технической литературы, композиционный строй которой подчинен закономерностям взаимодействия в системе человек-ВМ. Относительно простое определение дополним сведениями о сценариях, которые доопределят понятие. Сценарий - это набросок формы взаимодействия человека и ВМ, определяющий цель, тему, предмет и объект, средства изображения и выражения перечисленного. Сценарий - это основа коллективного труда следующих специализаций:

технического режиссера,

оператора за клавиатурой,

художника,

искусствоведа,

литературоведа,

комментатора,

программиста,

системного программиста,

знаниеведа,

алгоритмиста,

организатора,

менеджера,

руководителя коллектива действующих лиц.

Сценарий - это словесно-логический портрет событий в системе человек-ВМ или эквивалент будущего взаимодействия в системе, непосредственно протекающий процесс в реальном времени человека. Совокупность таких определений достаточен для понимания понятия сценарий.
Каждый сценарий разрабатывается программистом и представляется на формализованном языке для автоматического построения программы работы пользователя. Язык сценариев должен обеспечить зрелищность взаимодействия пользователя с ВМ. Все должно способствовать продуктивному решению проблем пользователя. К языку сценариев также предъявляются требования. Язык сценариев должен обеспечить:

1. Подвижность «действующих лиц», в качестве которых выступают образы запросов, процессов обработки знания или логических выводов ответа, самих ответов на запросы и коллизии, которые появляются в процессе ввода знаний или запросов, реакций Интеллсист на ошибки пользователя.

2. Разнообразие при работе пользователя и Интеллсист состоит в вариациях работы программ Интеллсист, в которые заложены по возможности все подразумеваемые действия пользователя.

3. Привлекательность работы с Интеллсист и теплоту общения с пользователем, который называется обычно дружественным интерфейсом.

4. Незаметное обучение пользователя (стиль подсказок вне руководств) таким образом, чтобы помощь приходила по первому требованию пользователя или вынуждено в случаях коллизий.

5. Необходимость жизненности идеи, темы, сюжета. Идея велика: как без помощи программиста решить сложную задачу, а может быть разрешить новую проблему. Тема подсказывается самим пользователем, она продиктована запросами. Сюжет в большинстве случаев диктуется от Интеллсист по схеме пользователя, а он определяется темой.

6. Достоверность материала, содержимого стандартной части БЗ и БЗ, ориентированной на специалиста, которым является сам пользователь, имеющий только полученное им образование и изучивший научиться работу за клавиатурой или мышью.
Основными элементами сценария являются следующие атрибуты:


  1. Эпизод - это отрывок или фрагмент с известной самостоятельностью идеи, темы и сюжета (например набор данных).

  2. Фабула - это сочетание фактов, основа-душа, выражение сюжета, который представляется как система событий, составляющая содержание пьесы в рамках данного сценария.

  3. Пролог - это вступление в работу с Интеллсист или другой системой.

  4. Завязка - это начало конфликта, исходный эпизод, момент (если хотите - проблема или запрос пользователя).

  5. Развязка - это исход события, разрешение «противоречия», заложенного в проблему или запрос пользователя.

  6. Кульминация - это высшая точка напряжения взаимодействия человека с ВМ (ожидание ошибки или ответа на запрос).

  7. Эпилог - это заключительное обращение к пользователю, получившему ответ на запрос (написание итогового документа).

Как видно аналогия с литературным сценарием имеется почти полная. Особенностью технического сценария является наличие в нем альтернативных реплик системы в зависимости от получающейся реакции на действия пользователя.
Разработка сценария является упорной и изобретательной работой автора. Она связана с выбором характерных сторон, черт, реплик будущего сценария и с учетом всех возможных поворотов событий. Остальные компоненты достраиваются обычно пользователем в процессе реализации сценария. Причем необходимо иметь в виду, что если что-то непонятно, то формируется вопрос системой для пользователя. Работа над сценарием должна предусматривать многие стороны взаимодействия человека и ВМ. Нужно иметь в виду, что участниками сцен являются пользователи, Интеллсист и терминал. Необходимо учитывать также:

  • обстановку в БЗ и запросах,

  • постановку цели и иерархию подцелей,

  • сюжетную заявку,

  • либретто пьесы,

  • фабулу,

  • идею,

  • тему,

  • доступные выразительные средства,

  • план по эпизодам,

  • монтаж,

  • план по объектам,

  • точку зрения пользователя,

  • ракурсы всех событий во взаимодействии,

  • авторский текст,

  • разбивку на акты и сцены,

  • ведение сущности пьесы: пролога, завязки, кульминации, развязки и эпилога.

Язык сценариев в форме наброска формально определен в [Красилов86а] как средства записи сценария. Там определены имена (пользователей и терминалов) и логические и арифметические выражения для выполнения ветвления диалога, организация полиэкранного общения и определение параметров общения, для тех же целей определены стандартные (часы, дата, пауза, остановка) и нестандартные функции и действия. Формально определен диалог как последовательность реакций пользователя или системы (реплики или операторы) на реплики друг друга. В языке определены также структуры актов и всего сценария. Язык сценариев назван языком Пьеса, определяющим множество сценариев розыгрыша взаимодействий пользователей и ВМ.


В ИП и Интеллсист сценарий реализован внутри программ, а внешне проявляется через меню работ и подработ и реакций Интеллсист на запросы пользователя. Определены сценарий работы с инструментарием для ускорения выполнения только необходимых работ и сценарий работы Интеллсист для ускорения создания или запуска запросов, в частности анкет и шаблонов. Сценарий и его реализация полезны для организации работы «от одной кнопки». Использование клавиатуры должно осуществляться в рамках уже принятых традиций набора исходных параметров или данных, поскольку многие пользователя имеют некоторый или широкий опыт работы с программными системами. Например, использование функциональных клавиш клавиатуры в сценарии не должен содержательно отличаться от принятого сценария в практике работы на ВМ. Использование F1 связывается с вызовом подсказки, любой сценарий должен предусматривать этот факт. То же можно сказать об использовании стандартных клавиш и изображений (пиктограмм или рисунков). Кроме этого в инструментарии Интеллсист определены сценарии работы пользователя, если она имеет достаточно стандартную рутинную форму, и сценарии работы ассоциации Интеллсист, если при решении задачи необходимо обращение к нескольким Интеллсист, связанным ответами одних Интеллсист и запросами других.

1.7. Языки представления знаний о языках, метаязык Марков
Если окунуться в языки кодирования, то можно указать некоторые общие принципы кодирования. Проще всего кодируется отображение типа терминальный алфавит на целые числа. Обычно используется начальный непрерывный отрезок натурального ряда с конечным числом (максимальным значением) 2**К-1. Кодирование составных имен осуществляется в две-три стадии. К примеру, слово произвольной длины (оно состоит из символов букв и цифр) помещается в таблицу, а ссылка на эту таблицу становится некоторым абстрактным символом, который вновь может быть закодирован целым числом. Совокупность слов и знаков вновь представляет собой «слово» произвольной длины (термин), которое (который) вносится в свою таблицу и тем самым приобретает ссылку - абстрактный символ некоторого свойства. Такая процедура может продолжаться далее. В языке кодирования предусматривается рекурсия определений - это важное обстоятельство в представлениях знаний. Рекурсивными являются определения значений и фраз (утверждений).
Кодирование должно удовлетворять некоторым требованиям, они учитываются в языках представления знаний. К числу требований относится следующее: использование синонимов в ЯПП означает, что несколько терминов могут ссылаться на одну и ту же характеристику. Обратные ссылки отвергаются, оно лишь характерно для ЕЯ. В Интеллсист обратные ссылки определяются динамически для печати результатов по запросу пользователей, желающих увидеть результаты в синонимах. Конец слова должен храниться в словаре слов, поскольку он привязан к данному слову и не может тиражироваться в результате некоторого отображения. Это требование также относится к значениям и фразам. Для печати результатов в соответствии с СиГ необходимо вложить правила СиГ в программу печати.
Конечно, в процессе построения алгоритмов программных систем может возникнуть необходимость формирования массивов другой природы, что также относится к проблеме кодирования. К примеру, хранение слов в словаре может использовать алгоритмы графового представления словаря [Красилов75а], каждое слово должно ссылаться на текст, предназначенный для пояснения понятия. Следовательно, каждое слово или термин должен иметь ссылку на этот текст, а сами тексты образуют массив-таблицу характеристик слова, термина, значения или фразы.
Основной формой фиксации знаний любого сорта для человека являются фразы ЕЯ, если помнить, что фразы специалиста являются также фразами ЕЯ. Однако необходимо помнить, что фразы ЕЯ сложны для понимания машиной в силу сложности синтаксической грамматики ЕЯ. Поэтому принята следующая гипотеза: необходимо используется подмножество ЕЯ, которое обычно именуется ЯПП. Понятие ЯПП будет означать использование той части ЕЯ, которая будет представлена в памяти ВМ. Это не значит, что в памяти машины представлены отдельные фразы. Это значит, что в памяти машины будет представлен СеГ ЯПП.
Обычно ЕЯ выражается в форме речи, текста (и картинок или рисунков). Эти формы общения людей устраивают всех и почти не зависят от специальности человека. Все виды знаний могут быть представлены средствами ЕЯ и символами клавиатуры. Не вызывает сомнения представление знаний гуманитарных наук описаниями. Также нет сомнения относительно представления знаний о смысле некоторого понятия или его определения. Сложнее всего представлять текстами некоторые математические тексты с формулами, например использующими специальные знаки. Даже можно представить себе использование ЕЯ для изображения алгоритмов и систем произвольного назначения. Данный перечень видов знаний дан для того, чтобы можно было задуматься над проблемами представления знаний и понять основную идею представления: один и тот же вид знаний может использоваться для представления всех других видов знаний (закон информатики). Заметим, что формулы из математики являются также текстами, если многоэтажность формул устранена путем представления в линию (строчку), а специальные математические знаки заменены словами или их наименованиями.
Представление знаний всех видов необходимо для разрешения проблем эффективного функционирования системы человек-ВМ. Пока примем гипотезу о том, что ЕЯ является хорошим (подходящим) средством для фиксации знаний в памяти ВМ. Если фразы ЕЯ «разбавлены» словами профессионального лексикона (мы имеем дело с ЯПП), то такая часть ЕЯ будет приемлема для специалиста в качестве рабочего языка общения с Интеллсист. Все приведенные доводы в пользу применения ЕЯ подкрепляются следующим фундаментальным положением:
УРОВЕНЬ ИЛИ СТЕПЕНЬ ИНТЕЛЛЕКТУАЛИЗАЦИИ ПРОГРАММЫ ВМ

ПРЯМО ПРОПОРЦИОНАЛЬНЫ УРОВНЮ ИЛИ СТЕПЕНИ

ОТТОРГАЕМОСТИ ПРОГРАММНОГО ПРОДУКТА ОТ

РАЗРАБОТЧИКА ИЛИ ОТ СПЕЦИАЛИСТА ПО РАЗРАБОТКАМ.
Это положение в равной степени относится и к СВТ и к алгоритмам. Чем выше уровень общения человека с ВМ, тем скорее система будет использована специалистом, специальность которого существенно отличается от специальности программиста.
Имеется важная особенность в деле использования ЕЯ для представления знаний. Знания связаны с предметами, явлениями и процессами. Эти понятия будем связывать с понятием операнда. Операнд выделяет во фразе сущность понятия, относительно которой делается высказывание, содержащее что-либо до сих пор неизвестное. С этими сущностями связаны признаки, свойства, симптомы, операции, отношения или соотношения, которые уточняют знания о сущностях путем установления связи различных понятий (и их сущностей). Перечисленные понятия ассоциируются с операциями над сущностями. Таким образом, любую фразу можно рассматривать как «формулу», состоящую из операндов и операций. Знания по своему существу являются утверждениями логического типа. Можно считать, что знания изображаются логическими выражениями.
Имеется еще одна особенность ЕЯ, которая отражается в профессиональной прозе. Она состоит в том, что предметы (их сущности) одной части ЕЯ может стать признаком в другой части. Естественно, что можно предположить и обратный эффект: признак может стать сущностью. В таких случаях используется контекст. Понятие контекста важно и будет использоваться в дальнейшем. Конечно, контекст должен быть известен заранее и учтен при программировании на ЕЯ или ФЯ.
Математик или информатик, исследующий ИЛ, должен владеть ФЯ математики и информатики. ФЯ математики аналогичен языку, используемому в математической логике правильно построенных формул. Информатический ФЯ является частью языка Лейбниц. Фрагменты этого языка рассматриваются позже.
Для описания грамматик формальных языков используется язык, который является метаязыком по отношению к описываемому языку. Метаязык - это совокупность правил, по которым строится грамматика некоторого языка. Рассмотрим правила метаязыка Марков, он же именуется языком Марков, если рассматривается самостоятельно. В качестве примера определения метаязыка рассмотрим весь язык Марков, с помощью которого определяется ЯПП. Язык Марков является средством и примером описания языковых знаний. Исходным средством описания языка является порождающая или распознающая грамматики. В дополнении к этому вводится форма предложения, которая задает формальный внешний вид поименованной в заглавии раздела грамматической конструкции. Внешний вид порождающих грамматик представляется по правилам Бэкуса-Наура. Обычно используются методы сокращения форм записи грамматики методом Бэкуса-Наура. К примеру, использование символа «|» для указания альтернативных выражений правил сократит приведенную грамматику языка Марков до 24 правил. Вот как можно представить правила для определения нетерминального символа или метапонятия "слово":
слово::= буква | слово буква | слово цифра.
В языке Марков изменены некоторые правила по сравнению с формализмом Бэкуса-Наура. Это сделано для обеспечения большей наглядности и читаемости. Улучшения осуществляются средствами, которые описаны в самом ФЯ Марков. Метапеременные записываются без угловых скобок и подчеркивания, но с запятой для разделения метапеременных. Использованы термины «список», «перечень» и «последовательность» (аналог перечислений через символ запятой, через символ точки с запятой и фигурных скобок в некотором формализме Бэкуса-Наура). При формальном описании грамматик используются сокращения следующего рода. Метапонятия (понятия, отдельные символы или грамматические категории) представляются словом или последовательностью слов. Если перед метапонятием помещено слово «список», то понятие повторяется от одного до некоторого числа раз с разделением объектных понятий запятыми. Если перед понятием помещено слово «перечень», то объектное понятие повторяется от одного до некоторого числа раз с разделением понятий точкой с запятой. Если перед понятием помещено слово «последовательность», то объектное понятие повторяется от одного до некоторого числа раз без разделения понятий каким-либо символом. В языке Марков использован термин «возможно» (аналог квадратных скобок в некотором формализме Бэкуса-Наура). Если перед понятием помещено слово «возможно», то понятие либо не употребляется, либо употребляется только один раз. При использовании указанных слов метапонятие может иметь измененные окончания в словах. Терминальный символ указывается своим наименованием, которому предшествует слово «символ», если они уже используются в записи правил, или графическим знаком. К метасимволам относятся следующие обозначения. Вместо ограничителя ::= (по определению есть) используется символ двоеточия (для отделения определяемого метапонятия и его определения), символ точки (для указания конца правила), символ запятой (для указания операции соединения или катенации) и альтернативные определения (правила) разделяются символом точки с запятой. Все эти символы используются в записях грамматических правил. Если в формуле необходимо использовать двоеточие, то оно заменяется выделенным словом «двоеточие». Кроме этого, используется три начертания шрифта:

обычный шрифт - для записи метапеременных,

жирный шрифт - для автоматически набираемого средствами меню текстов,

курсив - для набираемых пользователем текстов.

Если в текстах порождающих правил использованы различные шрифты, то отделение метапонятий и понятий запятой не обязательно. При создании записи правил языка не учитывается вариация окончаний слов. Предполагается, что изменение окончаний в имени понятий не приводит к другим понятиям. Сказанное является по существу семантикой языка Марков, поэтому комментарии к правилам излишни. Язык Марков определяет форму порождающих контекстно-свободных грамматик (КС-грамматик), и язык Марков определяется также порождающей КС-грамматикой, язык Марков - это порождающая грамматика, которая определяется формально с помощью порождающей грамматики:
порождающая грамматика: алфавит терминальных символов ,

алфавит нетерминальных символов , последовательность правил ,

аксиома.

алфавит терминальных символов: список терминальных символов.

терминальный символ: слово символ , наименование ; знак.

алфавит нетерминальных символов: список метапонятий.

аксиома: нетерминальный символ.

знак: символ алфавита ASCII.

слово символ: с , и , м , в , о , л.

наименование: метапонятие.


Порождающая грамматика - это четверка: конечный алфавит терминальных символов, конечный алфавит нетерминальных символов, конечный набор формул подстановок и нетерминальный (целевой) символ - аксиома. Система предложений (утверждений), данная ниже определяет правила построения формул подстановок (правил порождения). Далее формально определяется понятие правила.
правило: метапонятие , символ двоеточия , правая часть , знак границы правила.

метапонятие: последовательность слов.

понятие: метапонятие ; терминальный символ.

слово: буква; слово , буква ; слово , цифра.

правая часть: перечень возможных предложений.

предложение: список понятий.

знак границы правила: символ точки.

последовательность понятий: понятие ; последовательность понятий , понятие.

возможное понятие: пусто ; понятие.

список понятий: понятие ; список понятий , символ запятой , понятие.

перечень понятий: понятие; перечень понятий , символ точки с запятой , понятие
Терминальные символы задаются своими наименованиями и кодами, которые определяются формально с помощью порождающей грамматики. Если код знака не задан, то подразумевается код этого знака в алфавите ASCII.
таблица кодов терминальных символов: перечень соответствий.

соответствие: терминальный символ , символ равно , код.

код: целое число ; код целого числа.

код целого числа: # целое число.



целое число: последовательность цифр.
Код целого числа задается знаком # и целым числом десятичной системы счисления. Символы букв и цифр не представлены в грамматике в силу их понятности и известности.
В качестве примера формального определения можно рассмотреть сам метаязык или язык Марков, предназначенный для синтаксического определения формы порождающей грамматики и его ввода в память Интеллсист для реализации генерации тестов проверки транслятора ФЯ или ЯПП. Синтаксис определяет КС-грамматику. Данное формальное определение является примером самоопределения грамматики с формальной точки зрения. Имя Марков языку дано в силу того обстоятельства, что именно Марковым впервые были исследованы формулы подстановки при построении теории нормальных алгоритмов [Марков84]. Порождающая грамматика применяется для генерации текстов определяемого языка. При практическом использовании языка Марков будут использованы дополнительные правила упрощения записи правил. Например, в правилах опускается символ запятой, если соединяются метапонятия с терминальными символами, которые представлены графически или выделены полужирным шрифтом.
Каждый нетерминальный символ является термином для определения понятия, у которого значениями являются слова, порождаемые грамматикой для этого нетерминального символа. Каждое метапонятие является именем подъязыка определяемого языка. В формальном определении языка Марков отсутствуют средства указания аксиомы, поэтому инициализация генератора должна сопровождаться метапонятием, являющимся аксиомой. В частности это может быть основное метапонятие, которое именует весь язык. Весь язык Марков определяет набор метапонятий, термины которых находятся слева от двоеточия в каждом правиле, число метапонятий (без одного) определяет количество подъязыков. Конечно, необходимо учитывать, что для одного термина написано несколько правил. Поэтому для определения понятия необходимо использовать всю совокупность правил, у которых левая часть имеет один и тот же термин.
В заключение сделаем некоторые замечания. Аналогично можно построить грамматику для контекстно-зависимого языка. Отличие контекстно-зависимой грамматики от КС-грамматики состоит в том, что левая часть правил может состоять из списка предложений из метапонятий и терминальных символов. Символ пробела используется при построении предложений правил грамматики для выделения слов. Однако формализм не предусматривает использование символа пробела. Это сделано для экономии записи грамматики. Считается, что слова автоматически разделяются пробелами для упрощения процедуры распознавания слов. В одном месте символ пробела используется для отделения слов (разделитель слов), в других местах символ пробела не обязателен, хотя по тексту он проставлен во многих местах. Сказанное можно отнести к прагматике языка Марков. Терминальный символ может быть задан в правилах знаком. В текстах правил используется одно допущение: в списках понятий некоторые запятые опускаются. Если символ представлен знаком или словами из полужирного шрифта, то он не отделяется от слова запятой, как было сказано выше. В качестве знаков не могут использоваться символы двоеточия, запятой, точки и точки с запятой и точки, они несут синтаксическую нагрузку в правилах.
Если заданы значения отдельных слов [терминов] и правила синтаксиса, то определено значение всей фразы.

Б. Рассел

Каталог: files
files -> Чисть I. История. Введение: Предмет философии науки Глава I. Философия науки как прикладная логика: Логический позитивизм
files -> Занятие № Философская проза Ж.=П. Сартра и А. Камю. Философские истоки литературы экзистенциализма
files -> -
files -> Взаимодействие поэзии и прозы в англо-ирландской литературе первой половины XX века
files -> Эрнст Гомбрих История искусства москва 1998
files -> Питер москва Санкт-Петарбург -нижний Новгород • Воронеж Ростов-на-Дону • Екатеринбург • Самара Киев- харьков • Минск 2003 ббк 88. 1(0)
files -> Антиискусство как социальное явлеНИе
files -> Издательство
files -> Список иностранных песен
files -> Репертуар группы


Поделитесь с Вашими друзьями:
1   2   3   4   5   6   7   8   9   ...   23


База данных защищена авторским правом ©uverenniy.ru 2019
обратиться к администрации

    Главная страница