Интеллектуальные диалоговые ис
Содержание
Диалоговые системы
Диалоговая система обеспечивает решение задач в режиме диалога пользователя с экономико-математической моделью. Под диалогом понимается поочередный обмен сообщениями между пользователем и моделью в соответствии с установленным языком и формой общения в темпе, соизмеримом с темпом обработки данных менеджером. Режим диалога связан с вмешательством пользователя в процесс решения модели, вызывающим ответную реакцию процесса, и относится к так называемым интерактивным режимам, а диалоговая система, соответственно, является интерактивной системой. Характерной чертой диалоговой системы является ориентация на создание так называемого дружественного интерфейса, основу которого составляют следующие факторы: гибкость диалога, т. е. способность системы учитывать различные потребности и уровень квалификации пользовате-
лей; ясность поведения системы для пользователя в любой стадии диалога; простота пользования; простота обучения работе с системой; доступность системы в любой необходимый пользователю момент; обеспечение идентификации и защиты данных; самостоятельность, т. е. способность системы самостоятельно разбираться в «нештатных» ситуациях.
Эти факторы, а также требования конечного пользователя и специфика проблемной области, на которую ориентирована диалоговая система, отражаются в ее структуре и составе.
Диалоговая система в широком смысле состоит из компонентов двух типов — прикладных и диалоговых. Прикладные компоненты (прикладные и системные программы, базы данных и знаний, соответствующие системы управления ими) обеспечивают обработку
и хранение информации в ходе решения задачи. Диалоговые компоненты (средства ведения диалога и лингвистическая подсистема) реализуют связь пользователя с прикладными компонентами в процессе решения требуемой задачи. Диалоговые компоненты, собственно, и обеспечивают диалоговый режим взаимодействия пользователя с компьютером и образуют диалоговую систему в узком смысле.
Форма диалога определяется применяемыми в интерактивной системе средствами общения пользователя с компьютером, к которым относятся не только аппаратная часть, но и используемые программное обеспечение, формулировка задачи, метод решения, представление решения (графическое, табличное).
Совокупность шагов, записанная на специальном языке, образует сценарий диалога. Язык описания диалога содержит: специальные конструкции, обеспечивающие описание шага диалога с учетом используемого формата; операторы нескольких типов, обеспечивающие изменение значений переменных, вывод сообщений, вызов функций и инициализацию поддиалогов или управляющие переходами от одного шага к другому.
Для создания сценариев диалога используется специальный компонент — генератор сценариев, позволяющий в интерактивном режиме создавать и редактировать сценарии, а также генерировать реализующие их программы.
Диалоговые системы в узком смысле используются в различных автоматизированных системах обработки информации и управления, обучающих человеко-машинных системах, превращая их таким образом в диалоговые системы в широком смысле.
Для реализации эффективных диалоговых систем необходимо использовать не только перечисленные выше компоненты, но и соответствующее математическое обеспечение. Это требование связано с тем, что экономико-математическое моделирование практически всегда ведется в диалоговом режиме.
Интерактивные методы решения задач, применяемые в экономико-математическом моделировании, заключаются в том, что вычислительный процесс начинается с некоторого пробного допустимого решения, а затем применяют алгоритм, обеспечивающий
последовательное улучшение этого решения. Процесс таких проб продолжается до тех пор, пока не станет ясно, что: дальнейшее улучшение решения невозможно (достигнут оптимум, причем во многих случаях требуется дополнительно проверить — локальный или глобальный); дальнейшие вычисления нецелесообразны, поскольку возможное улучшение результата не окупит дополнительных затрат (например, затраченного времени).
Сборник 2001
Тартуский университет
- Введение
В первые годы автоматической обработки естественного языка диалог рассматривался, в основном, в рамках двух задач – машинный перевод и вопросно-ответные системы для общения человека с базами данных. Однако, попытки создать естественно-языковый интерфейс к базам данных во многом остались только исследовательской целью и не нашли выхода на практику.
Теперь снова поднялся интерес к моделированию кооперативных диалогов, практическими применениями чего могут являться, например, интерактивные услуги по телефону или через Интернет. В 1998 году под эгидой Ассоциации вычислительной лингвистики (ACL) была создана специальная группа интереса SIGdial (http://www.sigdial.org), соединяющая людей, занимающихся исследованием дискурса и диалога. SIGdial распространяет лингвистические ресурсы и проводит международные семинары, посвященные общению с компьютером на естественном языке (в 2000 году сателлит-семинар конференции LREC в Афинах, семинар SIGdial в Хонг Конге).
В данной статье рассматриваются некоторые проблемы построения естественно-языковой диалоговой системы. Такая система выступает в качестве интеллектуального агента, способного участвовать в естественном диалоге, т.е. общении, происходящем на естественном языке и по правилам общения между людьми.
- Речевые диалоговые системы
Диалоговый компонент в процессе общения человека с компьютером необходим по нескольким причинам. Часто пользователь не выражает свое обращение к системе в виде одного предложения, т.к. это было бы непрактично. Наоборот, он ожидает участия от системы. Кроме этого, диалоговая система должна суметь распознавать речь и исправлять ошибки.
Исследование человеко-машинного общения исторически проходила по двум направлениям – анализ дискурса и конверзационный анализ (Giachin 1996). Анализ дискурса исходит из изучения речевых актов и рассматривает диалог как рациональную кооперацию, предполагая, что высказывания говорящего – правильно построенные предложения. Конверзационный анализ изучает общение как социальную интеракцию, принимая в учет и такие явления, как прерывание связности и резкое переключение фокуса.
Ядром речевой системы общения является управляющий диалогом, который функционирует согласно модели диалога. При этом, применяемая им стратегия может находиться между двумя крайностями – полная свобода пользователя, или диалог, полностью определяемый системой. В первом случае диалог естествен, но имеется опасность неправильно понимать ползователя. Во втором случае анализ реплик пользователя осуществляется проще, но диалоги могут оказаться длинными и недружескими.
В процессе разработки и тестирования диалоговой системы большое значение имеет аннотированный диалоговый корпус, состоящий из диалогов – записей конверзаций между людьми. При этом следует учитывать, что письменные диалоги отличаются от устных, так что, зависимо от целей, нужно собирать либо письменный, либо устный материал, соответственно, из печатных источников (прежде всего, из художественной литературы) или звуковых записей. Корпус дает эмпирический материал и для развития теории диалога.
- Разные модели диалога
При моделировании диалога целью исследователя является создание теории диалога и разработка алгоритмов, действуя по которым, компьютер (диалоговая система) смог бы участвовать в процессе общения с человеком. Имеется три подхода к моделированию диалога (Cohen 1996): 1) диалоговые грамматики, 2) методы, основывающиеся на планах, 3) теории совместного действия.
Диалоговые грамматики исходят из предположения, что в диалоге имеется ряд последовательных регулярностей. Например, вопросу, как правило, следует ответ, предложению – его принятие или отклонение. Диалоговая грамматика обычно представляется в виде порождающей грамматики или автомата состояний. Терминальными элементами грамматики являются названия иллокуционарных речевых актов (вопрос, ответ и т.п.). Нетерминалы описывают разные стадии диалога — открытие, реакцию, закрытие. С помощью диалоговой грамматики, однако, можно выражать только простейшие закономерности диалогового поведения, исходящие из предположения, что высказывания однофункциональны. В действительности же, высказывание может носить несколько функций, например отказ одновременно может оказаться и утверждением.
Модели, основывающиеся на планах, исходят из предположения, что каждое высказывание представляет собой реализацию некоторых коммуникативных действий – речевых актов. В общении люди имеют определенные цели, и они планируют свои коммуникативные действия, чтобы достичь этих целей. Одной целью может являться добивание изменений в ментальном состоянии партнера. Слабостью этого подхода является недостаточная теоретическая база. Например, трудно определить такие понятия, как план, цель, намерение, и точно описывать ментальное состояние участника общения.
Теории совместных действий рассматривают диалог, как процесс, реализуемый общими напряжениями его участников, каждый из которых несет ответственность за его продолжение. Участник общения обязан понять своих партнеров. В общении между людьми это выражается, например, через уточняющие вопросы, обьяснения, утверждения.
- Теория рациональных агентов
Прагматика дискурса и диалога исходит из предположения, что как говорящий, так и слушающий являются рациональными агентами. Теория рациональных агентов рассматривает дискурс и диалог, как поведение, определяемое мнениями, желаниями и намерениями агентов, и ограниченное ресурсами, которые они имеют при себе (Webber 2000). Планирование, т.е. процесс, в котором намерениям говорящего ставятся в соответствие действия, и распознавание плана, т.е. процесс, в котором слушающий понимает намерения говорящего, оба могут рассматриваться как процессы поиска, где делаются выводы в условиях ограниченных ресурсов.
Основной подход к планированию, имеющий свое начало в искусственном интеллекте (Newell, Simon 1963), исходит из предположения, что цель (намерение) вызывает составление плана для ее реализации. Широко известен алгоритм STRIPS (Fikes, Nilsson 1971), выражающий такие признаки намерений и действий, как, например, наличие предусловий и последствий, и обстоятельство, что если мнения агента изменяются, то он может выдвигать новую цель. В настоящее время рассматриваются и более сложные модели, учитывающие, например, следующие обстоятельства (Webber 2000).
1) Мнения планирующего/говорящего могут отличаться от мнений слушающего и оказаться неправильными.
2) В ходе диалога не только проводится действие, но могут обсуждаться и разные возможности его проведения.
3) Диалог предполагает кооперативность участников.
4) Планирующие агенты имеют свои предпочтения, так что способы достижения целей и реализации планов действий могут различаться.
5) Говорящий посредством своего речевого акта может не достигать цели, таким образом, он должен получить обратную связь от слушающего, чтобы давать обьяснения, если это необходимо.
6) В процессе общения происходит передача информации, с целью реализовать определенные намерения.
- Структура диалога
Как уже было отмечено (п. 2), для разработки диалоговой системы желательно иметь диалоговый корпус, в котором были бы аннотированы феномены, интересующие разработчика. Рассматриваем, для примера, корпус MapTask (http://www.cogsci.ed.ac.uk/~jeanc/maptask-coding-html/), состоящий из диалогов, где оба участника имеют чуть разные версии одной и той же географической карты, и один из участников к концу общения должен на своей карте суметь отметить тот же самый маршрут, который вначале был отмечен на карте партнера. Общение происходит между людьми, но посредством компьютера. Здесь применяется трехуровневая система аннотирования. На самом высоком уровне диалог разделяется на трансакции — это поддиалоги, возникающие при решении одной подзадачи. Типичной трансакцией считается поддиалог, в результате которого участник разгадал один участок маршрута. Трансакции, в свою очередь, состоят из диалоговых игр, или смен. Смена – последовательность высказываний, начинающаяся с инициации и заканчивающаяся с достижением цели (или отказом от нее). Типичная смена – вопрос, которому следует ответ, или предложение, которому следует его принятие или отклонение. Смена состоит, как минимум, из двух обращений (реплик) разных участников. Каждое обращение может состоять из одного или нескольких коммуникативных шагов (речевых актов). В корпусе MapTask шаги делятся на инициирующие (предложение, вопрос, обьяснение) и реагирующие (отклонение, ответ).
В проекте МАТЕ (http://mate.nis.sdu.dk), в котором с участием выдающихся исследовательских центров Европы было проанализировано около 60 систем аннотирования диалогов, система, применяемая в MapTask, оценивается, как одна из самых удачных.
В результате проекта MATE был разработан пакет программ, применяемый для аннотирования речевых диалогов на разных уровнях (прозодия, морфосинтаксис, кореференция, диалоговые акты, коммуникативные проблемы, проблемы между разными уровнями). С помощью этого пакета пользователь может либо развивать свою собственную систему аннотирования, либо применять одну из тех, которые включены в пакет. Для аннотирования диалоговых актов в пакет включены (уже упомянутая) система MapTask, система VERBMOBIL (http://verbmobil.dfki.de/verbmobil/), а в качестве возможного будущего стандарта – система DAMSL (http://www.cs.rochester.edu/research/ cisd/resources/damsl/).
- Система аннотирования корпуса диалогов
В Тартуском университете уже в течение нескольких лет происходят исследования в области моделирования диалога. В ряде наших статей представлена модель конверзационного агента, функционирование которого нами до сих пор рассматривалось в рамках одной определенной задачи (Койт 1996, 1999, 2000; Koit 1996; Oim 1996; Koit, Oim 2000a,b). Участники общения – А и Б, и коммуникативной целью А является добиться от партнера решения о выполнении некоторого действия Д. В состав нашей модели входят модель партнера Б – его предполагаемые оценки к разным аспектам действия Д – и модель рассуждения, обе применяемые участником А для прогнозирования решения Б, чтобы А смог выбрать подходящую тактику для достижения своей цели – соблазнение, убеждение или угрожение партнера.
Теперь мы решили расширить нашу модель, чтобы рассматривать информационно-справочные диалоги. Для развития модели диалога с целью построения диалоговой системы нам нужен эмпирический материал в виде диалогового корпуса. У нас уже имеется некоторое количество записанных и литерированных телефонных разговоров, теперь их следует аннотировать. Прежде всего нас интересует структура диалога на уровне речевых актов. Пока мы исходим из следующего представления о структуре диалога.
Диалог состоит из трансакций. Каждая трансакция состоит из одного или нескольких смен, связанных с одной темой. Каждая смена состоит из речевых актов. Смены разделяются на конверзационные и организационные. Конверзационные смены определяют содержание общения, развитие темы. Типичными конверзационными сменами в информационно-справочных диалогах являются пары вопрос – ответ. Организационные смены связывают друг с другом (или разрывают) конверзационные смены. Сменами такого вида являются, например, ритуалы, типично применяемые в начале или конце общения, или исправления, применяемые либо автором, либо адресатом исправляемого речевого акта.
Приведем в качестве примера часть нашей схемы аннотирования в виде порождающей грамматики. (Ф обозначает пустой речевой акт.)
диалог::= трансакция | диалог трансакция
трансакция::= смена | трансакция смена
смена::= организационная-смена | конверзационная-смена
организационная-смена ::= ритуал | исправление
ритуал::= привет обратный-привет | прощание обратное-прощание
исправление::= исправление-от-слушателя | самоисправление
исправление-от-слушателя::= инициирование-исправления проведение-исправления
самоисправление::= переформулирование Ф
конверзационная-смена::= директивная-смена | вопросно-ответная-смена | информирующая-смена
директивная-смена ::= д-первый-член д-второй-член
д-первый-член::= команда | просьба | предложение
д-второй-член::= соглашение | исполнение | отказ
вопросно-ответная-смена::= в-первый-член в-второй-член
в-первый-член::= общий-вопрос | специальный-вопрос
в-второй-член::= да | нет | передача-информации
информирующая-смена::= и-первый-член и-второй-член
и-первый-член::= передача-информации
и-второй-член::= сигнал-о-принятии-информации | Ф
Речевые акты, выступающие в качестве терминальных элементов грамматики, мы собираемся представить в виде фреймов. Каждый речевой акт содержит две части – статическую и динамическую. Статическая (декларативная) часть состоит из 1) предусловий, 2) цели, 3) содержания и 4) последствий речевого акта. Динамическая (процедурная) часть содержит два вида процедур — 1) процедуры, применяемые автором речевого акта для порождения коммуникативного шага, в состав которого будет входить данный акт, и 2) процедуры, применяемые адресатом для интерпретирования этого акта и порождения ответа к нему. Приведем в качестве примера определение речевого акта Предложение (Koit, Oim 2000a).
ПРЕДЛОЖЕНИЕ (выполнить действие Д; автор речевого акта — А, адресат — Б)
- Статическая часть
Предусловия
- А имеет цель Ц
- А считает, что Б тоже имеет цель Ц
- А считает, что для достижения Ц сперва нужно достичь инструментальную цель Ци
- А считает, что Б тоже считает, что для достижения Ц сперва нужно достичь инструментальную цель Ци
- А считает, что необходимое условие для достижения Ци – чтобы Б сделал Д
- А считает, что Б имеет ресурсы для выполнения Д
- А считает, что Б принимает решение выполнить Д
Цель
Б принимает решение делать Д
А скажет Б, чтобы тот сделал Д
Последствия
- Б знает Предусловия, Цель и Содержание
- А знает, что Б знает Предусловия, Цель и Содержание
II. Динамическая часть
Процедуры порождения (возможности А строить обращение, содержащее предложение)
Если А не уверен в Предусловии 2, то добавить сообщение цели Ц
Если А не уверен в Предусловии 4, то добавить аргумент (передача информации) в пользу Ци
Если А не уверен в Предусловии 6, то добавить вопрос
Если А не уверен в Предусловии 7, то добавить аргумент в пользу положительного решения
Процедуры интерпретации-порождения (возможные реакции Б)
Если Б считает, что не выполнены предусловия 2,4,5: вопрос (спрашивать дополнительную информацию)
Если Б считает, что не имеет ресурсы (не выполнено Предусловие 6): отказ (+ аргумент)
Если решение Б отрицательно (не выполнено Предусловие 7): отказ (+аргумент)
- Заключение
У нас уже имеется некоторая программа – диалоговая система (авторами которой являются студентки специальности информатики Тартуского университета М. Кулласаар и Э. Нурмсалу), способная общаться с пользователем на естественном языке и выполнять, по выбору, либо роль А, либо Б в вышеописанной простой коммуникативной ситуации, при этом общение происходит посредством текстов. Как компьтер, так и пользователь выбирают реплики из заданных списков предложений, через меню, т.е. морфологический и синтаксический анализ и синтез не выполняются, а семантический анализ и синтез предельно упрощены с заданием классификации предложений. Таким образом, в нашей диалоговой системе не осуществлены лингвистический процессор и база лингвистических знаний, а интерпретатор и генератор реплик реализованы в самой простой форме. Если до сих пор мы ограничились моделированием процесса аргументации, то в дальнейшем мы собираемся расширить нашу модель, чтобы применить ее в области информационно-справочных диалогов. Наша ближайшая задача — составление диалогового корпуса, для аннотирования которого мы предполагаем применить программное орудие проекта MATE и вышеописанную грамматику речевых актов.
>Благодарность
Работа выполнена при частичной финансовой поддержке Эстонского научного фонда (грант 4555).
Литература
(Koit 1996) Koit, Mare. Implementing a dialogue model on the computer. In: Estonian in the changing world. Ed. H. Õim. Tartu. 99-114.
(Койт 2000). Койт, Маре. Тренировка общения с помощью компьютера: об одном применении модели диалога. Тр. Международного семинара Диалог’2000 по компьютерной лингвистике и ее приложениям. Протвино. Т.2, с. 182-188.
(Койт 1999) Койт, Маре. Управление процессом общения в диалоговой системе. — Тр. Международного семинара Диалог’1999 по компьютерной лингвистике и ее приложениям. Таруса. Т.2, с. 124-129.
(Койт 1996) Койт, Маре. Моделирование воздействия на партнера в человеко-машинном диалоге. – Новости искусственного интеллекта. Москвa. Т.2, с. 79-86.
Размещено на http://www.allbest.ru/
Введение
Глава 1. Диалоговые системы как одно из направлений компьютерной лингвистики
1.1 Общие представления о диалоговых системах. Понятие диалога
1.2 Характеристики диалоговых систем и их типы
1.3 Сценарный подход в создании диалоговых систем
1.4 Система управления и база лингвистических знаний в диалоговой системе
Выводы к Главе 1
Глава 2. Интеллектуальные диалоговые системы с интерфейсом на естественном языке. Речевые диалоговые системы
2.1 Интеллектуальный интерфейс и его типы
2.2 Цели использования естественного языка
2.3 Структура диалоговой ИС и её компоненты
2.4 Речевые диалоговые системы. Способ и система для предоставления речевого интерфейса
2.5 Эксперимент
Выводы к Главе 2
Заключение
Введение
Сфера компьютерной лингвистики многогранна. Она включает в себя компьютерное моделирование общения, моделирование структуры сюжета, гипертекстовые технологии представления текста, машинный перевод, компьютерную лексикографию. Компьютерная лингвистика имеет непосредственное отношение к дисциплине «искусственный интеллект» и обе эти дисциплины занимаются таким прикладным направлением, как «обработка естественного языка». В широком смысле, компьютерная лингвистика ставит своей целью использование математических моделей для описания естественных языков.
Среди компьютерных систем обработки естественного языка обычно рассматривают вопросно-ответные системы, диалоговые системы решения задач и системы обработки связных текстов. В данной работе речь пойдет о диалоговых системах (или о вопросно-ответных системах) и их разновидностях.
Глава 1. Диалоговые системы как одно из направлений компьютерной лингвистики
1.1 Общие представления о диалоговых системах. Понятие диалога
В диалоговых системах речевые акты должны быть оформлены соответствующим образом, поскольку они составляют компонент человеческого общения, а также являются не менее важным аспектом спонтанного общения. Диалоговые системы — неотъемлемая составляющая интеллектуальных компьютерных систем, служащих для переработки информации. Именно с их помощью осуществляются практически все процессы внутри системы. Основным требованием диалоговых систем является обеспечение более удобной и естественной формы взаимодействия интеллектуальных систем с пользователями. Другими словами — это системы с естественно-языковым интерфейсом.
Среди систем обработки естественного языка обычно выделяются вопросно-ответные системы, диалоговые системы решения задач и системы обработки связных текстов.
Что же собой представляет диалог?
В целом, процесс так называемого «общения» человека с компьютерной системой можно назвать диалогом. Но дадим более общее представление этому понятию.
Диалог — это процесс обмена сообщениями между пользователем и компьютером. В диалоге постоянно происходит смена ролей информатора и пользователя, к тому же, смена ролей должна быть достаточно оперативной.
Приведем ряд условий, необходимых для осуществления процесса диалога:
— общая цель пользователя и информатора;
— смена ролей пользователя и компьютера;
— общий язык общения;
— наличие общей базы данных;
— возможность пополнения базы.
Реакция системы на входной текст определяется не только самим текстом, но и возможностями и знаниями системы. В случае, если входной текст не соответствует возможностям и знаниям системы, система, соответственно, не может сообщить ему интересующую его информацию. Чтобы пользователь мог понять причины несоответствия, система должна в виде косвенного ответа объяснить причину своих затруднений. .
1.2 Характеристики диалоговых систем и их типы
Диалоговые системы можно классифицировать следующим образом:
— меню-диалог;
— диалог типа «вопрос-ответ»;
— диалог на основе шаблонных форм;
— профессиональный диалог;
— графический диалог;
— диалог на естественном языке
Выделим несколько характеристик, которые определяют процесс диалогового взаимодействия пользователя и компьютера.
Наиболее важной характеристикой является степень оперативности диалога. Оперативность может быть двусторонняя или односторонняя — со стороны компьютера или со стороны человека. Первый вариант диалога является активным, второй — пассивным.
Другой характеристикой диалоговых систем является способность к управлению. Это способность выражается в выдаче партнеру таких команд, которые требуют выполнения конкретных действий, направленных на достижение цели диалога.
В ходе диалога возможно двустороннее управление типа «запрос — ответ», одностороннее управление со стороны компьютера с языком общения типа «меню», «заполнение шаблона» или же одностороннее управление со стороны пользователя с использованием языка команд.
Важной деталью является способность партнеров к накоплению знаний о предметной области и наличие единого языка взаимодействия.
Также важно наличие средств защиты информации в системе.
Существующие в настоящее время диалоговые системы можно разделить на два типа:
— с запрограммированным диалогом, ограниченным одной предметной областью;
— настраиваемые на различные классы задач на основе описаний предметной области, что предоставляет пользователю весьма широкий спектр возможностей.
Следует отметить, к тому же, что по типу сложности языка общения выделяют системы с формализованными языками и с естественными языками.
1.3 Сценарный подход в создании диалоговых систем
Сценарий определяется как структура представления знаний в системах искусственного интеллекта, которая используется для описания последовательности связанных событий и определяющая совокупность способов достижения цели в конкретной ситуации заданной предметной области.
Факторы, определяющие организацию диалога:
— способ описания сценария;
— форма и структура диалога;
— возможность описания сценария;
— способы сохранения и восстановления состояния диалога.
Сценарий диалога может входить в диалоговую систему или же истолковываться ею.
Общая схема действий диалоговой системы может быть сформулирована следующим образом:
— вывод сообщений (вопросов) системы;
— ввод сообщений пользователя;
— запуск функций, выбираемых в соответствии с запросами пользователя и выбранными условиями;
— выбор дальнейших путей продолжения (или же окончания) диалога. .
Сценарии могут быть двух типов — одноуровневыми и вложенными. Связь элементов в одноуровневом сценарии осуществляется посредством безусловных и условных переходов. Вложенные сценарии вызывают подсценарии, для чего в соответствующем макроэлементе вместо ссылки на очередной элемент задается ссылка на подсценарий. При обработке макроэлемента выполняется рекурсивный вызов интерпретатора сценариев, сохраняется состояние диалога, загружается подсценарий, осуществляется его интерпретация и после его завершения восстанавливается прежнее состояние. Для организации вложенных сценариев используются средства сохранения и возобновления состояния диалога, которые используются также для приостановки диалога с его восстановлением с прерванного или выбранного места. .
1.4 Система управления и база лингвистических знаний в диалоговой системе
Основой диалоговой системы является банк знаний о языке, который состоит из базы лингвистических знаний (БЛЗ) и системы управления.
В свою очередь, в состав БЛЗ входят тезаурус и словарная компонента. Тезаурус содержит синтаксические и семантические отношения между языковыми единицами, входящими в состав словарной компоненты. Словарная же компонента выглядит как система словарей языковых единиц различных уровней: текстов, сверхфразовых единств и предложений, слов, словосочетаний, а также основ слов и аффиксов. Основным является лексический словарь, который содержит описание множества слов или основ слов, характеризующих предметную область диалога.
Система создания БЛЗ решает три группы задач:
1) выявляет и составляет структуры хранения лингвистических знаний;
2) наполняет выбранные структуры общими знаниями о языке общения, языке представления знаний, диалоге и формирует естественно-языковое описание предметной области диалога;
3) решает задачи пополнения БЛЗ конкретными знаниями о подъязыках пользователях.
Важнейшими факторами структуры БЛЗ являются
— характеристика языка;
— наличие прототипа создаваемой системы;
— тип языка представления знаний в интеллектуальной компьютерной системе.
При наполнении баз лингвистических знаний можно столкнуться с рядом трудностей, ведь словарная компонента диалоговых систем различного назначения включает огромное количество словарных статей языковых единиц.
Средства создания и наполнения в автоматизируют работу и сам процесс ввода знаний в БЛЗ. Автоматизированное наполнение БЛЗ позволяет ввести лишь часть знаний о языке диалога. При этом задействованы лингвистический процессор, различные процедуры информационных технологий и специальные программные средства. .
Наполнение словарной компоненты состоит из следующих шагов:
1. Сначала происходит формирование описания предметной сферы диалога на естественном языке, при этом учитываются информационные потребности пользователей.
2. Затем выделяется множество языковых единиц с помощью специальных процедур.
3. В свою очередь определяются индивидуальные базы данных языковых единиц и занесение их в БЛЗ.
4. Устанавливаются синтаксические, семантические и ситуативные отношений между языковыми единицами.
5. В конечно итоге происходит анализ полученных результатов специалистом, внесение изменений и поправок.
По способу организации взаимодействия выделяют системы с приоритетным взаимодействием и без приоритетного взаимодействия. Системы без приоритетного взаимодействия отличаются случайным характером ведения диалога и малой степенью его организованности.
Выводы к главе 1
Диалоговые системы существуют как составляющая компьютерной лингвистики.
В более узком понимании диалог — один из режимов обработки данных, предусматривающий взаимодействие человека и интеллектуально системы.
Современным способом работы компьютером является диалоговый, при котором пользователь управляет его работой, сообщает необходимую информацию и делает запросы о ходе работы.
Диалоговые системы играют важную роль в коммуникации, поскольку их задача заключается в получении решения проблемы на основе знаний, представленных в самой системе, и информации, полученной от пользователя. Система содержит структуры знаний, в которых фиксируются стандартные последовательности действий для решения задач в конкретной проблемной области, а также информацию о необходимых ресурсах. Когда пользователь задает вопрос или ставит определенную задачу, активизируется соответствующий сценарий.
Глава 2. Интеллектуальные диалоговые системы с интерфейсом на естественном языке. Речевые диалоговые системы
2.1 Интеллектуальный интерфейс и его типы
Интеллектуальный интерфейс делится на внутренний и внешний. При внутреннем образуется связь между интеллектуальными устройствами и интеллектуальными программами. Внешний — это интеллектуальный интерфейс, а точнее, совокупность интеллектуальных программных средств, позволяющих пользователю взаимодействовать с системой. В структуре интеллектуального интерфейса выделяется диалоговая компонента. Функции диалоговой компоненты осуществляют семантический и синтаксический анализ естественного языка. Цель диалоговой компоненты — организация диалога «пользователь — интеллектуальный интерфейс», обозначение функций участников общения в ходе совместного решения задачи.
2.2 Цели использования естественного языка
Существуют различные виды диалогов. Диалог, управляемый системой, лучше подстраивается под пользователя, но при этом имеет больше ограничений, чем диалог, управляемый пользователем. Для построения диалогов, управляемых системой, часто используются сообщения на ограниченном естественном языке. При его использовании распознается только небольшое количество слов.
Цель использования естественного языка — удобное для пользователя ведение диалога с системой. Такая система реагирует на любую фразу или синтаксическую конструкцию, которая понятна человеку. Используя ограниченный или неограниченный естественный язык, в определенной предметной области, наиболее удобен обоюдный способ ведения диалога.
В диалоговых системах специфика предметной области, как правило, сильно ограничивает состав используемых понятий, способы интерпретации понятий, лексику языка и тому подобное, что, в свою очередь, упрощает задачу обработки естественного языка. Поэтому появляется возможность говорить об использовании неограниченного естественного языка. Сложность методов анализа и синтеза естественного языка зависит от языка общения и от языка, применяемого для представления знаний. На начальном этапе диалога язык общения может быть жестко формализован конкретным набором запросов системы и множеством различных ответов пользователя. Обработка сообщений пользователя сводится к анализу входных сообщений. В этих условиях задача синтеза сводится к генерации заранее подготовленных вопросов, а задача анализа — к обработке слов, словосочетаний и предложений. .
Минимум, который должна выполнять интеллектуальная диалоговая система:
— должна уметь поддерживать беседу на заданную тему.
— иметь механизм самообучения.
— уметь конструировать ответ на естественном языке, а не просто выдавать шаблонный ответ.
Наличие тех или иных умений должно быть обусловлено сферой применения системы.
2.3 Структура диалоговой ИС и её компоненты
Архитектура диалоговой ИС с ея-интерфейсом может быть изображена следующим способом. (Рис. 2).
Теперь распишем все действия последовательно.
Графематический компонент выполняет начальный анализ естественного текста. На входе вводится исходный текст. На выходе анализатор строит таблицу, разделяет входной текст на слова и разделители.
Рисунок 2.
После графематического анализа к работе приступает морфологический компонент. Он приписывает лексемам морфологическую информацию и производит их лемматизацию.
По результатам морфологического анализа проводится фрагментационный анализа текста, который делит предложения на фрагменты и устанавливает связи между ними.
После начинается синтаксический анализ. Его задачей является выявление синтаксической связи между двумя лексемами, разбиение лексем на множество главных слов и множество зависимых слов и формирование множества сочетаемых пар лексем. Как результат, синтаксический анализ определяет все синтаксические конструкции естественно-языкового предложения и объединяет элементы синтаксическими связями.
После синтаксического анализа проводится семантический анализ. В ходе анализа текста строится его семантическое представление, которое представляет собою связный ориентированный граф, состоящий из семантических узлов и отношений между ними.
Для записи семантики используется специальный информационный язык-посредник. Элементарное высказывание на этом языке фиксирует семантическое отношение между двумя семантическими узлами.
Семантическое отношение организует текст, а также выражает связи между частями текста.
Затем, после построения семантического представления запроса, в работу вступает алгоритм определения ключевых слов, которые несут основную смысловую нагрузку в предложении.
В результате работы в предложении выделяется цепочка слов, по которой производится поисковый запрос в базу знаний.
В свою очередь, база знаний построена на основе интеллект-карт.
Интеллект-карты — представление процесса мышления или структурирования информации в виде схемы.
Рассмотрим два типа интеллект-карт.
Карта первого типа — карта запроса. Она представляет собой описание пути к сценариям диалогов, хранящимся в системе и их запуск. В центре карты запроса размещено слово-существительное — главное слово.
От главного слова отходят ветви, соединяющие его с узлами-действиями, представленными глаголами. Узлы обозначают действия, которые можно произвести с главным словом. От глаголов отходят ветви, соединяющие их с уточняющими членами предложения.
Карты второго типа — карты диалогов. Карта диалога представляет собой последовательность вопросов, которые будут заданы пользователю с целью уточнить детали его запроса и дать ответ на поставленный вопрос.
С помощью интеллект-карт процесс создания диалогов происходит значительно проще. Пользователю не требуется знаний программирования, чтобы создать сценарий диалога.
Если в ходе работы пользователь не получит ответ на заданный вопрос, то он отключается от режима диалога и адресует запрос к эксперту на форуме.
Таким образом, использование ЕЯ-интерфейса позволяет точно находить и включать сценарии диалогов для определения ключевых слов запроса и их использования для поиска.
2.4 Речевые диалоговые системы. Способ и система для предоставления речевого интерфейса
Речевые интерфейсы пользователя, с одной стороны, обладают рядом преимуществ, а именно: естественность, оперативность, смысловая точность ввода, и, в дополнение ко всему, освобождение рук и зрения пользователя. А с другой стороны имеют и ряд ограничений: язык пользователя должен быть доступен и понятен системе, к тому же, пользователь не может знать обо всех возможностях системы. В процессе взаимодействия с компьютером, пользователю необходимо быстро улавливать информацию, так как речь носит быстротечный характер восприятия.
Эксперимент
Рассмотрим диалоговые системы в компьютерных видео играх. Обычно ДС распространены в таких жанрах игр как стратегии (RTS), ролевые (RPG), экшены (Action) и различные другие жанры.
Самый распространенный жанр игр с ДС — это RPG,его мы и рассмотрим более подробно.
Обычно все игры данного жанра начинаются с создания персонажа (или персонажей), за которого мы будем проходить всю историю. В основном, никаких текстовых или звуковых команд задавать не требуется, максимум, что необходимо сделать — ввести номер определенных выражений лица или же цвета волос и т. д. После того как наш персонаж создан, мы вводим его псевдоним (ник), который будет отображаться в записках-заданиях (квестах) и применяться в различных диалогах.
Итак, начинаем проходить саму игру и разбирать различные виды диалогов. С самого начала нам предлагают разобраться с управлением ,интерфейсом и окружением. Обычно, после обучения нам необходимо подойти к внутреигровому персонажу (NPC) и получить первое задание (квест). В зависимости от тематики игры, бюджета разработчиков и нацеленности на определенную аудиторию игроков, диалоги могут быть грамотно выстроены, полны различных деталей или же скупы на слова и упрощены. Квесты делятся на первостепенные и второстепенные. Первостепенные необходимо выполнять, чтобы понять весь смысл игры и закончить ее, а второстепенные проходятся для различных целей, награда за них обычно дается в виде игровой валюты или же опыта или различного игрового контента. Выполнение второстепенных квестов обычно не способствует прохождению игры и не раскрывает сам сюжет, поэтому они часто повторяются и упрощаются.
Рассмотрим первостепенные квесты. В этих заданиях мы получаем много полезной информации, которая упрощает прохождение сюжета. Эти задания строятся под видом диалогов и могут содержать варианты ответов игрока, которые он выбирает сам. В различных играх свои системы ведения диалогов, но они зачастую похожи друг на друга. При выборе определенного действия или ответа на заданный игроку вопрос, пути прохождения игры меняются, меняется «характер» персонажа, так же может измениться отношение внутреигровых персонажей (NPC) к игроку. Характер, как правило, может быть нескольких видов. Например, в игре Dragon Age 2 вариантов характера три: Дипломат (подсветка значков в диалоге светло-голубая или зеленая), Шутник (подсветка значков фиолетовая), и Агрессор (подсветка значков красная). В зависимости от выбранного характера меняются реплики, которые персонаж произносит без нашего участия, боевые выкрики, фразы, произносимые в процессе передвижения по карте, а также диалоговые опции, не имеющие интонации (например, флирт). Характер нашего персонажа обычно определяет первое же интонационное высказывание, в первом диалоге. Если мы продолжим выбирать ту же интонацию (тональность) в последующих диалогах, то через некоторое время характер фиксируется и до конца главы (акта) или всей игры остается неизменным. Если же мы решаем поменять линию поведения, то количество реплик другой интонации должно быть минимум в два раза больше, чем реплик предыдущей интонации.
Рассмотрим игру The Sims. Дизайнеры экспериментировали с общением с помощью символов. В этой игре мы выбираем не конкретные варианты ответа, а действия и тон разговора. В отличие от фраз живого языка, для таких простых понятий, как «смех», «оскорбление» или «презрение», гораздо проще построить набор правил для взаимодействия, которые игрок может комбинировать более сложным образом, чем в случае с диалоговыми деревьями, которые обычно используются.
Такие схемы в RPG не прижились. Символам не хватает конкретности фраз, возможности выражать тонкие смысловые оттенки. Этот недостаток они унаследовали от ключевых слов, и именно его должны были истребить диалоговые деревья. В Fable нам позволялось совершать те или иные символические действия с NPC, но им не хватало эмоционального заряда, который несет обычная речь. В сравнении с озвученными диалогами той же игры эти действия казались лишенными особой смысловой нагрузки. Манипуляция переменными, стоящая за этими символами, также была неестественной, как и в мини-игре «Убеждение» в Oblivion. Хороший писатель мог бы сочинить захватывающий диалог, дающий игроку возможность льстить, угрожать, хвастаться и шутить, однако пошаговый выбор односложных вариантов из меню выглядит очень неубедительно.
Некоторые пытались создать комбинированную систему: диалоговые деревья, позволяющие вместо конкретной фразы выбрать тон, в котором будет произнесена реплика. Такой вариант использовался в Bard’s Tale (где были «ехидный» и «добрый» варианты ответа) и Mass Effect, нечто подобное есть и в Alpha Protocol, где можно выбирать между архетипами педантичного, вежливого или агрессивного агента. Проблема таких систем заключается в том, что они, будучи основанными на диалоговых деревьях, в лучшем случае предлагают минимум гибкости, а в худшем — заставляют героя отвечать совсем не так, как ожидал игрок. Да, мы выбрали «оскорбительный тон», но уж никак не собирались выхватывать пистолет, приставлять его к голове собеседника и затевать большую драку. Проблема в том, что, подобно ключевым словам, каждая интонация сама по себе — весьма широкая категория. Под «оскорбительным тоном» можно понимать довольно обширный спектр фраз и действий. Однако, в отличие от ключевых слов, диалоги с выбором тона остаются диалоговыми деревьями, и не добавляют гибкости, свойственной символическим системам, как в The Sims. Динамической беседы такая система не породит. Подобные гибриды приемлемы разве что для тех, кто стремится упростить процесс принятия решений для аудитории, не любящей читать, или освободить место на экране для драматических ракурсов и красивых спецэффектов. Гораздо лучше скомбинировать систему интонаций с ключевыми словами. Вместо того, чтобы просто задать вопрос на определенную тему и получить ответ, мы можем спросить о волнующем нас предмете в том или ином тоне. В зависимости от того, как NPC к нам относится, как мы к нему обратились и чем поинтересовались, мы можем получить разные ответы. Попытка организовать динамические диалоги таким образом была предпринята в Daggerfall, хотя потенциал этого метода не был раскрыт полностью. Однако, возможно, именно Daggerfall со своим сочетанием процедурно генерируемых текстов с авторскими, представляет самое перспективное направление для развития диалоговых систем в RPG, позволяющее игроку самовыражаться, а дизайнеру — передавать тонкие оттенки смысла.
Выводы к главе 2
Основная задача диалогового процесса — определить задание, которое пользователь возлагает на систему. Важно учитывать правила ведения диалога с компьютером.
Разработка интеллектуального интерфейса направлена на соответствие физических возможностей системы запросам человека, согласования стиля диалога с потребностями и представлениями человека.
Говоря о речевых диалоговых системах, нужно отметить, что существующие модели автоматического понимания речи пока еще далеки от понимания речевых возможностях человека. Для того, чтобы разработать подходящие и удобные в использовании разговорные диалоговые системы, необходимо учитывать как технологии передачи, распознавания и синтеза речи, корректное понимание языка, управление диалогом, так и учёт всех составляющих информационного обмена между людьми, позволяющие организовывать взаимодействие компьютера с человеком на естественном языке. Диалоговые системы будут эффективны при условии, если будут привычными для пользователя и адаптированы к нему.
диалоговый лингвистика интеллектуальный интерфейс
Заключение
В настоящее время все сферы компьютерной лингвистики активно развиваются. С усложнением требований человека к компьютерным системам появляется необходимость дополнять и совершенствовать диалоговые системы.
Рассматриваемые в данной курсовой работе диалоговые системы дают нам представление об искусственном интеллекте в целом. Понимание диалоговых систем может обеспечить понимание алгоритмов действий компьютерных систем.
Диалоговые системы упрощают процесс поиска информации, а также работы с интеллектуальными системами. К тому же, с появлением речевых диалоговых систем процесс работы с интеллектуальными системами стал доступен не только людям, разбирающимся в них, но и простым обывателям.
Единственным недостатком является тот факт, что искусственный интеллект не полностью доработан, и при работе с диалоговыми системами могут возникнуть различные ошибки, например нарушения алгоритмов, ошибки сценариев и т.д.
В заключение хочу добавить, что с развитием искусственного интеллекта могут появиться диалоговые системы, которые будут осуществлять процесс работы посредством мысленных команд пользователя, что может дать науке практически неограниченные возможности.
Список литературы
1. Довгялпо A.M. Диалог пользователя ЭВМ. Основы проектирования и реализации. Киев: Наук, думка, 1981. 232 с.
2. Черкасова Г.А. Формирование баз лингвистических знаний с использованием технологии ассоциативного эксперимента// Третья всесоюзная конференция по созданию Машинного фонда русского языка: Тез. докл.(Часть 1). — М.,1989.-с.197-199
3. Попов Э.В. Общение с ЭВМ на естественном языке. — М.: Наука. Главная редакция физико-математической литературы, 1982.- 360 с.
4. Попов Э.В. Искусственный интеллект в трех книгах. Книга 1. Системы общения и экспертные системы. Справочник. — М.: Радио и связь, 1990.- 464с.
5. Пиотровский Р.Г. Математическая лингвистика. — М.: Высшая школа, 1977.- 383 с. с ил.
6. Всеволодова А.В. Компьютерная обработка лингвистических данных : учеб.пособие/А.В. Всеволодова. — 2-е изд., испр. — М.: Наука : Флинта, 2007. — 96 с.
7. Никонов В.О. Диалоговая интеллектуальная система с естественно-языковым интерфейсом. Диссертация.: 2007. — 138 с.
8. Филиппович Ю.Н. Интеллектуальные технологии и системы. Сборник учебно-методических работ и статей аспирантов и студентов. Выпуск 8 / Сост. и ред. Ю.Н. Филипповича. — М.: НОК «CLAIM»,2006. — 326 с
Размещено на Allbest.ru
Добавить комментарий