Создание гибридной системы диалогового взаимодействия на естественном языке, способной к самообучению, самостоятельному принятию решений и прогнозированию, на основе обработки больших данных, глубоких нейронных сетей и искусственного интеллекта


Соглашение о предоставлении субсидии № 075-02-2018-243 от 26.11.2018

Уникальный идентификатор проекта: RFMEFI57518X0178

Научный руководитель: к.т.н. С.А. Новоселов

Творческий коллектив: 52 человек, включая 2 докторов наук, 10 кандидатов наук

Заказчик: Министерство науки и высшего образования Российской Федерации

Индустриальный партнер: ООО «ЦРТ»

Цель работы: Разработка ПД на ЭО ПК ГДС, обеспечить его экспериментальные исследования в режимах «Виртуальный ассистент» и «Суфлер» и передать результаты ПНИ Индустриальному партнеру для проведения ОКР на внедрение ГДС в продуктовую линейку диалоговых систем.

Работы выполненные на первом этапе работ:

Работы Получателя за счет средств гранта

  1. Выполнение аналитического обзора современной научно-технической, нормативной, методической литературы, затрагивающей научно-техническую проблему, исследуемую в рамках ПНИ, в том числе обзор научных информационных источников: статьи в ведущих зарубежных и (или) российских научных журналах, монографии) — не менее 15 научно-информационных источников за период 2012 – 2017 гг.
  2. Выбор и обоснование языконезависимых методов автоматического построения системы диалогового взаимодействия с интерфейсом на естественном языке:
    1. Методы автоматической предобработки корпуса диалогов, предназначенные для выделения значимых именованных сущностей, очистки корпуса от мусорных (неинформативных) фрагментов, а также автоматизированного построения сценария диалога.
    2. Методы автоматического обучения нейросетевой диалоговой модели по неразмеченному корпусу диалогов, обеспечивающие возможность автоматического формирования ответа на вопрос пользователя, не входящий в обучающий корпус диалогов (в том числе когда ответ на вопрос зависит от предшествующей истории диалога).
    3. Методы автоматического определения достоверности ответа, возвращаемого диалоговой системой, предназначенные для эффективного отсечения ошибочных ответов системы.
    4. Методы построения гибридной диалоговой модели, объединяющие диалоговый сценарий и нейросетевую модель диалога для повышения эффективности системы.
    5. Методы самообучения модели диалога в процессе использования диалоговой системы, предназначенные для автоматического добавления в гибридную модель диалога новых тематик обращений клиентов, а также для учета реакции пользователей системы.

Работы Получателя, выполняемые за счет средств Индустриального партнера

  1. Выбор и обоснование языконезависимых методов автоматического построения системы диалогового взаимодействия с интерфейсом на естественном языке:
    1. Методы обновления информации в модели диалога, обеспечивающие актуализацию данных, содержащихся в возвращаемом системой ответе на вопрос пользователя.
    2. Методы оценки эмоционального состояния пользователя системы и учета этой оценки в решениях, принимаемых системой в ходе диалогового взаимодействия.
    3. Методы принятия решений о целесообразности выполнения системой ряда действий, повышающих автоматизацию процесса обслуживания, по результатам диалогового взаимодействия на основе нейросетевого прогнозирования.
  2. Анализ целесообразности применения ранее разработанных программ.
  3. Разработка и согласование с ИП Комплектности ПД.
  4. Проведение патентных исследований в соответствии с ГОСТ 15.011-96 в части оценки технического уровня и тенденций развития объекта хозяйственной деятельности.

Работы Индустриального партнера, выполняемые за счет собственных средств из внебюджетных источников

  1. Участие в мероприятиях, направленных на освещение и популяризацию промежуточных результатов ПНИЭР (конференции, семинары, симпозиумы, выставки и т.п., в том числе, международные).
  2. Ресурсное (материально-техническое) обеспечение исследований.
  3. Подготовка текстового корпуса диалогов.

Получены следующие результаты:

  1. Аналитический обзор научно-технической литературы, а также проведенные патентные исследования по теме ПНИ, выявили ряд современных подходов к решению поставленных задач, но в то же время показали, что все существующие инструменты и методы не позволяют достичь необходимой эффективности в решении задачи построения диалоговой системы на естественном языке.
    Использование наиболее успешных современных подходов и проведение теоретических исследований, учитывающие специфику задачи ПНИ, позволили произвести выбор и обоснование следующих групп методов поиска автоматического построения системы диалогового взаимодействия с интерфейсом на естественном языке:
    • методы автоматической предобработки корпуса диалогов, предназначенные для выделения значимых именованных сущностей, очистки корпуса от мусорных (неинформативных) фрагментов, а также автоматизированного построения сценария диалога;
    • методы автоматического обучения нейросетевой диалоговой модели по неразмеченному корпусу диалогов, обеспечивающие возможность автоматического формирования ответа на вопрос пользователя, не входящий в обучающий корпус диалогов (в том числе когда ответ на вопрос зависит от предшествующей истории диалога);
    • методы автоматического определения достоверности ответа, возвращаемого диалоговой системой, предназначенные для эффективного отсечения ошибочных ответов системы;
    • методы построения гибридной диалоговой модели, объединяющие диалоговый сценарий и нейросетевую модель диалога для повышения эффективности системы;
    • методы самообучения модели диалога в процессе использования диалоговой системы, предназначенные для автоматического добавления в гибридную модель диалога новых тематик обращений клиентов, а также для учета реакции пользователей системы;
    • методы обновления информации в модели диалога, обеспечивающие актуализацию данных, содержащихся в возвращаемом системой ответе на вопрос пользователя;
    • методы оценки эмоционального состояния пользователя системы и учета этой оценки в решениях, принимаемых системой в ходе диалогового взаимодействия;
    • методы принятия решений о целесообразности выполнения системой ряда действий, повышающих автоматизацию процесса обслуживания, по результатам диалогового взаимодействия на основе нейросетевого прогнозирования.
  2. Результаты теоретических исследований позволяют говорить о создании в рамках проекта новых научных, конструкторских и технологических реше­ний актуальных для мирового сообщества задач, решение которых еще не найдено. На отчетном этапе охраноспособные РИД не запланированы и не получены.
  3. Полученные результаты соответствуют заданным требованиям технического задания, ожидается продолжение работ по проекту в 2019 году.