RUEN


Проект РФФИ 14-07-00903
Теоретико-модельные методы интеграции знаний и порождения новых знаний
Подразделение: Институт дискретной математики и информатики


Проект посвящен разработке теоретико-модельных методов формального представления и интеграции знаний, извлеченных из различных текстов естественного языка, и теоретико-модельных методов порождения новых знаний. Выполнение проекта основано на применении теоретико-модельных методов разработки онтологий и логического анализа естественного языка, логической формализации глоссариев и отношений между понятиями; использовании булевозначных и нечѐтких моделей для представления неточных и неполных знаний; применении теоретико-модельных методов интеграции знаний, представленных в разных онтологиях, основанных на представлении формальных моделей при помощи их атомарных диаграмм; на использовании метапоисковых систем специального вида, основанных на онтологиях предметных областей, предназначенных для извлечения знаний из текстов естественного языка, представленных в сети Интернет.

Аннотированный отчет за 2014 год
 Разработан теоретико-модельный подход к извлечению знаний из текстов естественного языка, основанный на формальном представлении извлекаемых знаний в виде конечных подмножеств атомарных диаграмм алгебраических систем.
 Разработаны методы интерпретации различных частей речи русского языка и различных синтаксических связей с целью автоматического порождения сигнатуры алгебраической системы. На основе этого разработаны методы автоматического построения атомарных предложений данной сигнатуры по тексту естественного языка. Разработан словарь существительных-номинализаций и словарь валентностей глаголов.
 Разработаны автоматизированные методы построения атомарных диаграмм алгебраических систем по текстам на русском языке. Разработаны методы интеграции знаний, полученных из одного текста естественного языка.
 Разработана программная система, которая осуществляет порождение фрагмента атомарной диаграммы модели по тексту естественного языка. Программная система позволяет редактировать и визуализировать автоматически построенный фрагмент атомарной диаграммы модели. Программная система даёт пользователю возможность получения ответов на вопросы на русском языке определённого вида, на основе знаний, представленных в модели.
 Разработана и программно реализована вопросно-ответная система на русском языке. Вопросно-ответная система осуществляет поиск информации в Интернете при помощи параметризированных запросов. Разработаны шаблоны, позволяющие определять тип вопроса, и соответствующие им шаблоны параметризированных запросов.
 Разработана вопросно-ответная система с оценкой достоверности ответа на заданный вопрос, основанная на построении обобщенной нечеткой модели. В данной системе вопросы формируются по шаблонам, являющимся вероятностными аналогами шаблонов ли-вопросов и какой-вопросов. Ответы формируются на основе соответствующих запросов к полной диаграмме данной обобщенной нечеткой модели.
 Исследованы теоретико-модельные свойства обобщенных нечетких моделей, являющихся произведением нечетких моделей, полученных из набора текстов на естественном языке. Доказана теорема об интервальности значений истинности предложений на данной обобщенной нечеткой модели. Разработан алгоритм нахождения нечеткого значения истинности бескванторного предложения на обобщенных нечетких моделях.
 Разработаны методы извлечения знаний из текстов естественного языка, представленных в социальных сетях, основанные на применении теории речевых действий. С помощью языка описания лингвистических шаблонов решается проблема выявления фраз русского языка, содержащих речевые действия «побуждения». Показано, что, диалоги, содержащие большое количество «побуждений» – это в точности те диалоги, при помощи которых в социальных сетях организуются совместные действия.
 Получено полное описание конечно-аксиоматизируемых суператомных булевых алгебр с выделенной плотной подалгеброй конечной ширины. Показано, что существует континуум различных элементарных типов нелокальных суператомных булевых алгебр с выделенной плотной подалгеброй конечной ширины.
 Показано, что счетная локальная булева алгебра с выделенными идеалами автоустойчива относительно сильных конструктивизаций тогда и только тогда, когда она является прямым произведением конечного числа алгебр, являющимися простыми моделями.
 Разработаны методы теоретико-модельной формализации отношений между понятиями. Получен критерий того, что два понятия из разных онтологий являются синонимами в объемлющей онтологии.

Аннотированный отчет за 2015 год
 Разработана четырёхуровневая модель представления знаний, предназначенная для интеграции знаний, извлечённых из разных текстов естественного языка. На основе данной модели представления знаний разработаны методы построения онтологических моделей предметных областей. В рамках данного подхода онтологическая модель предметной области содержит: 1) уровень онтологических знаний (онтология предметной области); 2) уровень общих теоретических знаний; 3) уровень частных эмпирических знаний, представленных в виде прецедентов предметной области, и 4) уровень оценочных, вероятностных знаний (утверждений, имеющих нечёткое значение истинности).

 Разработаны теоретико-модельные методы интеграции знаний, извлеченных из разных текстов естественного языка; извлекаемые знания представляются в виде логических теорий, записываемых в разрешимых фрагментах логики предикатов первого порядка. Разработаны методы интеграции фрагментов атомарных диаграмм алгебраических систем, соответствующих разным текстам естественного языка. Разработаны автоматизированные методы создания онтологий предметных областей, основанные на извлечении онтологических знаний из текстов естественного языка и интеграции извлечённых знаний. Разработаны методы интеграции онтологий, методы выявления и разрешения логических противоречий, возникающих при интеграции онтологий.

 Разработаны теоретико-модельные методы построения онтологических моделей предметных областей для медицины. Разработана онтологическая модель предметной области «Деформации позвоночника и дегенеративные заболевания позвоночника». Разработаны методы и алгоритмы порождения оценочных вероятностных знаний на основе онтологии предметной области, имеющихся общих теоретических знаний и эмпирических знаний о прецедентах. Разработан алгоритм порождения оценочных знаний о рисках возникновения критического состояния на основе анализа множества прецедентов предметной области. Разработан алгоритм определения критических ситуаций, которые могут возникнуть у данного пациента. Разработан алгоритм нахождения лекарственных противопоказаний и негативных взаимодействий лекарств. Данные алгоритмы были реализованы в программной системе MedOntoModel.

 Разработаны методы порождения знаний о возможном диагнозе пациента на основе анализа историй болезни других пациентов. Данные методы основаны на теоретико-модельном подходе к формализации предметной области. Формализация оценочных (нечетких) суждений производится на языке теории нечетких моделей. Разработан алгоритм получения формульного описания различных диагнозов. Данный алгоритм основан на методологии анализа формальных понятий. Разработан алгоритм определения рабочего диагноза для данного пациента. Разработан алгоритм назначения дополнительного диагностирования пациента. Разработанные методы были апробированы на деперсонифицированных историях болезни реальных пациентов.

 Исследованы теоретико-модельные и алгоритмические свойства булевых алгебр и их обогащения выделенными подалгебрами. Доказано, что любая суператомная булева алгебра с выделенной плотной подалгеброй конечной ширины m-эквивалентна конечно аксиоматизируемой алгебре. Получен критерий конечной аксиоматизируемости элементарной теории суператомной булевой алгебры с выделенной плотной подалгеброй конечной ширины. Получен критерий элементарной эквивалентности суператомных булевых алгебр с выделенной плотной подалгеброй конечной ширины. Получен критерий разрешимости элементарной теории суператомной булевой алгебры с выделенной плотной подалгеброй конечной ширины.

 Исследованы теоретико-модельные свойства булевозначных моделей и нечётких моделей. Введено и исследовано обобщение понятия фазификации булевозначной модели и, соответственно, понятия нечёткой модели, на случай произвольного отображения из булевой алгебры в отрезок [0,1], сохраняющего значения 0 и 1. Изучены обобщенные нечеткие модели, обладающие структурой фрейма Крипке, на которых определено отношение достижимости между прецедентами. Разработаны алгоритмы нахождения нечетких значений истинности модальных предложений на обобщенных нечетких моделях.

 Разработана вторая версия вопросно-ответной системы «QA-RiskPanel» для предметной области «компьютерная безопасность». Данная система основана на прецедентном подходе к моделированию предметных областей и позволяет пользователю задавать вероятностные вопросы с целью определения и прогнозирования различных рисков, связанных с компьютерными атаками. Система состоит из трех модулей: модуль безусловных вопросов (разработан на первом году проекта), модуль условных вопросов и модуль модальных вопросов. Для каждого модуля разработаны шаблоны вопросов и алгоритмы поиска ответов. Все алгоритмы имеют полиномиальную сложность. Программная система «QA-RiskPanel» в данный момент времени находится на регистрации в Федеральном органе исполнительной власти по интеллектуальной собственности (Заявка № 2015619293/69 от 05.10.2015).

Вернуться к списку