Інформаційна технологія образного аналізу тексту та синтезу структурно-функціональних моделей системи обробки природномовного контенту
Автор
Бісікало, Олег Володимирович
Бисикало, Олег Владимирович
Bisikalo, О. V.
Дата
2012Metadata
Показати повну інформаціюCollections
Анотації
Дисертаційна робота присвячена вирішенню науково-прикладної пробле-
ми розв’язання класу семантико-залежних задач на основі обробки і накопичу-
вання загальних знань образного сенсу. Розроблено основи теорії образного
аналізу текстової інформації шляхом формалізації поняття інфологічної систе-
ми та онтогенетичного принципу її побудови, застосування моделі формальної
теорії у вигляді комутативної напівгрупи образних конструкцій, створення ме-
тоду генерації нечіткого відношення сенсу, що породжує простір з нечіткою
мірою. Запропоновано методологію синтезу структурно-функціональних моде-
лей систем на основі природномовної інформації та функціональну модель сис-
теми обробки природномовного контенту (СОПМК). Розроблено математичні
моделі базових типів образного пошуку, методи моделювання образного меха-
нізму оперативної пам’яті СОПМК та складових парадигматичного устрою мо-
ви. Отримані складові інформаційної технології на основі СОПМК впроваджені
та пройшли успішну апробацію в організаціях, підприємствах, установах та на-
вчальних закладах в Україні та закордоном. Диссертационная работа посвящена решению актуальной научно-
прикладной проблемы создания теоретико-методологических основ и техноло-
гических средств построения систем обработки естественно-языкового кон-
тента (СОЕЯК), способных решать широкий класс семантико-зависимых задач
на основе накопления общих знаний образного смысла.
Ключевая идея работы заключается в формализации образного смысла
естественно-языковой информации как результата функционирования инфо-
логической системы (ИС) – абстрактной модели СОЕЯК. Обмен информацией
между ИС и внешним миром происходит исключительно через образные кон-
струкции – произвольные подмножества множества пар образов. Накопление
таких конструкций приводит к появлению пространства образного смысла, в
котором на уровне метаязыка разделяются понятия смысла-свойства и смысла-
параметра. Предложено интерпретировать онтогенез ИС через построение ас-
социативной сети образов (АСО) – базы знаний в форме семантической сети,
для которой образный смысл-свойство интерпретируется как ее топология, а
смысл-параметр – как числовая оценка любой подсети АСО с помощью впер-
вые введенной в работе единицы смысла. и генерации знаний СОЕЯК. Дальнейшее развитие получили модели базо-
вых типов образного поиска в АСО, в том числе инсайта на основе модифика-
ции известных алгоритмов поиска на разреженных графах, что привело к
уменьшению вычислительной сложности алгоритмов. Предложенный метод
моделирования образного механизма оперативной памяти СОЕЯК в виде алго-
ритмов навигации на графе булеана обеспечил решение задач исследования
ориентировочного рефлекса, конструирования образа–решения, генерация со-
общений и некоторых типов ответов на вопросы к системе. Разработанный ме-
тод моделирования компонентов парадигматического строя языка позволил по-
лучить рекурсивные алгоритмы самосовершенствования базы знаний СОЕЯК.
Разработана и программно реализована информационная технология об-
разной обработки ЕЯК, объединившая в себе все полученные научные резуль-
таты в виде структуры и функций СОЕЯК. Экспериментальная проверка реше-
ния семантико-зависимых задач на основе технологии численно подтвердила
улучшение релевантности поиска по точности и полноте, сокращение времени
на создание программно-педагогических средств, повышение успеваемости
учащихся. Основные результаты диссертации подтверждены 14 актами внедре-
ния на предприятиях, организациях, в учреждениях и учебных заведениях в
Украине и за рубежом. Объектами внедрения стали все основные модули
СОЕЯК, программная оболочка для проектирования электронных обучающих
объектов и созданные на ее основе программно-педагогические средства, моде-
ли и алгоритмы системы для борьбы с мошенничеством в сетях связи, подтвер-
дившие на практике достоверность теоретических положений исследования The dissertation is dedicated to the solution of a problem of resolving class of
semantic-dependent tasks based on processing and accumulation of general knowledge
figurative sense. A basic theory of image analysis of textual information is developed.
A basis of a formal theory for communicative subgroup of image structures,
methods of generating a fuzzy sense relation, which produces a fuzzy measure space
based on formalizing the notion of infologic system and ontogenesis principle is laid
down. A methodology for the synthesis of structural-functional models of systems
based on natural language information and functional model system for processing
natural language content (SPNLC) is offered. Algorithms for implementing basic
types of image search, methods for modeling the image mechanism of working memory
of SPNLC and components of paradigmatic language structure are elaborated.
These components of information technology based SPNLC been implemented and
successfully tested in public and private organizations and academic institutions in
Ukraine and abroad.
URI:
http://ir.lib.vntu.edu.ua/handle/123456789/13813