Побудова моделей для оптимізації структури бази даних вузла у корпоративних інформаційних системах
Author
Фісун, М. Т.
Дворецький, М. Л.
Дворецька, С. В.
Фисун, Н. Т.
Дворецкий, М. Л.
Дворецкая, С. В.
Fisun, M.
Dvoretskyi, M.
Dvoretskaya, S.
Date
2020Metadata
Show full item recordCollections
Abstract
Обґрунтовано актуальність роботи, яка визначається тенденцією переходу від локальних до розподілених баз даних та недоліками використання "універсальних" облікових систем. Аргументовано важливість питання правильного розподілення даних між вузлами розподілених та територіально розосереджених комп’ютерних систем.
При постановці задачі та визначенні мети дослідження увага звертається на необхідність визначення та побудови математичної моделі критеріїв оптимальності структури віддаленого вузла розподіленої БД. Враховується статистика користувацької активності, що представляється у вигляді багатовимірної моделі даних та для кожного елементу вимірів визначається маркер представленості даних на віддаленому вузлі. Виконавши відповідні операції консолідації для рівня атрибутів кортежів відношення, відповідно до запропонованої функції агрегації, отримується значення маркеру представленості кожного з них.
На наступному етапі сформульовано критерії ефективності моделі: незалежність від центрального вузла БД, розмір локальної БД та показник рівня необхідності синхронізації даних. Побудовано математичні залежності між їх значеннями та значенням граничного рівня представленості для даних віддаленого вузла. Це дає змогу, розв'язавши задачу багатокритеріального аналізу, визначити рівень представленості даних, для якого значення критеріїв ефективності відповідатимуть координатам найоптимальнішої точки простору рішень. Во вступительной части обоснована актуальность работы, которая определяется тенденцией перехода от локальных к распределенным базам данных и недостатками использования "универсальных" учетных систем. Аргументировано важность вопроса правильного распределения данных между узлами распределенных и территориально рассредоточенных КС.
При постановке задачи и определении цели исследования внимание обращается на необходимость определения и построения математической модели критериев оптимальности структуры удаленного узла распределенной БД. Учитывается статистика пользовательской активности, которая представляется в виде многомерной модели данных и для каждого элемента измерений определяется маркер представленности данных на удаленном узле. Выполнив операции консолидации для уровня атрибутов кортежа отношения, согласно предложенной автором функции агрегации, получается значение уровня необходимости представления каждого из них.
На следующем этапе сформулированы критерии эффективности модели (независимость от центрального узла БД, размер локальной БД, и показатель уровня необходимости синхронизации данных) и построены математические зависимости между их значениями и значением предельного уровня представленности для данных удаленного узла. Это позволяет, решив задачу многокритериального анализа, определить уровень представленности данных, для которого значения критериев эффективности будут отвечать координатам оптимальной точки пространства решений. The introductory part of the research justifies the relevance of the work. Because of the tendency to move from local to distributed databases, and the disadvantages of using "universal" accounting systems many companies use the set of special solutions instead. According to this, it is very important to distribute data of corporate database between its nodes correctly. The key factor that affects the reliability and availability of the database is the link localization. If the database is distributed optimally, the data hosted in this node is called exclusively by its user.
The research aims to determine and build a mathematical model of the optimality criteria for the structure of a remote node of the distributed database. The statistics of user SQL-queries activity is taken into account. Statistics results is presented in the form of a multidimensional data model. It this model each dimension element is marked with a marker of data presentation on the remote node. Next, the statistics data is consolidated according to the aggregation function proposed by the author. As a result, the necessity level value of data cell representing is obtained.
At the next stage, criteria the model effectiveness are formulated (independence from the central node of the database, the size of the local database, and an indicator of the level of need for data synchronization). Then mathematical dependencies between criteria values and the value of data representation level on the remote node are built. This allows, having solved multicriteria analysis problem, to determine the level of data representation for which the values of the criteria will correspond to the coordinates of the optimal point in the solution space.
URI:
http://ir.lib.vntu.edu.ua//handle/123456789/31639