Гібридний алгоритм кластер-аналізу для формування апріорного розбиття простору ознак на класи знань в системах дистанційного навчання
Author
Петров, С. А.
Лисак, Н. В.
Міронова, Ю. В.
Петров, С. А.
Лысак, Н. В.
Миронова, Ю. В.
Petrov, S. O.
Lysak, N. V.
Mironova, Yu. V.
Date
2015-11Metadata
Show full item recordCollections
Abstract
Запропоновано модифікацію алгоритму k-means, ідея вдосконалення якого полягає у комбінованому використанні критерію оцінки помилки кластеризації та інформаційного критерію функціональної ефективності, що визначає рівень достовірності побудованих вирішальних правил визначення належності реалізацій до певного класу знань. При цьому використання комбінованого статистичного та інформаційного підходів дозволило включити такий параметр кластеризації як кількість кластерів в інтеграційну оптимізаційну процедуру та, базуючись на природній структурі розподілення векторів реалізацій результатів тестування слухачів в N-вимірному просторі ознак, розпізнавання дозволило знайти оптимальні геометричні параметри контейнерів класів, які характеризують рівні знань студенів в системах дистанційного навчання. Предложена модификация алгоритма k-means, идея усовершенствования которого заключается в комбини-рованном использовании критерия оценки ошибки кластеризации и информационного критерия функциональной эффективности, который определяет достоверность построенных решающих правил определения принадлеж-ности реализаций к некоторому классу знаний. При этому одновременное использование статистического и информационного подходов позволило включить такой важный параметр для алгоритмов кластеризации как количество кластеров в итерационную оптимизационную процедуру. Имея априорную информацию о распределении N-мерных векторов реализаций, представляющих результаты тестирования знаний студентов, определить оптимальные геометрические параметры контейнеров, описывающих классы знаний студентов в системах дистанционного образования. There has been offered the modification of algorithm of k - means, the idea of improvement of which consists in the combined use of criterion of estimation of error of clusterization and informative criterion of functional efficiency, that determines authenticity of the built decision rules of determination of belonging of realization to some class of knowledge. Thus the simultaneous use of statistical and informative approaches allowed including such important parameter for the algorithms of clusterization as an amount of clusters in iterative optimization procedure. Having a priori information about distribution of N- measure vectors of realization, presenting the results of testing of knowledge of students, it also allows to define the optimal geometrical parameters of containers, describing the classes of knowledge of students in the systems controlled from distance education.
URI:
http://ir.lib.vntu.edu.ua/handle/123456789/2410