Покращений алгоритм кластерного аналізу з використанням потенціальних кодів

Биков, М. М.; Балховський, Д. Є.; Раїмі, A.

Author

Биков, М. М.

Балховський, Д. Є.

Раїмі, A.

Date

2006

Metadata

Show full item record

Collections

Abstract

Запропоновано алгоритм кластеризації великої за розміром вибірки даних, опис якої може бути представлений в різних ознакових просторах, з використанням потенціальних кодів. Його побудова базується на ідеї кластерного аналізу за методом динамічних ядер. Алгоритм передбачає попереднє визначення центрів кластерів і формування в них ядер з декількох вибіркових точок, а потім формування повного кластера шляхом пошуку множини ядер і віднесенню до них вибіркових векторів зображень таким чином, щоб отримати кластери, які мінімізують критерій узгодженості відстаней і їх рангів між точками простору. Алгоритм протестовано на стандартному файлі даних ірисів.

Предложен алгоритм кластеризации большой по размеру выборки данных, описание которых может быть представлено в разных признаковых пространствах, с использованием потенциальных кодов. Его построение базируется на идее кластерного анализа по методу динамических ядер. Алгоритм предусматривает предварительное определение центров кластеров и формирования в них ядер из нескольких выборочных точек, а затем формирования полного кластера путем поиска множества ядер и отнесению к ним выборочных векторов таким образом, чтобы получить кластеры, минимизирующие критерий согласованности расстояний и их рангов между точками пространства. Алгоритм протестирован на стандартном файле данных ирисов.

There had been suggested the algorithm for clusterization of large size of data sample, the description of which can be presented in different features spaces, with the application of potential codes. Its derivation is based on the idea of cluster analysis according to method of dynamic kernels. An algorithm foresees preliminary determination of clusters centres and the formation of kernels from a few selective points, with further forming of complete cluster by the search of kernels set and attributing to them the sample vectors in a way, which allows to get clusters minimizing the criterion of fitting of distances and their grades between the points of space. An algorithm is tested on a standard iris data file.

URI:

http://visnyk.vntu.edu.ua/index.php/visnyk/article/view/397
http://ir.lib.vntu.edu.ua/handle/123456789/5608

View/Open

397.pdf (269.8Kb)