Метрика для виявлення схожих об'єктів з урахуванням спорідненості категорій
Abstract
Оцінювання схожості двох об’єктів – це поширена задача в розпізнаванні образів, кластеризації та класифікації. У випадку категоріальних атрибутів об’єкти описуються деяким розподілом ступенів належності за категоріями. Метрики схожості таких розподілів зазвичай являють собою суперпозицію схожості об’єктів за кожною категорією. Найчастіше це сума схожості за окремими категоріями. При цьому, кожна категорія розглядається незалежно та ізольовано від інших. В деяких практичних задачах категорії є спорідненими. Тому схожість між об’єктами доцільно розраховувати не лише напряму, як схожість між еквівалентними категоріями, але враховувати і непряму, перехресну схожість через споріднені категорії. Саме така метрика схожості двох категоріальних розподілів, що враховує спорідненість різних категорій, і пропонується у статті. Estimating a level of similarity of two objects is a common problem in pattern recognition, clustering and classification. In case of categorical attributes an object is described as a distribution of membership degrees over categories. Similarity metrics of such distributions are usually defined as a superposition of objects’ similarities for each category. Most often it is a sum of similarities in separate categories. In addition to that each category is considered independently and in isolation from the others. Some practical problems have categories that are akin.
URI:
http://ir.lib.vntu.edu.ua//handle/123456789/38330