Некоторые подходы к задачам распознавания и их приложениям — страница 2

  • Просмотров 2979
  • Скачиваний 289
  • Размер файла 18
    Кб

характеристик. Обозначим это множество С=(С1 С2 С3, .. ., Ср); этими характеристиками обладает каждый индивид из множества Т. Наблюдаемые характеристики могут быть количественными или качественными . Наблюдение часто называют измерениями. Результат измерение i-й характеристики(измерение ) Tj –обьекта обозначим хij , а вектор Хj=[ хij] размером рХ1 будет отвечать каждому ряду измерений для j- го обьекта . Таким образом исследователь

множеством Х=(Х1 Х2 Х3 ,…, Хp) описывает множество Т. Множество Х может представлено как к точек в р- мерном евклидовом пространстве Ер . Задача кластерного анализа заключается в том чтобы на оснований данных в множестве Х разбить множество Т на m-классов m<n. Так чтобы, каждый обьект принадлежал одному и только одному подмножеству разбиение , и что бы обьекты принадлежащие одному и тому же классу были сходными в то время как обьекты

различных классов были бы разнородными. Разбиение здесь следует понимать как разделение множество Т на определенное число непустых попарно непересекающихся подмножеств. Решение задачи кластерного анализа является разбиение удовлетворяющее некоторому критерию оптимальности . в качестве критерия может быть функционал например сумма квадратов отклонений W== xi-измерение i-го обьекта. Критерий оптимальности показывает когда

мы получили нужное разбиение. Очевидно чтобы решить задачу кластерного анализа необходимо количественно определить понятия сходства и разнородности . Задача была бы решена если Тi Тj обьекты попадали в один и тот же класс всякий раз когда расстояние между точками Хi Хj было бы достаточным малым и ,наоборот, обьекты попадали бы в разные классы когда между соответствующими точками расстояние было бы достаточно большим.

Расстояние d(Xi Xj) между точками Хi Хj p мерном евклидовом пространстве можно задать положительно определенной функцией, которая является метрикой и удовлетворяет аксиомам метрики. Отметим что функция расстояние d(X i Xj) задает соответственно сходство между обьектами Тi Тj . Существует множество видов функций расстояние использующий в евклидовом пространстве .например евклидова метрика , Л норма, расстояние Махаланобиса . приведем

лишь евклидова метрику d(Xi Xj)=; Расстояние между n обьектами можно задать в виде симметричной матрицы размером nХn. Такую матрицу иногда называют матрицей связей. Также можно определить меру сходства . Мера сходства s(Xi Xj) положительно определенная функция и удовлетворяет следушим условиям : 1. s(Xi Xi)=1 ; 2. s(Xi Xj)=s(Xj Xi) ; 3. s(Xi Xj) определена в интервале [0 1] ; мы можем задать меру сходство с помощью функций расстояние например: s(Xi Xj)=1/1+d(Xi Xj) ;