Некоторые подходы к задачам распознавания и их приложениям — страница 3

  • Просмотров 2978
  • Скачиваний 289
  • Размер файла 18
    Кб

Существует множество методов классификаций .описание этих методов и принципов вы можете найти в работе 3. Интересен аппроксимационный подход. Пусть имеется матрица связей D размером nxn. Рассмотрим отношение эквивалентности Rn , которое порождает разбиение множество Х на непустые m классы Rn=(Rn Rn Rn…Rn). представим Rk в виде бинарной матрицы. Элемент матрицы равны 1, если обьекты лежат в одном классе и равны 0 в противном случае.

Требуется найти разбиение с булевой матрицей Rn , которая бы в наибольшей мере соответствовала матрице связей. Как сопоставить матрицу связей D и матрицу Rn друг с другом. В работе [6] предлагают, взвешивать матрицу Rn , вводя некоторый коэффицент маштаба , и сдвигас критерием аппроксимаций. K(Rn ,,)=; Где dij=d(Xi Xj); rij-элементы матрицы Rn. Для аналитического решение удобно что либо зафиксировать. Если задан порог близости Q с элементами

равной 1 если dij, и равные 0 в противном случае. Близость между матрицами Q и Rk оценивается расстоянием Хемминга . r(Q, Rn)=; где весовые коэффициенты. Требуется найти матрицу Rn аппроксимирующего матрицу Q. Существует большая группа методов кластерного анализа в основе которой лежит решение этой задачи . Предположим, что мы имеем результат разбиение построенного нами алгоритма классификаций. Справедливо ли отнес обьект Тi классу Rn ,

когда в действительности он принадлежит, быть может, к другому классу. В этом случай исследователь идет по одному из пути. Обрабатывает набор данных разными алгоритмами. результаты сравнивает между собой, или если есть эксперт, то сравнивает с его разбиением. Но экспертного разбиение может и не быть, а сравнение результатов разных алгоритмов может быть не достаточным. В таком случае исследователь может проверит кластер данных

на «реальность». Понятие реальности кластера данных основывается на идеях Дж.Хартигана. Как вообще предполагается строить прогнозирования социально-экономической среды в задачах классификаций. Рассмотрим на примере . Пусть имеем n городов каждую из которых характеризуем некоторыми параметрами . например с1-потребление электроэнергий ,с2- личным потреблением и.т.д. Тогда Х вектор представляет собой набор указанных

характеристик Задача классификаций заключается в том чтобы разбить города по уровню развития. Ппредположим , что мы разбили города по уровню рразвития, и предположим ,что результат разбиение реален. Теперь изменим параметр одного города проверим снова не изменился ли результат разбиение на основе результата можно строить прогнозы .Прогноз будет достоверным ибо алгоритм классификаций разбивает правильно . в заключении