Līdzības un attāluma mēri

Vikipēdijas lapa
Jump to navigation Jump to search

Klasteru līdzības jeb attāluma mērs ir kvantitatīvs lielums, kas daudzdimensiju analīzē raksturo saikni jeb līdzību starp pētāmajiem objektiem. Klasteru analīze spēj dot atšķirīgus rezultātus vieniem un tiem pašiem datiem, līdz ar to, lai pareizi izvēlētos līdzības mēru, jānovērtē gan mainīgā veids, gan mērvienību skala, gan pētāmā objekta būtību. Kad dotie dati ir sadalīti klasteros, var aprēķināt to līdzības jeb tuvuma precīzu novērtējumu. Atkarībā no mainīgā veida tiek izdalītas divas attālumu mēru pamatgrupas: mēri mainīgajiem, kas pieder metriskajai skalai[1] un mēri bināriem mainīgajiem.

Mēri metriskiem mainīgajiem[labot šo sadaļu | labot pirmkodu]

  • Eiklīda attālums — attālums starp diviem punktiem daudzdimensiju telpā (tas atbilst tos savienojošā nogriežņa garumam).
  • Eiklīda attāluma kvadrāts — šāda pieeja ļauj lielāku svaru piešķirt tieši lielajiem attālumiem. Šo metodi vienmēr jāizmanto, ja veidojot klasterus tiek izmantota mediānu vai Ward metode.
  • Pirsona korelācijas koeficients - atrodas intervālā no -1 līdz 1.
  • Kosinuss — arī šis koeficients atrodas robežās no -1 līdz 1, taču ir aprēķināms pēc mazliet citādākas formulas.
  • Čebiševa attālums[2] — par šo attālumu izvēlās lielāko pēc moduļa starpību, kas atbilst izvēlēto novērojumu vērtībām.
  • Kvartālu jeb Manhetenas attālums — aprēķina kā vērtību pāru starpību absolūto vērtību summu. Divu dimensiju gadījumā tas nav Eiklīda taisnvirziena attālums starp diviem punktiem, bet gan ceļš, kas jāveic, lai nokļūtu "Manhetenā no vienas ēkas līdz otrai pa savstarpēji perpendikulārām ielām".
  • Minkovska attālums. Vispārināts Minkovska attālums tiek nosaukts par pakāpes attālumu, kas tiek aprēķināts pēc šādas formulas:
Minkovska attālumu parasti lieto, pieņemot, ka pakāpe p ir 1 vai 2, iegūstot attiecīgi Manhetenas un Eiklīda attālumus. Savukārt, pakāpei p tiecoties uz bezgalību, tiek iegūts Čebiševa attālums:

Mēri bināriem mainīgiem[labot šo sadaļu | labot pirmkodu]

Atsauces[labot šo sadaļu | labot pirmkodu]

  1. Mark S. Aldenderfer, Roger K. Blashfield Cluster analysis, 1985.
  2. М. С. Олдендерфер, Р. К. Блэшфилд. Кластерный анализ. Финансы и статистика, 1989.

Ārējās saites[labot šo sadaļu | labot pirmkodu]