Hierarchinis klasterizavimas yra populiariausias ir plačiausiai naudojamas socialinio tinklo duomenų analizės metodas. Taikant šį metodą, mazgai lyginami vienas su kitu pagal jų panašumą. Didesnės grupės sudaromos sujungiant mazgų grupes pagal jų panašumą.
Kada naudoti hierarchinį klasterizavimą, palyginti su K priemonėmis?
Hierarchinis grupavimas yra įdėtųjų grupių, išdėstytų kaip medis, rinkinys. K reiškia, kad klasterizavimas gerai veikia kai klasterių struktūra yra hipersferinė (kaip apskritimas 2D, sfera 3D). Hierarchinis grupavimas neveikia taip gerai, k reiškia, kai grupių forma yra hipersferinė.
Kada turėčiau naudoti hierarchinį grupavimą?
Hierarchinis grupavimas yra galinga technika, kuri leidžia kurti medžio struktūras iš duomenų panašumų. Dabar galite matyti, kaip skirtingi pogrupiai yra susiję vienas su kitu ir kokiu atstumu yra duomenų taškai.
Kada nenaudotumėte hierarchinės klasterizacijos?
Trūkumai yra tai, kad jis retai pateikia geriausią sprendimą, apima daug savavališkų sprendimų, neveikia su trūkstamais duomenimis, blogai veikia su mišrių tipų duomenimis, neveikia labai dideliuose duomenų rinkiniuose, o pagrindinė jo išvestis, dendrograma, dažnai interpretuojama neteisingai.
Kokios hierarchinės klasterizacijos naudos?
Hierarchinio grupavimo stipriosios pusės
- Taipsuprasti ir įgyvendinti.
- Neturime iš anksto nurodyti konkretaus grupių skaičiaus. …
- Jie gali atitikti prasmingą klasifikaciją.
- Lengva nuspręsti klasterių skaičių tiesiog pažvelgus į Dendrogramą.