Algoritem k-Means se ne uporablja za kategorične podatke, saj so kategorične spremenljivke diskretne in nimajo naravnega izvora. Torej računanje evklidske razdalje za prostor, kot je prostor, ni smiselno.
Ali lahko uporabimo združevanje v skupine za kategorične podatke?
Kategorični podatki so bili pretvorjeni v številske z dodelitvijo vrednosti ranga. Gre za to, da je kategorični nabor podatkov mogoče združiti v skupine kot številske nabore podatkov.. Opaženo je, da implementacija te logike, k-povprečje daje enako zmogljivost kot pri številskih nizih podatkov.
Ali se lahko pomen uporablja za kategorične spremenljivke?
Ne moremonajti povprečje iz teh podatkov, ker ni "povprečne" barve oči. Lahko najdete razmerja, ne pa povprečja. Upam, da to pomaga!
Kaj je treba uporabiti, če so podatki kategorični?
Kategorični podatki se analizirajo z uporabo način in mediane porazdelitve, kjer se nominalni podatki analizirajo z načinom, medtem ko redni podatki uporabljajo oba. V nekaterih primerih se lahko redni podatki analizirajo tudi z uporabo univariantne statistike, bivariatne statistike, regresijskih aplikacij, linearnih trendov in metod klasifikacije.
Kaj je združevanje s kategoričnimi atributi?
Kategorično združevanje podatkov v grozde se nanaša na primer, ko so podatkovni objekti definirani preko kategoričnih atributov … To pomeni, da za kategorične vrednosti ni enotnega razporejanja ali funkcije razdalje, in ni preslikave iz kategoričnih v številčne vrednosti, ki bi bilo pomensko smiselno.