Një nga mjetet për zgjidhjen e problemeve ekonomike është analiza e klasterit. Me të, grupimet dhe objektet e tjera të grupit të të dhënave klasifikohen në grupe. Kjo teknikë mund të përdoret në Excel. Le të shohim se si bëhet kjo në praktikë.
Përdorimi i analizës së klasterit
Me ndihmën e analizës së klasterit është e mundur të kryhet kampionimi në bazë të të cilit hetohet. Detyra e tij kryesore është të ndahet një grup shumëdimensional në grupe homogjene. Si kriter për grupim, përdoret koeficienti i korrelacionit të palëve ose distanca euklidiane midis objekteve nga një parametër i caktuar. Vlerat më të afërta grupohen së bashku.
Megjithëse më shpesh kjo lloj analize përdoret në ekonomi, mund të përdoret gjithashtu edhe në biologji (për klasifikimin e kafshëve), psikologjisë, mjekësisë dhe në shumë fusha të tjera të aktivitetit njerëzor. Analiza e klasterit mund të zbatohet duke përdorur toolkitin Excel për këtë qëllim.
Shembull përdorimi
Ne kemi pesë objekte, të cilat karakterizohen nga dy parametra të studiuar - x dhe y.
- Aplikoni në këto vlera formulën Euklidiane të distancës, e cila llogaritet nga shablloni:
= ROOT (x2-x1) ^ 2 + (y2-y1) ^ 2)
- Kjo vlerë llogaritet midis secilës prej pesë objekteve. Rezultatet e llogaritjes vendosen në matricën e distancës.
- Ne shikojmë, mes të cilave vlerat distanca është më e vogël. Në shembullin tonë, këto janë objekte. 1 dhe 2. Distanca në mes tyre është 4,123106, e cila është më e vogël se midis elementëve të tjerë të kësaj popullsie.
- Ne kombinojmë këto të dhëna në një grup dhe formojmë një matricë të re në të cilën vlerat 1,2 qëndrojnë si një element i veçantë. Kur përpiloni matricën, lini vlerat më të vogla nga tabela e mëparshme për elementin e kombinuar. Përsëri shikojmë, midis të cilave elementët distanca është minimale. Kjo kohë është 4 dhe 5si dhe një objekt 5 dhe grupi i objekteve 1,2. Distanca është 6,708204.
- Ne shtojmë elementet e specifikuara në grupin e përbashkët. Ne formojmë një matricë të re në të njëjtin parim si herën e kaluar. Kjo është, ne shikojmë për vlerat më të vogla. Kështu, shohim se grupi ynë i të dhënave mund të ndahet në dy grupime. Në grupin e parë janë elementët më të afërt - 1,2,4,5. Në grupin e dytë në rastin tonë ekziston vetëm një element - 3. Është relativisht larg nga objekte të tjera. Distanca midis grupimeve është 9.84.
Kjo plotëson procedurën për ndarjen e popullsisë në grupe.
Siç mund ta shikoni, edhe pse në përgjithësi analiza e grumbullimit mund të duket e komplikuar, por në fakt nuk është kaq e vështirë për të kuptuar nuancat e kësaj metode. Gjëja kryesore për të kuptuar modelin bazë të shoqatave në grupe.