SPSS(十五)spss之聚类分析(图文+数据集)[通俗易懂]

SPSS(十五)spss之聚类分析(图文+数据集)[通俗易懂]SPSS(十五)spss之聚类分析(图文+数据集)聚类分析简介按照个体(记录)的特征将它们分类,使同一类别内的个体具有尽可能高的同质性,而类别之间则具有尽可能高的异质性。为了得到比较合理的分类,首先要采用适当的指标来定量地描述研究对象之间的联系的紧密程度。假定研究对象均用所谓的“点”来表示。在聚类分析中,一般的规则是将“距离”较小的点归为同一类,将“距离”较大的点归为不同的类。常见…

大家好,又见面了,我是你们的朋友全栈君。如果您正在找激活码,请点击查看最新教程,关注关注公众号 “全栈程序员社区” 获取激活教程,可能之前旧版本教程已经失效.最新Idea2022.1教程亲测有效,一键激活。

Jetbrains全系列IDE稳定放心使用

SPSS(十五)spss之聚类分析(图文+数据集)

聚类分析简介

按照个体(记录)的特征将它们分类,使同一类别内的个体具有尽可能高的同质性,而类别之间则具有尽可能高的异质性。
为了得到比较合理的分类,首先要采用适当的指标来定量地描述研究对象之间的联系的紧密程度。

假定研究对象均用所谓的“点”来表示。
在聚类分析中,一般的规则是将“距离”较小的点归为同一类,将“距离”较大的点归为不同的类。
常见的是对个体分类,也可以对变量分类,但对于变量分类此时一般使用相似系数作为“距离”测量指标

  • 聚类分析前所有个体所属的类别是未知的,类别个数一般也未知,分析的依据就是原始数据,可能事先没有任何有关类别的信息可参考。
  • 严格说来聚类分析并不是纯粹的统计技术,它不像其它多元分析法那样,需要从样本去推断总体。一般都涉及不到有关统计量的分布,也不需要进行显著性检验。
  • 聚类分析更像是一种建立假设的方法,而对相关假设的检验还需要借助其它统计方法。
     

注意:聚类分析更像是一种建立假设的方法,而对于相关假设的检验还需要借助其他统计的方法,比如判别分析、T-检验、方差分析等,看聚类出来的几个类别是否存在差异

 

聚类的用途

  • 设计抽样方案(分层抽样)
  • 预分析过程(先通过聚类分析达到简化数据的目的,将众多的个体先聚集成比较好处理的几个类别或子集,然后再进行后续的多元分析)
  • 细分市场、个体消费行为划分(先聚类,然后再利用判别分析进一步研究各个群体之间的差异)

 

聚类分析的基本步骤总结

SPSS(十五)spss之聚类分析(图文+数据集)[通俗易懂]

SPSS(十五)spss之聚类分析(图文+数据集)[通俗易懂]

 

聚类方法

SPSS(十五)spss之聚类分析(图文+数据集)[通俗易懂]

K均值聚类(K-means Cluster)

方法原理

  1. 选择(或人为指定)某些记录作为凝聚点
  2. 按就近原则将其余记录向凝聚点凝集
  3. 计算出各个初始分类的中心位置(均值)
  4. 用计算出的中心位置重新进行聚类
  5. 如此反复循环,直到凝聚点位置收敛为止

方法特点

  1. 要求已知类别数
  2. 可人为指定初始位置
  3. 节省运算时间
  4. 样本量过大时有必要考虑
  5. 只能使用连续性变量
     

案例:移动通讯客户细分

数据包含6个变量
是客户编号(Customer_ID)
工作日上班时期电话时长(Peak_mins)
工作日下班时期电话时长(OffPeak_mins)
周末电话时长(Weekend_mins)
国际电话时长(International_mins)
总通话时长(Total_mins)
平均每次通话时长(average_mins)
根据前期的调研,研究者认为移动用户应当被分为5个主要群体,现希望得到相应的定量聚类结果。
(由于数据集过多,可到我的资源下载“spss之聚类分析–移动通讯客户细分”

SPSS(十五)spss之聚类分析(图文+数据集)[通俗易懂]

SPSS(十五)spss之聚类分析(图文+数据集)[通俗易懂]

看到结果无法收敛,所以重新设置迭代次数,让其收敛

SPSS(十五)spss之聚类分析(图文+数据集)[通俗易懂]

SPSS(十五)spss之聚类分析(图文+数据集)[通俗易懂]

但是最终聚类出来,结果怪怪的

SPSS(十五)spss之聚类分析(图文+数据集)[通俗易懂]

各变量测量尺度,量纲不一样,聚类计算其距离时量纲大的对结果影响大

如何进行标化呢?

SPSS(十五)spss之聚类分析(图文+数据集)[通俗易懂]

SPSS(十五)spss之聚类分析(图文+数据集)[通俗易懂]

SPSS(十五)spss之聚类分析(图文+数据集)[通俗易懂]

重新聚类

SPSS(十五)spss之聚类分析(图文+数据集)[通俗易懂]

标准化的变量,一般在正负3以内,0代表平均水平

SPSS(十五)spss之聚类分析(图文+数据集)[通俗易懂]

但是我们想看原始变量的原始水平,不看这标准化的

保存个案被划分为哪个类

SPSS(十五)spss之聚类分析(图文+数据集)[通俗易懂]

SPSS(十五)spss之聚类分析(图文+数据集)[通俗易懂]

 SPSS(十五)spss之聚类分析(图文+数据集)[通俗易懂]

SPSS(十五)spss之聚类分析(图文+数据集)[通俗易懂]

SPSS(十五)spss之聚类分析(图文+数据集)[通俗易懂]

我们只想看均值

SPSS(十五)spss之聚类分析(图文+数据集)[通俗易懂]

 

得到非标准化的聚类中心结果 

SPSS(十五)spss之聚类分析(图文+数据集)[通俗易懂] 

解读

  • 第一类:高端商用客户,总通话时间长,工作日上班时间通话比例高
  • 第二类:少使用低端客户,总通话时间短,各时段通话时间都短
  • 第三类:中端商用客户,总通话时间居中,工作日上班时间通话比例高
  • 第四类:中端日常用客户,总通话时间居中,工作日下班时间通话比例高
  • 第五类:长聊客户,每次通话时间长

 

层次聚类(Hierarchical Cluster)

属于系统聚类法的一种,其聚类过程可以用树形结构(treelike structure)来描绘的方法

方法原理

  1. 先将所有n个变量/观测看成不同的n类
  2. 然后将性质最接近(距离最近)的两类合并为一类
  3. 再从这n-1类中找到最接近的两类加以合并
  4. 依此类推,直到所有的变量/观测被合为一类
  5. 使用者再根据具体的问题和聚类结果来决定应当分为几类

 

特点

  1. 一旦记录/变量被划定类别,其分类结果就不会再进行更改
  2. 可以对变量或记录进行聚类
  3. 变量可以为连续或分类变量(变量虽然可以为连续型或者分类型,但是不能混用,要不就是全分类这样使用,要不就全连续变量聚类)
  4. 提供的距离测量方法非常丰富
  5. 运算速度较慢

 

案例:体操裁判打分倾向聚类(这个案例是对变量进行聚类)

SPSS自带数据集judges.sav是中、美、法等七个国家的裁判和未经严格训练体育爱好者在评判体育比赛中对选手的评分情况。请根据在评分上的差异将它们分为适当的类。

SPSS(十五)spss之聚类分析(图文+数据集)[通俗易懂]

7.30	8.00	7.10	7.70	7.20	7.20	7.00	7.6
7.80	8.70	7.20	8.40	7.50	8.10	7.30	7.1
7.20	7.40	7.10	7.50	7.20	7.10	7.00	7.0
7.30	8.40	7.20	7.90	7.50	8.50	7.30	7.1
7.70	7.80	7.20	8.40	7.60	7.40	7.10	7.1
7.30	7.60	7.20	8.10	7.30	7.20	7.00	7.0
8.30	8.30	7.70	8.50	7.80	7.80	7.20	7.8
9.60	9.80	9.30	9.80	8.80	9.90	9.40	10.0
9.10	8.80	8.60	9.10	7.80	9.30	8.50	8.5
9.50	9.70	9.00	9.60	8.90	9.80	9.20	10.0
7.80	8.50	8.30	9.10	8.00	9.50	7.60	7.9
8.60	8.90	7.80	9.00	8.00	8.70	7.80	7.8
8.50	9.10	8.10	9.30	8.00	8.30	7.80	8.5
9.20	9.10	8.00	9.40	8.50	9.60	8.60	8.9
8.20	9.20	7.90	9.10	7.80	8.30	7.50	8.2
7.00	7.50	7.10	7.40	7.10	7.10	7.00	7.7
9.70	9.90	9.10	9.70	9.00	10.00	9.60	9.9
9.80	9.90	9.50	9.80	9.00	10.00	9.70	9.9
8.60	9.40	8.20	9.50	8.70	9.80	8.30	9.5
8.80	9.00	7.90	8.50	8.10	9.30	8.00	9.8
9.30	9.80	9.30	9.80	8.70	10.00	9.30	9.3
7.50	7.90	7.20	8.10	7.30	7.70	7.10	7.2
9.00	9.30	7.80	9.10	8.20	9.40	8.10	8.5
8.90	9.70	8.90	9.50	8.60	9.70	9.40	9.2
9.90	10.00	9.70	9.90	9.40	10.00	9.90	9.9
7.20	7.20	7.00	7.90	7.10	7.10	7.00	7.3
7.00	7.10	7.00	7.20	7.00	7.00	7.00	7.0
7.30	7.50	7.10	7.60	7.30	7.90	7.10	7.6
9.00	9.00	8.10	9.10	7.80	9.30	7.70	7.1
7.50	8.50	7.20	8.50	8.00	8.90	7.20	7.6
9.10	9.70	8.60	9.60	9.10	9.90	9.50	7.6
7.60	8.00	7.20	8.90	7.40	7.60	7.10	7.2
7.70	8.30	7.40	8.40	7.50	8.30	7.40	8.5
7.70	7.90	7.30	8.70	7.40	7.70	7.30	8.3
8.10	8.40	7.90	8.90	7.90	8.60	7.70	7.0
8.50	9.60	8.70	9.20	8.40	9.30	8.30	8.7
9.80	9.80	9.70	9.90	8.90	9.90	9.80	9.9
9.20	9.20	8.10	9.60	8.40	9.60	8.80	9.2
9.90	9.90	9.70	9.90	9.10	10.00	9.70	9.8
8.90	8.70	7.90	9.00	8.40	9.70	8.40	7.5
9.90	10.00	9.20	9.90	9.00	10.00	9.30	8.0
7.50	8.50	7.50	8.20	7.50	8.70	7.90	9.4
8.90	9.60	8.80	9.30	8.40	9.90	9.20	9.1
7.70	8.70	7.40	8.50	7.70	8.30	7.30	7.1
9.70	9.90	9.40	9.80	9.20	9.90	9.60	10.0
9.60	9.90	8.80	9.70	9.00	9.90	9.30	9.2
7.60	8.40	7.60	8.60	7.50	8.00	7.20	7.1
8.30	8.40	7.30	8.50	7.60	7.60	7.30	7.8
8.90	8.90	8.30	9.00	8.30	9.50	8.70	9.4
9.50	9.90	8.60	9.60	8.60	9.90	9.30	8.8
7.90	8.50	7.60	8.30	7.60	8.40	7.30	7.1
8.70	9.60	8.00	9.30	8.30	9.30	8.00	8.8
7.30	7.90	7.20	7.70	7.30	8.00	7.00	8.0
7.30	7.40	7.00	7.80	7.20	7.60	7.00	7.2
7.10	7.20	7.10	7.50	7.10	7.20	7.00	7.0
9.80	10.00	9.50	9.90	9.40	10.00	9.90	10.0
9.30	9.50	8.50	9.40	7.90	9.50	8.70	9.8
8.50	9.00	7.50	8.90	7.90	9.10	7.70	8.6
9.70	10.00	9.40	9.90	9.10	10.00	9.90	9.7
8.70	8.40	8.00	8.90	7.60	9.40	7.40	9.9
7.50	7.80	7.20	8.10	7.30	7.80	7.30	8.5
8.20	8.70	7.90	9.00	8.10	8.90	8.50	7.9
8.70	9.50	8.30	9.60	8.10	9.80	8.50	8.3
9.40	9.70	9.10	9.40	8.80	9.90	8.90	9.9
8.90	9.80	8.20	9.30	8.20	9.70	8.50	9.5
9.80	9.90	9.20	9.60	9.30	9.90	9.90	10.0
9.00	9.60	8.30	9.60	8.20	9.60	8.70	9.8
8.30	8.60	7.90	8.50	7.90	9.50	8.40	9.3
8.80	9.10	8.00	9.10	8.00	9.50	8.80	9.8
8.40	8.40	7.40	8.70	7.90	8.40	7.40	8.0
9.90	10.00	9.80	9.70	9.50	10.00	10.00	8.3
8.80	9.20	8.60	9.20	8.00	9.50	7.50	7.3
8.90	9.00	8.00	9.10	7.90	9.30	7.90	8.3
9.50	10.00	9.50	9.80	9.10	10.00	9.70	9.1
9.00	9.50	8.30	9.30	8.60	9.80	9.30	9.1
9.70	9.40	9.10	9.50	9.00	9.90	9.40	10.0
8.70	9.60	8.90	9.70	8.80	9.70	9.10	10.0
7.40	7.80	7.10	8.20	7.10	7.90	7.10	8.7
8.10	8.90	8.00	9.10	8.10	9.30	8.10	8.5
7.80	8.40	7.60	8.30	7.50	7.80	7.20	8.2
7.50	7.40	7.10	8.10	7.20	7.30	7.10	7.8
7.70	8.10	7.40	8.70	7.60	8.50	7.60	7.2
9.80	10.00	9.70	9.90	9.30	10.00	9.80	10.0
7.10	7.60	7.00	7.80	7.20	7.20	7.00	7.1
9.70	9.70	9.20	9.70	8.60	10.00	9.40	7.3
9.60	9.20	9.00	9.40	8.60	9.60	9.10	9.8
9.80	9.90	9.30	9.70	8.80	10.00	9.30	9.6
7.10	7.20	7.10	7.70	7.10	7.10	7.00	7.0
7.40	7.80	7.20	8.40	7.50	7.60	7.20	8.5
8.70	8.50	8.20	9.20	7.80	8.20	7.60	7.9
7.30	8.10	7.10	8.00	7.10	7.50	7.20	7.5
8.50	9.20	8.40	9.30	7.90	9.50	8.60	9.4
8.90	9.60	8.70	9.50	8.50	9.60	9.30	7.8
7.00	7.40	7.00	7.50	7.00	7.10	7.00	7.2
7.70	8.90	7.20	8.70	7.90	8.60	7.50	8.2
7.90	8.90	7.40	9.00	7.90	8.80	7.70	7.2
7.10	7.50	7.10	7.90	7.10	7.20	7.00	7.0
8.30	9.10	7.50	8.70	7.80	8.40	7.50	8.2
8.50	9.00	8.10	8.90	7.90	9.30	7.80	9.0
9.60	9.90	9.30	9.70	9.00	9.90	9.50	9.3
8.80	9.40	8.20	9.30	8.10	9.90	8.60	8.6
8.30	8.60	7.50	8.80	7.60	8.60	7.30	7.3
9.50	9.20	8.90	9.50	8.50	9.90	9.10	9.9
7.60	8.30	7.50	8.70	7.50	8.00	7.80	7.6
9.40	9.80	9.10	9.60	8.40	9.70	9.40	8.9
7.30	7.90	7.40	7.90	7.20	8.30	7.20	7.7
8.70	9.20	7.50	9.20	7.50	8.10	7.40	9.7
7.40	7.50	7.10	8.30	7.10	7.30	7.00	7.1
8.50	9.60	8.40	9.10	8.10	9.50	8.30	9.7
8.40	8.80	7.70	9.10	8.00	9.30	8.30	8.2
8.80	9.30	7.50	9.30	7.80	9.20	8.30	7.9
9.90	10.00	9.70	9.80	9.50	10.00	10.00	10.0
7.00	7.20	7.00	7.60	7.10	7.10	7.00	7.0
8.80	9.40	8.60	9.10	7.80	8.70	8.30	9.2
7.20	7.80	7.10	8.00	7.10	7.60	7.10	7.1
8.70	9.70	8.90	9.70	8.40	9.70	9.30	9.2
7.10	7.40	7.10	7.70	7.10	7.00	7.00	7.1
7.90	9.00	7.30	8.50	7.30	8.30	7.30	7.0
8.70	9.40	7.70	9.10	7.80	9.10	8.70	9.8
7.20	7.60	7.10	8.10	7.30	7.70	7.10	7.3
9.10	9.80	8.40	9.50	8.60	9.60	8.20	9.8
8.30	8.40	8.20	8.60	7.90	9.30	8.20	7.0
8.70	9.80	8.90	9.40	8.00	9.70	8.30	9.5
8.40	8.80	7.30	9.30	7.40	8.60	7.70	7.0
9.30	9.90	9.00	9.70	8.50	9.70	9.40	9.9
9.20	9.50	8.60	9.60	8.20	9.50	9.40	8.3
7.40	7.60	7.10	8.30	7.20	7.10	7.00	7.0
7.30	8.00	7.10	8.30	7.30	7.50	7.40	7.8
8.70	9.50	8.20	9.60	8.20	9.50	8.80	8.0
7.20	8.60	7.10	8.00	7.30	7.70	7.00	8.5
8.80	8.10	7.50	8.70	7.70	8.40	7.50	7.7
9.20	9.70	8.70	9.70	8.50	9.40	9.00	9.5
7.60	7.80	7.20	8.30	7.40	8.00	7.10	7.1
7.90	8.50	7.40	8.30	7.40	8.40	7.10	7.4
7.70	7.70	7.20	8.30	7.20	8.10	7.10	9.1
7.50	8.30	7.60	8.60	7.30	8.20	7.50	7.3
8.80	8.60	7.60	8.90	7.80	9.00	7.80	9.5
7.60	7.90	7.30	8.10	7.40	7.70	7.10	7.1
9.30	9.60	8.70	9.40	7.90	9.10	8.30	7.8
8.10	8.70	7.70	8.80	7.70	8.70	7.90	9.3
9.80	9.90	9.40	9.70	8.80	9.80	9.40	8.8
9.90	9.80	9.30	9.90	8.80	9.90	9.80	9.9
8.90	9.10	8.50	9.50	8.40	9.80	8.80	9.9
7.90	8.30	7.80	8.80	7.50	8.30	7.30	7.9
8.10	9.00	7.30	8.30	7.30	7.30	7.10	9.0
9.20	8.70	7.80	9.00	8.00	9.10	7.90	7.1
9.80	9.90	9.70	9.90	9.30	10.00	9.90	9.8
9.20	9.10	8.70	8.90	7.90	9.20	8.40	9.1
7.50	8.00	7.30	7.90	7.30	8.10	7.30	7.6
8.10	8.90	7.70	8.90	7.60	8.40	8.10	7.6
9.60	9.90	9.20	9.70	8.90	9.90	9.60	9.7
9.00	9.00	8.00	9.40	8.30	9.10	8.70	8.2
7.10	7.30	7.10	7.80	7.10	7.30	7.00	7.0
9.70	9.90	9.40	9.70	9.30	10.00	9.80	9.5
9.60	9.90	9.50	9.60	8.70	10.00	9.30	7.6
7.20	7.80	7.20	8.00	7.30	7.10	7.00	7.0
9.60	9.90	9.50	9.90	9.30	9.90	9.90	10.0
8.30	8.80	7.30	9.00	7.60	8.70	7.10	8.9
7.90	9.10	7.50	8.90	7.50	8.60	8.10	7.6
9.30	9.70	8.80	9.70	8.70	9.70	9.50	7.7
9.50	9.90	8.70	9.70	9.10	9.90	9.50	9.9
8.10	8.70	7.20	8.70	7.50	7.80	7.40	9.5
7.80	7.80	7.30	8.60	7.40	7.50	7.10	7.2
9.70	9.90	9.00	9.70	9.20	10.00	9.60	9.4
8.10	9.30	7.60	9.00	7.90	8.10	8.00	7.4
7.80	8.40	7.20	8.10	7.40	7.80	7.10	7.9
8.50	8.90	7.50	8.80	7.90	8.60	7.70	8.9
9.30	9.80	9.20	9.40	8.90	9.80	9.10	9.9
7.90	8.30	7.40	8.60	7.50	7.70	7.30	7.8
8.20	9.10	8.20	9.00	7.80	8.50	8.10	8.2
9.40	9.70	8.30	9.10	8.20	9.40	8.40	7.5
9.00	9.60	9.00	9.50	8.80	9.60	9.40	9.9
8.60	8.60	8.00	9.10	8.10	9.20	7.70	7.7
9.40	9.90	9.50	9.80	9.20	10.00	9.40	9.9
8.20	9.40	8.30	9.20	8.20	9.10	8.80	9.4
7.90	9.20	7.90	9.00	7.90	8.90	7.70	9.9
7.90	8.30	7.60	8.80	7.50	8.00	7.20	7.1
9.40	9.90	9.70	9.70	9.20	10.00	9.40	9.8
9.10	9.40	8.40	9.20	8.50	9.90	8.80	7.7
7.90	8.40	7.40	8.60	7.60	8.80	7.50	7.0
8.80	9.50	8.50	9.70	8.00	9.60	8.90	9.4
9.80	9.90	9.40	9.90	9.30	9.90	9.70	9.6
8.30	9.30	7.70	9.20	7.90	9.30	8.60	9.2
9.70	9.80	8.80	9.70	9.20	9.90	9.50	8.3
9.00	9.60	8.40	9.40	8.30	9.10	9.00	9.2
7.20	7.10	7.00	7.50	7.10	7.30	7.00	7.5
7.70	8.50	7.40	8.70	7.70	8.30	7.30	9.5
8.20	8.00	7.40	8.40	7.40	8.30	7.20	8.9
7.40	7.70	7.10	7.80	7.30	7.10	7.20	7.0
8.30	8.80	7.60	9.10	7.70	8.90	7.80	7.5
9.80	9.80	9.80	9.90	8.60	10.00	9.90	8.8
9.80	9.90	9.30	9.80	9.10	10.00	9.50	9.3
8.70	9.10	8.20	9.10	8.20	9.10	8.20	8.4
7.90	8.60	7.40	8.50	7.60	8.40	7.30	8.5
7.50	8.00	7.30	8.00	7.40	8.00	7.10	7.1
7.20	7.60	7.20	8.00	7.40	7.30	7.00	8.9
9.50	9.70	8.30	9.60	8.70	9.80	8.70	9.7
8.30	8.10	7.50	9.00	7.30	7.50	7.20	7.4
9.50	9.80	9.50	9.70	9.10	9.80	8.80	9.3
8.40	8.70	8.10	9.20	7.90	8.50	7.30	8.1
9.80	9.80	8.70	9.60	8.70	9.90	9.40	9.9
8.70	8.50	7.50	8.40	7.70	8.20	7.30	8.6
9.70	9.90	8.90	9.80	9.00	9.90	9.20	9.4
7.80	8.50	8.00	8.80	8.00	9.20	7.30	7.4
8.30	8.70	7.50	8.40	7.50	8.70	7.20	7.8
8.00	8.40	7.50	8.60	7.50	7.50	7.20	8.8
7.50	8.20	7.20	8.50	7.30	8.00	7.10	7.0
9.70	9.90	9.50	9.80	8.70	10.00	9.90	9.8
9.70	9.90	9.70	9.90	9.40	10.00	9.80	9.8
7.00	7.10	7.00	7.20	7.00	7.00	7.00	7.0
7.50	8.20	7.10	8.40	7.20	7.80	7.10	8.0
8.60	9.20	8.50	9.20	8.50	9.60	8.40	8.1
9.00	9.40	7.90	9.50	8.40	9.30	8.20	9.7
8.40	8.70	7.50	9.20	7.80	8.30	7.70	7.6
8.00	9.20	7.80	8.90	7.90	8.40	7.30	10.0
8.50	8.70	8.20	9.40	7.80	9.50	8.20	7.9
7.20	8.20	7.30	8.30	7.50	7.80	7.10	7.5
7.20	7.90	7.10	7.90	7.20	7.70	7.00	8.3
8.30	8.60	7.30	9.00	7.80	8.20	8.10	7.7
7.20	7.40	7.10	7.80	7.10	7.20	7.00	7.3
9.20	9.80	8.80	9.50	8.60	10.00	9.30	9.6
8.40	9.00	7.50	9.10	8.00	8.90	8.00	9.2
7.30	7.50	7.00	8.00	7.30	7.10	7.00	7.8
8.40	9.50	8.30	9.40	8.20	9.40	9.20	9.0
7.60	8.10	7.60	8.60	7.30	8.00	7.10	7.6
7.60	8.40	7.30	8.40	7.30	8.20	7.10	7.3
7.40	7.80	7.10	8.00	7.20	7.50	7.10	7.0
8.70	9.00	8.00	9.40	7.70	8.90	7.80	7.9
9.50	9.90	9.30	9.60	9.10	9.90	9.50	9.0
9.30	9.80	8.80	9.60	9.20	9.70	9.40	8.7
9.80	9.80	9.00	9.70	8.60	10.00	9.30	9.8
8.20	9.00	7.10	8.90	7.50	8.90	7.50	7.9
8.00	8.40	7.30	8.40	7.30	7.90	7.40	7.2
8.80	9.30	8.70	9.20	8.20	9.10	8.20	8.4
8.70	8.70	7.40	8.90	7.80	9.20	7.60	9.4
7.10	7.60	7.00	7.70	7.10	7.10	7.00	7.1
8.60	8.50	7.90	9.20	7.80	9.20	7.40	8.6
7.70	8.00	7.20	8.50	7.40	8.10	7.10	9.2
8.10	8.80	7.70	8.90	8.00	9.10	7.90	8.7
8.40	9.20	8.50	9.50	8.50	9.80	8.20	9.7
9.20	9.70	9.20	9.60	9.00	9.80	9.60	9.5
9.90	9.80	9.30	9.80	8.80	9.90	9.80	9.9
9.60	9.90	8.70	9.60	8.30	9.90	9.30	9.5
7.00	7.20	7.00	7.30	7.00	7.00	7.00	7.3
7.60	8.20	7.40	8.90	7.60	8.10	7.30	7.2
8.30	9.20	7.90	9.10	8.00	9.00	8.00	8.9
9.60	9.80	8.50	9.50	8.60	9.80	9.20	7.6
8.50	8.80	7.60	8.80	7.80	8.90	7.40	8.5
9.80	10.00	9.30	9.90	9.20	9.90	9.90	10.0
9.50	9.80	9.40	9.50	8.90	10.00	9.70	10.0
8.50	9.20	8.10	9.10	8.50	9.70	7.70	9.9
7.40	7.90	7.10	8.20	7.10	7.90	7.30	7.2
8.00	9.20	7.90	9.10	8.00	8.80	7.30	9.6
9.20	9.60	8.00	9.50	8.40	9.60	9.50	10.0
8.80	9.70	8.20	9.50	8.90	9.50	8.20	8.8
7.10	7.60	7.40	7.80	7.20	7.40	7.00	7.1
9.00	9.70	8.20	9.50	7.90	9.60	8.60	9.9
7.60	8.90	8.40	9.20	7.90	8.20	7.60	8.2
9.70	9.70	9.30	9.70	9.00	9.90	9.60	7.8
8.20	9.20	8.10	9.00	7.70	9.00	8.60	7.3
9.00	9.00	8.10	9.30	8.00	10.00	8.70	9.9
9.10	9.30	8.20	9.50	8.20	9.70	8.50	9.4
10.00	10.00	9.80	9.90	9.40	10.00	9.90	9.4
7.50	8.30	7.30	8.30	7.90	7.60	7.20	7.3
9.80	9.90	9.10	9.40	8.30	9.90	9.20	9.4
8.90	9.50	8.60	9.60	8.40	9.20	8.00	9.7
7.90	8.80	7.40	8.50	7.50	8.20	8.10	9.2
9.30	9.90	9.10	9.60	9.00	9.60	9.50	9.8
7.80	8.70	7.60	8.70	7.60	9.10	7.30	7.1
9.00	9.60	8.60	9.20	7.80	9.30	8.10	7.3
9.50	9.80	8.50	9.30	8.40	9.60	8.90	8.2
8.70	9.60	8.70	9.10	8.40	9.70	8.40	9.9
7.90	8.40	7.40	8.40	7.50	7.90	7.30	7.5
7.00	7.10	7.00	7.60	7.10	7.10	7.00	7.0
9.20	9.90	8.70	9.70	9.50	9.90	9.60	9.3
8.90	9.00	7.60	9.20	7.80	9.30	7.70	7.7
7.80	8.10	7.70	8.60	7.50	8.60	7.20	8.2
7.80	8.10	7.40	8.10	7.30	8.40	7.10	8.0
9.40	9.90	9.60	9.70	9.50	10.00	9.80	10.0
9.30	9.50	8.70	9.50	8.20	9.70	8.90	8.5
8.40	9.50	8.60	9.20	8.40	9.70	8.60	8.2
9.70	9.90	9.00	9.90	9.00	10.00	9.70	8.4
9.00	9.70	8.70	9.40	8.10	9.80	9.10	9.6
9.30	9.50	8.80	9.70	8.50	9.90	9.50	8.3
7.90	9.30	8.10	9.20	7.70	9.00	8.40	7.3
8.80	9.60	8.80	9.50	8.30	9.80	8.50	7.6
7.40	7.50	7.10	7.80	7.30	7.30	7.00	7.4
9.70	9.90	8.60	9.80	9.30	10.00	9.70	8.2
7.80	8.20	7.40	9.00	7.40	7.90	7.20	9.7
9.20	9.50	8.70	9.60	8.20	9.60	8.80	8.8
8.30	8.70	7.90	9.10	8.40	9.50	8.40	9.2
7.80	8.70	7.50	8.30	7.40	8.40	7.40	7.3
9.80	9.90	9.60	9.90	9.10	10.00	9.80	9.9
7.90	8.40	7.50	8.50	7.90	8.20	7.50	7.1
9.00	9.40	8.70	9.60	8.40	9.70	8.70	7.9
8.40	9.20	8.00	9.00	7.90	9.20	8.40	8.2
9.70	9.60	9.20	9.50	8.90	9.50	9.40	10.0
7.30	7.60	7.10	7.70	7.10	7.10	7.00	7.7
7.80	8.20	7.50	8.20	7.40	7.60	7.20	7.0
8.40	9.20	8.10	9.30	7.70	8.40	7.70	9.8

为什么不能使用K均值聚类呢?

因为K均值聚类只能对案例做聚类,这个是对变量做聚类

而且K均值聚类需要确定类别数,目前是不知道的

SPSS(十五)spss之聚类分析(图文+数据集)[通俗易懂]

我们是对变量做聚类,冰柱图看起来太麻烦了,直接看树状图

SPSS(十五)spss之聚类分析(图文+数据集)[通俗易懂]

聚类过程 ,系数代表距离,距离什么含义,要看我们使用了什么距离指标

SPSS(十五)spss之聚类分析(图文+数据集)[通俗易懂]

树状图,233.297换算成下面的25

SPSS(十五)spss之聚类分析(图文+数据集)[通俗易懂]

发现意大利和东方集团(中国、俄罗斯、罗马尼亚)聚类有一些问题

变量聚类一般默认距离为相关性(默认是平方欧氏距离)

SPSS(十五)spss之聚类分析(图文+数据集)[通俗易懂]

SPSS(十五)spss之聚类分析(图文+数据集)[通俗易懂]

得到的结果好很多

 SPSS(十五)spss之聚类分析(图文+数据集)[通俗易懂]

这个例子也可以使用因子分析解决

扩展:

一般聚类方法组间联接是最好的;ward法聚类出来会比较平均

SPSS(十五)spss之聚类分析(图文+数据集)[通俗易懂]

度量标准 :案例–平方欧式距离最好

变量–皮尔逊相关性最好

SPSS(十五)spss之聚类分析(图文+数据集)[通俗易懂]

关于标准化问题

K均值聚类需要自己手动

系统聚类如下

SPSS(十五)spss之聚类分析(图文+数据集)[通俗易懂]

 

前面说的两种方法是经典的分析聚类方法,还有智能分析聚类方法

两步聚类算法(TwoStep Cluster)

特点:

  •  处理对象:分类变量和连续变量
  • 自动决定最佳分类数
  • 快速处理大数据集 

前提假设:

  • 变量间彼此独立
  • 分类变量服从多项分布,连续变量服从正态分布

 

其实稍微违反假设条件其实也不要紧,结果很稳健,其会自动剔除异常值

数据集还是(我的资源下载“spss之聚类分析–移动通讯客户细分”

SPSS(十五)spss之聚类分析(图文+数据集)[通俗易懂]

spss使用该模型自动对连续变量进行标化

SPSS(十五)spss之聚类分析(图文+数据集)[通俗易懂]

设置其最大聚类数

SPSS(十五)spss之聚类分析(图文+数据集)[通俗易懂] 

 

聚类需要注意的地方

  • 距离测量方法

使用默认值即可

  • 变量选择

无关变量有时会引起严重的错分
应当只引入在不同类间有显著差别的变量
尽量只使用相同类型的变量进行分析(使用连续变量,将分类变量用于结果解释;新的聚类方法比如两步聚类算法可以同时使用这些变量)

  • 共线性问题

对记录聚类结果有较大的影响,相当于某个变量在聚类中的权重大于其它变量
最好先进行预处理

  • 变量的标准化

变量量纲/变异程度相差非常大时需要进行
数理统计算法上要求一律标准化
标准化后会削弱有用变量的作用

  • 异常值

影响较大
还没有比较好的解决办法
尽力避免

  • 分类数

从实用角度讲,2~8类比较合适

  • 专业意义

一定要结合专业知识进行分析

  • 其他方面

聚类分析主要应用于探索性的研究,其分析的结果可以提供多个可能的解,选择最终的解需要研究者的主观判断和后续的分析
聚类分析的解完全依赖于研究者所选择的聚类变量,增加或删除一些变量对最终的解都可能产生实质性的影响
不管实际数据中是否真正存在不同的类别,利用聚类分析都能得到分成若干类别的解
 

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 举报,一经查实,本站将立刻删除。

发布者:全栈程序员-用户IM,转载请注明出处:https://javaforall.cn/180643.html原文链接:https://javaforall.cn

【正版授权,激活自己账号】: Jetbrains全家桶Ide使用,1年售后保障,每天仅需1毛

【官方授权 正版激活】: 官方授权 正版激活 支持Jetbrains家族下所有IDE 使用个人JB账号...

(0)
blank

相关推荐

  • mysql中字符转数字,MYSQL字符数字转换为数字「建议收藏」

    mysql中字符转数字,MYSQL字符数字转换为数字「建议收藏」1、将字符的数字转成数字,比如’0’转成0可以直接用加法来实现例如:将user表中的uid进行排序,可uid的定义为varchar,可以这样解决select*fromuserorderby(uid+0)2、在进行ifnull处理时,比如ifnull(a/b,’0′)这样就会导致a/b成了字符串,因此需要把’0’改成0,即可解决此困扰3、比较数字和varchar时,比如a=11,…

  • 创建KVM虚拟机_安卓kvm虚拟机

    创建KVM虚拟机_安卓kvm虚拟机可以用两种方法创建kvm虚拟机,一种是virt-manager管理工具创建,一种是命令行的方式。1.命令行方式创建kvm虚拟机。先创建qcow2格式的镜像文件,大小为20G。qemu-imgcreate-fqcow2/data/kvm/images/centos7.6×86.qcow20G输入命令进行虚拟机的安装:virt-install–name=centos7.6×86–vcpus=2–ram=2048–diskpath=/data/kvm/imag

    2022年10月26日
  • 如何用ghost备份系统_服务器raid5如何做备份恢复

    如何用ghost备份系统_服务器raid5如何做备份恢复‍电脑安装完系统后,要及时对系统进行备份,这样系统出现什么问题,就可以快速恢复。我们可以用手动Ghost工具对系统进行备份操作。下面和系统城小编一起了解手动Ghost备份系统的具体操作。1、重启电脑,快速按F8,进入DOS界面,运行Ghost.exe;2、选择Local(本机)——Partition(分区)——ToImage(镜像),备份镜像文件到指定文件夹;3、选择备份源的磁盘驱动器(电脑硬盘…

  • 长亮科技中报业绩_2018年年报汇总

    长亮科技中报业绩_2018年年报汇总长亮科技发布2018年报:营收首破十亿元,直面蚂蚁金服竞争压力

  • STM32芯片之看门狗

    STM32芯片之看门狗本章介绍STM32F4**系列芯片的看门狗模块内容STM32F4**系列芯片具有两个嵌入式看门狗外设,具有安全性高、定时准确及使用灵活的优点。两个看门狗外设(独立和窗口)均可用于检测并解决由软件错误

  • js indexOf 的正确用法「建议收藏」

    js indexOf 的正确用法「建议收藏」indexOf在js中有着重要的作用,可以判断一个元素是否在数组中存在,或者判断一个字符是否在字符串中存在,如果存在返回该元素或字符第一次出现的位置的索引,不存在返回-1。例如vararr=[1,2,3];console.log(arr.indexOf(2));//打印结果为1又或者varstr=”helloworld”;console.log(str.indexOf(“w”));//打印结果为5那么,当想删除某个数组中的某个元素时,常常会这么

发表回复

您的电子邮箱地址不会被公开。

关注全栈程序员社区公众号