SPSS中如何进行快速聚类分析「建议收藏」

全栈程序员-用户IM • 2022年10月17日下午3:36 • 未分类

大家好，又见面了，我是你们的朋友全栈君。如果您正在找激活码,请点击查看最新教程,关注关注公众号 “全栈程序员社区” 获取激活教程,可能之前旧版本教程已经失效.最新Idea2022.1教程亲测有效,一键激活。

Jetbrains全系列IDE稳定放心使用

作为广受数据分析师青睐的一款数据统计和分析软件，IBM SPSS Statistics中有全面的数据分析方法，今天我们要介绍的是它的聚类分析中的快速聚类分析。

一、方法概述

聚类分析是将研究对象按照一定的标准进行分类的方法，分类结果是每一组的对象都具有较高的相似度，组间的对象具有较大的差异。

这类分析方法多用于对于数据样本没有特定的分类依据的情况，IBM SPSS Statistics会通过对数据的观察为用户做出较为完善的分类。

图1：功能位置

快速聚类是聚类分析的一种，使用到的功能在“分析”——“分类”中的“K-均值聚类”。

二、案例分享

1.样本数据

图2：样本数据

我们这里选择的数据样本是一部分学生的各科期末成绩，使用快速聚类方法可以分析各个学生成绩分布的差异和共性。

2.变量设置

图3：变量设置

我们将学生的所有单科成绩作为分析变量，移入到“变量”窗口中，将学生的编号变量移入到下侧的“个案标记依据”窗口。

聚类数设置的是分类的数目，这个需要根据数据样本的特点来设置，我们这里设置为4类。

聚类方法有两类，即迭代和分类，前者较为复杂，会在分析过程中不断移动凝聚点，后者则始终使用初始凝聚点，我们选择两类都有的第一种分析方法。

3.聚类中心

图4：聚类中心

用户可以选择从外部文件或数据文件中写入或读取聚类中心，本案例中我们不使用这个功能。

4.迭代设置

图5：迭代设置

我们可以设置迭代的终止条件，即到达设定的最大值后将停止迭代分析，输出聚类分析结果。

收敛性标准设置的是凝聚点改变的最大距离小于初始凝聚点的比例，小于设定值时，也会停止迭代，输出结果。

使用运行均值表示每次观测后都重新计算凝聚点，这些设置保持默认即可。

5.保存

图6：保存新变量

这是用来设置保存形式的，勾选“聚类成员”将保存SPSS的分类结果，勾选“与聚类中心的距离”将保存观测值和所属类别的欧氏距离，我们不做设置。

6.选项

图7：选项设置

这个对话框设置的是输出的统计量和个案缺失处理方法，勾选“初始聚类中心”和“每个个案的聚类信息”。

7.结果输出

图8：聚类结果

在输出日志中可以看到，这些学生根据他们的单科成绩被分成了四类，SPSS输出了多个表格，包括初始聚类中心、迭代历史记录、聚类成员、最终聚类中心、最终聚类中心之间的距离和每个聚类中的个案数目，完整详细，可信度较高。

三、小结

使用IBM SPSS Statistics进行快速聚类的方法和案例分享就是这么多啦，这是一个较为常用的分类分析法，适用程度很高，希望可以对大家有所帮助！

如果您对SPSS也有兴趣，欢迎进入IBM SPSS Statistics中文网站下载试用！

发布者：全栈程序员-用户IM，转载请注明出处：https://javaforall.cn/180973.html原文链接：https://javaforall.cn

【正版授权，激活自己账号】： Jetbrains全家桶Ide使用，1年售后保障，每天仅需1毛

【官方授权正版激活】： 官方授权正版激活支持Jetbrains家族下所有IDE 使用个人JB账号...

SPSS中如何进行快速聚类分析「建议收藏」

相关推荐

编写程序计算1~10的平方和_用指针比较两个数大小

dos清除windows密码命令_哪些文件会被dos病毒感染

输入3个数a,b,c,要求输出最大值_二维数组求最大值及下标

基于Mixin Network的C#语言比特币开发教程 : 用 Mixin Messenger 机器人接受和发送比特币…

关于allow_url_fopen的设置与服务器的安全–不理解

java.exe 0xc000012d_应用程序无法正常启动 0xc000012d

发表回复