【R语言实战】聚类分析及可视化

🍉CSDN小墨&晓末:https://blog.csdn.net/jd1813346972

   个人介绍: 研一|统计学|干货分享
         擅长Python、Matlab、R等主流编程软件
         累计十余项国家级比赛奖项,参与研究经费10w、40w级横向

洛杉矶街区数据(LA.Neihborhoods.csv) 这是美国普查局2000年的数据。一共有110个街区,15个变量。变量情况见下表。表中API为涉及学生成绩的Academic Performance Index的缩写。增加单位面积下的人口数(变量名density),试对修改后的数据按照income,age,homes,white和density的数据进行系统聚类和Kmeans聚类分析(分成5类),并根据所分类别和每个街区的经纬度,把各个类用不同的符号画图进行可视化。

1 系统聚类及可视化

  运行代码:

w=read.csv("E://mvstats5/data/LA.Neighborhoods.csv")#读入数据
w=data.frame(w,density=w$Population/w$Area)#增加人口密度变量
u=w[,c(1,2,5,6,11,16)]#选择变量
hw=hclust(dist(scale(u[,-1])), "ward.D2") #对标准化的数据做分层聚类, 聚类方法选的"ward.D2"
plot(hw,labels=u[,1],cex=0.6)#画树状图
id=identify(hw)#手工分成5份
rect.hclust(hw,5)

  运行结果:

在这里插入图片描述

2 KMeans聚类及可视化

  运行代码:

a=kmeans(scale(u[,-1]),5);ppp=c(7,17,19,21)
plot(w[a$cluster==1,14:15],pch=1,col=1,xlim=c(-118.7,-118.2),ylim=c(33.73,34.32),main="Los Angeles")
for(i in 2:5){
  points(w[a$cluster==i,14:15],pch=ppp[i-1],col=2:5)
  legend("bottomleft",pch=c(1,ppp),paste("Cluster",1:4))
}

  运行结果:

在这里插入图片描述

相关推荐

最近更新

  1. TCP协议是安全的吗?

    2024-03-11 16:56:05       16 阅读
  2. 阿里云服务器执行yum,一直下载docker-ce-stable失败

    2024-03-11 16:56:05       16 阅读
  3. 【Python教程】压缩PDF文件大小

    2024-03-11 16:56:05       15 阅读
  4. 通过文章id递归查询所有评论(xml)

    2024-03-11 16:56:05       18 阅读

热门阅读

  1. Unity3D AStar地图编辑与寻路测试详解

    2024-03-11 16:56:05       28 阅读
  2. JVM双亲委派模型

    2024-03-11 16:56:05       20 阅读
  3. C#面:& 和 && 区别

    2024-03-11 16:56:05       21 阅读
  4. 中间件 | Redis - [big-key & hot-key]

    2024-03-11 16:56:05       23 阅读
  5. 机器学习--->数据降噪

    2024-03-11 16:56:05       16 阅读
  6. C#使用Queue<T>类进行队列设计

    2024-03-11 16:56:05       19 阅读
  7. Qt6 | 开发经验C++、QML、安卓常见问题合集

    2024-03-11 16:56:05       18 阅读
  8. Spring Cloud GateWay整合熔断器实现限流

    2024-03-11 16:56:05       25 阅读