数据分析--客户价值分析RFM(K-means聚类/轮廓系数)


原数据

import os
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns
from sklearn import metrics
### 数据抽取,读⼊数据
df = pd.read_csv("customers1997.csv") #相对路径读取数据
print(df.info())
print(df.columns)
print(df.describe())
# 特征选择,选择RFM
df = df.drop(labels=['customer_id','country','education','gender','member_card','total_children'],axis=1)

一、 K-means聚类

1. K-means聚类 

from sklearn.cluster import KMeans
from sklearn.metrics import silhouette_score
kmeans = KMeans(n_clusters=4)   #构造聚类模型,划分为 4 类
kmeans.fit(df)  # 聚类
pre_y = kmeans.predict(df)  # 预测点在哪个聚类中,或者是直接采用 kmeans.labels_ 提取
print(pre_y)  # 输出每个样本的聚类标签
from sklearn import metrics
print("轮廓系数:",metrics.silhouette_score(df, pre_y,metric='euclidean'))
# print("轮廓系数:",metrics.silhouette_score(df, kmeans.labels_,metric='euclidean'))

2. 轮廓系数 

 轮廓系数取值范围[-1,1]

  • -1的效果最差
  •  1 的效果最好

二、分箱法分类 

1. 分类

数据分析--客户价值分析RFM(分箱法/标准化)-CSDN博客

2.轮廓系数

from sklearn import metrics
df_rfm = df[['Recency','Frequency', 'Monetary']]
print("轮廓系数:",metrics.silhouette_score(df_rfm, df['Segment'],metric='euclidean'))

 

Python——Kmeans聚类算法、轮廓系数(算法理论、代码)_python kmeans-CSDN博客

相关推荐

最近更新

  1. docker php8.1+nginx base 镜像 dockerfile 配置

    2024-05-02 19:36:03       98 阅读
  2. Could not load dynamic library ‘cudart64_100.dll‘

    2024-05-02 19:36:03       106 阅读
  3. 在Django里面运行非项目文件

    2024-05-02 19:36:03       87 阅读
  4. Python语言-面向对象

    2024-05-02 19:36:03       96 阅读

热门阅读

  1. 图搜索算法详解

    2024-05-02 19:36:03       31 阅读
  2. 【AIGC半月报】AIGC大模型启元:2024.04(下)

    2024-05-02 19:36:03       35 阅读
  3. 如何在前端展示后端返回的pdf Base64格式字符串

    2024-05-02 19:36:03       28 阅读
  4. 第二弹:走进CSS世界,学习记录

    2024-05-02 19:36:03       30 阅读
  5. 【C++】循环语句中引起的循环引用问题

    2024-05-02 19:36:03       37 阅读
  6. npm详解

    2024-05-02 19:36:03       41 阅读
  7. C++可变参数模板中的省略号

    2024-05-02 19:36:03       36 阅读
  8. 子查询

    2024-05-02 19:36:03       40 阅读
  9. 中了内存马如何排查(不死马)

    2024-05-02 19:36:03       34 阅读
  10. MyBatis-plus笔记——分页插件

    2024-05-02 19:36:03       35 阅读