案例 25: 计算相关系数
知识点讲解
在统计分析中,了解变量之间的关系是非常重要的。相关系数是衡量变量之间线性相关程度的一种方法。Pandas 提供了 corr
方法来计算列之间的相关系数。
- 相关系数: 相关系数的值范围在 -1 到 1 之间。接近 1 表示正相关,接近 -1 表示负相关,接近 0 表示没有线性相关。
示例代码
# 准备数据和示例代码的运行结果,用于案例 25
# 示例数据
data_correlation = {
'Height': [150, 160, 170, 180, 190],
'Weight': [50, 60, 70, 80, 90]
}
df_correlation = pd.DataFrame(data_correlation)
# 计算相关系数
correlation_matrix = df_correlation.corr()
correlation_matrix
在这个示例中,我们计算了身高和体重两个变量之间的相关系数。
示例代码运行结果
Height Weight
Height 1.0 1.0
Weight 1.0 1.0
这个结果表明身高和体重之间存在完美的正相关关系(相关系数为 1)。这种分析在探索变量间关系时非常有帮助。