CDA二级(Level II)数据分析师——考试内容梳理三(简单重点案例)

PR曲线是基于召回率的准确性来进行判断的;

混淆矩阵:

在这里插入图片描述
ROC曲线真阳性率(敏感性、召回率)为纵坐标假阳性率(1-特异性)为横坐标
假阳性率:负样本中被误认为正样本的概率 FP/FP+TN
真阳性率:正样本中被预测为正样本的概率 TP/TP+FN
精确率(Precision):预测的正样本中有多少预测正确 TP/TP+FP
召回率(Recall):真正的正样本中有多少预测正确 ·TP/TP+FN·
特异性·TN/FP+TN·
1-特异性1-TN/FP+TN=FP/TP+TN

方差分析表:

在这里插入图片描述
总离差平方和SST=6.44+3.4=9.84(1)
回归平方和SSR残差平方和SSE
SSE的自由度为18
SSR的自由度为n,模型参数个数1
SST的自由度为18+1=19(3)
均方MS平方和除以相应的自由度
SSR的MS=6.44/1=6.44(4)
F=MSB/MSW=组间均方/组内均方=6.44/1 / 3.4/18 =34.094
组间平方和MSB=MSR=SSR/df
组内平方和MSW=MSE=SSE/df

案例:

40% 30% 30%
0.2 0.6 0.2
线下店长预测未来一个月销量:24000.2+16000.6+10000.2=1640
最可能销量加权值:1500
0.4+18000.3+16000.3=1620
综合三人判断,预测年度销量:1640+18000.3+16400.3=1648*12=19776
信度为预测3中场景销量,这组数据的标准差的倒数(n-1)

相关推荐

最近更新

  1. TCP协议是安全的吗?

    2024-06-18 22:08:04       18 阅读
  2. 阿里云服务器执行yum,一直下载docker-ce-stable失败

    2024-06-18 22:08:04       19 阅读
  3. 【Python教程】压缩PDF文件大小

    2024-06-18 22:08:04       18 阅读
  4. 通过文章id递归查询所有评论(xml)

    2024-06-18 22:08:04       20 阅读

热门阅读

  1. 05-5.5.1 哈夫曼树

    2024-06-18 22:08:04       10 阅读
  2. 01-GIt

    01-GIt

    2024-06-18 22:08:04      4 阅读
  3. 部署YUM仓库及NFS共享服务

    2024-06-18 22:08:04       5 阅读
  4. Linux CFS 调度器 (1):概述

    2024-06-18 22:08:04       8 阅读
  5. 语言中 函数用地址传参的好处

    2024-06-18 22:08:04       10 阅读
  6. CSS中几种常用的清除浮动的方法

    2024-06-18 22:08:04       6 阅读
  7. BootStrap

    2024-06-18 22:08:04       6 阅读
  8. 我与华为的缘分

    2024-06-18 22:08:04       7 阅读
  9. 系统架构师面试题

    2024-06-18 22:08:04       9 阅读