记一次有趣的区分三角形和四边形的AI试验

2024-04-01 18:42:04
开发
37

缘由

近段有个有趣想法：如果在一个二维的画布上画上三角形和四边形，AI可以将这些简单图形区别开么？

问题分析

初分析来看，觉得此问题虽然看似简单，但可能还是存在一些难度。例如，如果有些三角形，实际上是四边形内部的三角形时，是不是AI学习器也很不好区分？

再深入分析下去，首先遇到的问题，就是如何要对此二分类问题产生大量的三角形和四边形数据。

这些数据首先要具有随机性，次之还要避免重复，再者要避免成为一条直线，觉得还是稍微复杂了点。

那么能否采用较为简单的场景呢，因为三角形和四边形都具有顶点，问题可以简化为几个表达特征的顶点即可。

想到一般在送入学习器前，都需要将二维数据转化为向量数据，那么实际上这个问题可以进一步简化为向量中非零的个数问题。

但对于要试验的问题，未从理论上进行分析和确认，仅在直观上来看，似乎差距并不是很大。四个顶点信息，通常蕴含或内嵌一些三个顶点信息，所以，AI将其区分开，可能也没有那么简单。

是否线性问题分析

在一个向量中非零元素的个数，这个问题从理论上而言，是一个线性问题，因为仅需要o(N)复杂度就可以将这个问题解决。

如果AI可以学得计算某一个向量的计算非零元素个数的算法，就可以将这个问题解决。

AI试验

对于自己来讲，比较熟悉的还是OpenCV SVM技术手段。虽然，在技术原理上，SVM支持向量机用超平面的办法来区分不同的分类，可能对于计算向量非零元素个数的概念拟合的不够好，但不正好可以借助这个问题，试试SVM支持向量机AI的能力。

如果在这个问题上SVM能力欠缺，则准备试验CNN神经网络学习器试试

结论先行

最终试验来看，SVM支持向量机可以很好地解决问题，甚至在对于不可见数据，例如，二分类之外，其它的非零个数向量数据，也能够区分的相当棒

试验准备

在一个向量中选择非零元素的位置是一个顺序无关的组合问题，所以，可以粗略计算某一个非零量级向量集合的规模数据。
在阅读《西瓜书.机器学习》书籍时谈到分类问题中类别不平衡的问题，所以，在产生数据集时，需要选择空间规模大致一致的非零个数向量数据。

同时，因为随机性的存在，对于某一非零个数向量，粗略按照其空间个数的的十倍进行采样数据。

不可见数据的试验

对于选定的两个量级的非零元素个数后，其它非零元素个数的向量，那么其实可以作为不可见数据，对于这些不可见数据，恰好可以测试模型的泛化能力。

原来想着对于这些不可见数据，模型针对于某一非零元素个数的向量预测的成功率可能是对错参半，但，实际上以形成模型的量级为楚河汉界，归为二分类的其中某一类了。

AI的能耐

回归、分类、统计概率分布可以认为是AI的最基本的能力
马尔可夫过程智能生成最大可能性数据序列，例如，语音识别
以关键词为代表的搜索引擎，将很快替换为以chatGPT为代表的搜索技术

从信息论观点来看，交流式搜索，将提供更多的信息输入，更有助于搜索引擎梦寐以求的用户信息，来消除不确定性

生成式智能，技术原理待补

参考

svm试验代码

原文地址:https://blog.csdn.net/jkler_doyourself/article/details/137207439 本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：https://www.suanlizi.com/kf/1774749062319443968.html 如若内容造成侵权/违法违规/事实不符，请联系《酸梨子》网邮箱：1419361763@qq.com进行投诉反馈，一经查实，立即删除！

阅读全部

相关推荐

记一次有趣的区分三角形和四边形的AI试验

2024-04-01 18:42:04 38 阅读
记一次生产事故的排查和解决

2024-04-01 18:42:04 29 阅读
记一次面试题

2024-04-01 18:42:04 49 阅读
记一次jar冲突的问题

2024-04-01 18:42:04 62 阅读
记一次DateTimeFormat注解的坑

2024-04-01 18:42:04 53 阅读
一次有趣的经历分享

2024-04-01 18:42:04 56 阅读
一次有趣的前端加密分析

2024-04-01 18:42:04 37 阅读
【Gitlab】记一次升级 Gitlab 后 API 失效的问题

2024-04-01 18:42:04 23 阅读
记一次堆内外内存问题的排查和优化

2024-04-01 18:42:04 49 阅读
记一次Log记录大对象导致的CPU异常和磁盘打满

2024-04-01 18:42:04 53 阅读

最近更新

题解 - 序列

2024-04-01 18:42:04 116 阅读
CST热仿真案例——电动车直流快充Cable热仿真

2024-04-01 18:42:04 102 阅读
docker php8.1+nginx base 镜像 dockerfile 配置

2024-04-01 18:42:04 94 阅读
Could not load dynamic library ‘cudart64_100.dll‘

2024-04-01 18:42:04 100 阅读
NoSQL之Redis非关系型数据库

2024-04-01 18:42:04 101 阅读
2024.7.22 作业

2024-04-01 18:42:04 96 阅读
GDB调试正在运行的程序

2024-04-01 18:42:04 81 阅读
昇思25天学习打卡营第18天| DCGAN生成漫画头像

2024-04-01 18:42:04 85 阅读
在Django里面运行非项目文件

2024-04-01 18:42:04 82 阅读
SSD基本架构与工作原理

2024-04-01 18:42:04 87 阅读
在誉天学习完HCIE就业吗？

2024-04-01 18:42:04 93 阅读
【合同专题】合同终止协议书、项目合作协议、交底纪要、管理台账

2024-04-01 18:42:04 84 阅读
驾驭云原生日志洪流：高效分析与管理的策略集

2024-04-01 18:42:04 85 阅读
go 协程池的实现

2024-04-01 18:42:04 88 阅读
Shell脚本循环语句与函数

2024-04-01 18:42:04 89 阅读
连锁店收银系统源码（收银称重pos+聚合支付+ERP进销存+营销+会员管理）

2024-04-01 18:42:04 93 阅读
TIA博途V19无法勾选来自远程对象的PUT/GET访问的解决办法

2024-04-01 18:42:04 85 阅读
四大引用——强软弱虚

2024-04-01 18:42:04 86 阅读
Python语言-面向对象

2024-04-01 18:42:04 91 阅读
如何分清楚常见的 Git 分支管理策略Git Flow、GitHub Flow 和 GitLab Flow

2024-04-01 18:42:04 85 阅读
网站安全-CDN篇

2024-04-01 18:42:04 88 阅读

热门阅读

vue v-for 同时遍历两个组数

2024-04-01 18:42:04 37 阅读
技术详解 | 黑客如何通过PDF文件分发恶意软件

2024-04-01 18:42:04 32 阅读
选择排序---算法

2024-04-01 18:42:04 33 阅读
C语言----预处理（详解）

2024-04-01 18:42:04 39 阅读
【python】pip清华大学镜像

2024-04-01 18:42:04 38 阅读
Go 语言学习一篇入门

2024-04-01 18:42:04 30 阅读
用Wireshark解码H.264

2024-04-01 18:42:04 29 阅读
AWTK 开源串口屏开发(15) - 通过 MODBUS 访问远程设备数据

2024-04-01 18:42:04 36 阅读
使用C++ opencv创建小视口

2024-04-01 18:42:04 36 阅读
黑马鸿蒙笔记 3

2024-04-01 18:42:04 36 阅读
redis 常用命令

2024-04-01 18:42:04 36 阅读
工业互联网体系架构：重塑制造业的未来之路

2024-04-01 18:42:04 36 阅读
docker run 使用 -p 命令一直显示端口被占用

2024-04-01 18:42:04 37 阅读
step-by-step系列之-openGauss1-0-1-Docker版本单机安装指南

2024-04-01 18:42:04 27 阅读
git 更改仓库地址

2024-04-01 18:42:04 42 阅读
2024.2.6力扣每日一题——魔塔游戏

2024-04-01 18:42:04 43 阅读
Python 树结构库treelib使用教程

2024-04-01 18:42:04 41 阅读
开源的网易云音乐api

2024-04-01 18:42:04 38 阅读
鸿蒙TypeScript入门学习第6天：【条件语句】

2024-04-01 18:42:04 35 阅读
npm常用命令详解

2024-04-01 18:42:04 37 阅读
蓝桥杯备考随手记: practise03

2024-04-01 18:42:04 38 阅读
骨传导耳机哪个牌子好？5款口碑销量双优质骨传导耳机揭晓

2024-04-01 18:42:04 33 阅读
揭秘期货交易策略：稳健盈利的四大关键

2024-04-01 18:42:04 35 阅读
输出100~200之间的素数（C语言）

2024-04-01 18:42:04 41 阅读
书生浦语-hello world

2024-04-01 18:42:04 38 阅读
Learning from Multiple Annotator Noisy Labels via Sample-wise Label Fusion

2024-04-01 18:42:04 36 阅读
git - - - 克隆仓库时输入指定账号和密码

2024-04-01 18:42:04 32 阅读
探索父进程和子进程

2024-04-01 18:42:04 35 阅读
爬虫实践（1）

2024-04-01 18:42:04 37 阅读
爬虫工作量由小到大的思维转变---＜第六十三章 Scrapy统计收集器类的分析与应用(2)＞

2024-04-01 18:42:04 28 阅读