非常有趣的机器学习中向量以及它和标记值组成的高维空间

讨论

基础的机器学习中,总会涉及示例向量和标记值,如何理解这些向量是一个非常有趣的问题

先从简单的开始讨论

先从我们常见的男女分类来看,如果你不能将一个人和另外一个人分开,则内卷地加入高矮、胖瘦、美丑、学历、籍贯、家世等不同的属性,直至足够多的属性加入,总可以将其区分开来。

身高 体重 美丑 学历 籍贯 家世

这些属性之间可能并不完全独立,但都含有信息量,都可以贡献出它们的区分价值。

如果从根源来讲,在哲学上认为世界上没有两片相同的树叶,你总可以发现一些不同,将其区分开来!

我们可以认为,以上的男女属性数据组成了一个特别的向量数据。

古怪的向量数据

向量数据的形成

  • 可以用已有通用知识和领域知识进行采样,然后形成向量数据

使用决策树、支持向量机等机器学习技术将其分类或回归

  • 仅可以获得全信息量的图片信息,但图片中包含的信息不能够充分描述

可以使用深度学习的机器学习技术进行暴力求解,进行黑盒式机器学习

机器学习的幸运

我们面临的世界是可以被理解的。
即使对于混沌,从有序走入混沌,以及从混沌走入有序,都是一物两面的问题。

在地图软件路径规划常用动态规划算法来探索路径,只所以地图软件能够避免对全图中最优路径的问题的暴力求解,变得非常实用,只不过是人类在现实中的路网建设,也是每一段也都是按照最优解来建设的。

所以,即使机器学习算法有自己的启发规则,或者偏好,在因为实际世界其实是有序、有规律的背景下,也是可以对不少问题达到很好的智能效果。

包括在语音识别领域,大行其道的马尔可夫假设,看起来非常的简单,我想它只所以很实用,就是因为面临的问题本身就是由规律所限制的,并不自由!

向量组成高维世界的超平面

我们知道示例向量和其标记数值形成了一个多维空间数据,并且是在原有示例向量空间之外再加入一维数据。

我们从零维向量与标记值形成的一维空间讲起,以发现它一些有趣的现象

向量与标记值组成的多维空间 说明
一维空间 这个空间的平面是一个点,比较平凡
二维空间 体现为与某轴坐标位置垂直的一条直线
三维空间 体现为与某轴坐标位置垂直的一个平面
四维空间 体现为与某轴坐标位置垂直的一个三维的超平面

N维空间的超平面界定为某一维对于其它N-1维的定值状态,三维空间的二维平面,是最好理解的例子

三维超平面的想象

其实我们是可以针对三维超平面进行想象的,也能够理解它!

对于现实中,由平面坐标、高度坐标组成的三维坐标,外加一维的时间坐标,就组成了四维的空间。

我们可以对于,从时间轴上截取的超平面来看,就是让时间值不变,相当于让时间静止,截取一个四维空间内的超平面,但它在三维空间内允许三维坐标的任何值存在的一个时间快照!

因为三维空间的无限性,它并不好想象,但却是是一个很宏大的一个表达。

我们可以用一个具体而微的三维空间,例如,自己的家,以及家里大大小小的物什组成的三维空间,按下快门,获得的照片作为那刻时间轴的超平面的理解。

这个超平面我们看不到随着时间的消磨,那些三维物体的变化,成为了那一刻的永恒

我们的宏观世界,只所以并不是一个可以容纳包括时间轴在内的四维空间的更高维空间,就是不存在以那些维的超平面,让人们可以在那个维度上见到一个鱼缸从生到死的所有四维表达,并且都可以真实可触摸!

如果用照片墙、旅游到不同状态的族群、地理位置呢?

这种形式的四维空间表达,我认为是存在的,多多照照片、旅游,历史的沧桑总会让人行万里路,读万卷书

从高维空间看世界

如果理解了高维空间和超平面,你就会理解到站在更高维度的人的与众不同 😃

最近更新

  1. docker php8.1+nginx base 镜像 dockerfile 配置

    2024-04-09 11:32:01       94 阅读
  2. Could not load dynamic library ‘cudart64_100.dll‘

    2024-04-09 11:32:01       101 阅读
  3. 在Django里面运行非项目文件

    2024-04-09 11:32:01       82 阅读
  4. Python语言-面向对象

    2024-04-09 11:32:01       91 阅读

热门阅读

  1. 网路维护基础知识

    2024-04-09 11:32:01       39 阅读
  2. k8s搭建容器云平台

    2024-04-09 11:32:01       33 阅读
  3. k8s知识

    k8s知识

    2024-04-09 11:32:01      30 阅读
  4. mysql中的视图

    2024-04-09 11:32:01       32 阅读
  5. intellij idea的快速配置详细使用

    2024-04-09 11:32:01       31 阅读
  6. 前端项目体积优化策略

    2024-04-09 11:32:01       30 阅读