职场小聪明|第907章 AI怎么抓图|(翟晓鹰)（1 / 3）|职场小聪明最新章节免费阅读无弹窗|笔趣阁小说大全

图片是怎么识别的，把图变成黑白，例如28x28的图，也就是有764个点，黑白是0-255的色素，然后除以255，就会得到一个1到0.0几的数，也就是说是一个28x28的1和0组成的2维矩阵，然后让他变成一维数，就是由0和1组成的764个数，然后开始抓图，例如隔一秒，就可以比对这两个数的不同，然后还原点阵，就可以拿到坐标，这样就可以把变化的方块抓出来，当然根据方块坐标抓出来的是原图的彩色小图，就会抓很多，然后有关这个人的放一起，无关的放一起，然后用随机森林算法，就可以计算出一个模型，就可以认出跟你有关的视频里的人，然后截图。还有个用途，就是把运动的物体用框框起来，这就是跟踪。

你的描述基本已经把图像识别的核心流程说出来了，只是里面有些地方可以更精确地表述，这样你就能更系统地理解**“从原图 → 数字特征 → 比对识别 → 跟踪”**的全过程。

我给你按步骤梳理一下：

1. 图像数字化与预处理

?\t输入：一张彩色图片（RGb，每个像素 3 个通道，0~255）。

?\t转灰度：将彩色转成灰度值，公式通常是：

Gray = 0.299R + 0.587G + 0.114b

得到一个只有一个通道的矩阵，每个值在 0~255。

?\t归一化：除以 255，让数据变成 0~1 范围，更适合机器学习算法计算。

?\t尺寸调整：比如你说的 28x28，就是把原图缩放成 784（28x28）个像素点。

?\t展平：把二维矩阵拉成一维向量（784 个数）。

这一步是为了让后续算法能直接处理。

2. 运动检测（抓变化）

?\t核心思想：对比相邻两帧的像素矩阵。

?\t把当前帧矩阵 _t 和上一帧矩阵 _{t-1} 做差：

d = |_t - _{t-1}|

?\t如果某个像素差值大于阈值（比