齐凡又喝下一口贤者饮料,给自己充能。
对图像的数字化处理,首先自然就是将彩色图转化为灰度图。简单来说,就是将一张彩色照片弄成黑白的。
之后那黑白图像上的一个个像素点的灰度值,便是计算机看到的东西。
齐凡忽的想起李月。她可真白!
贤者状态下的齐凡是很纯洁的,比4个9的黄金还要纯。他想起李月完全是因为好奇该如何用数字形容她的白。
灰度值的范围是0~255。0代表纯黑,255代表纯白。
李月该有多白。150?200?还是250?
齐凡觉得一定是250。她白得就跟250一样。
人类通过一个个像素点的灰度值就能识别出物体,其实计算机也是这么干的。
这其实是很浅显易懂的道理。只要这個世界上没有修仙和魔法,那做同一件事情多半就是用同一种方法,只不过是过程有些不同罢了。
就如,人类对着一副图像看一样就什么都明白了,人类自己甚至都感受不到这个过程。
你看到图像上有一只猫,你不会下意识去思考“我为什么会认为它就是一只猫”。也就是说,人类根本不明白自己识别的过程。
因而在于如何教计算机识别图像的问题上,人类绞尽脑汁,这类问题就是机器学习诞生的初衷。
齐凡通过阅读许阳他们的代码,知道他们并未采用简单的线性回归来处理数字识别。他想想也是,毕竟线性这东西就如一个直男,脑子永远就是一根筋的,只能走直线,走不了曲线,自然也就处理不了复杂些的问题。
比如:异或问题。这是一个最典型的非线性问题。
所谓异或,就是:同为0,异为1。两个数字1异或之后结果是0。
用白话来解释线性和异或的话,线性可以看成是按套路办事,非线性则可看成不按套路出牌。异或就是不按套路出牌的一种典型情况。
如果计算模型是线性的,那无论如何它也无法处理非线性的问题。哪怕是把现有CPU的运算能力翻一万倍,那也是无济于事的。
这就好比一个男人还没结婚的时候,他的钱都是他的。结婚之后,计算机按往常理解,就是把夫妻双方的钱加起来除以2。
不加干预的话,计算机是无法自己开窍其实不是除以2,而是很可能向某一方汇聚,最后男方那边剩余是0。
同时,图像还涉及到清晰度和对比度的问题。
因而,齐凡被图像的“池化”“锐化”等概念虐了一通后,总算将它们掌握了。
最后就到了最关键的一步--图像最真实的特征。
图像的特征自然是来自于像素点。可其实不仅仅体现在像素点的灰度值上,还体现在像素点的排列上。
如果直接将像素点的坐标和值作为输入参数,那就会带来一个问题。
假如一个一模一样的数字“1”,出现在一张纸的不同位置。这对以上方法来说,就是不同的输入参数,因为其坐标位置变化了。可按实际情况,这个数字并没有任何改变,只是位置发生了变化而已。
位置的变化不应该带来输入参数的变化,因为人类识别数字也并不需要参数数字整体的位置。
齐凡带着疑问在书上找到了答案--变化特征。
通过提取相邻像素点灰度值的变化作为特征,这样就能摒弃数字坐标位置不同而引入的干扰。
这就是方向梯度直方图(HistogramofOrientedGradient)的核心概念。
【计算机经验 10。】
到此为此,图像特征提取部分已被齐凡搞定。
剩下的,就是找寻许阳他们所用的模型到底是哪里出了问题,以至于会出现40%多识别错误率。
-----------------
心情愉悦的齐凡,收起东西从图书馆回到宿舍。
齐凡一进宿舍,王哲就火急火燎地开口,“怎么发你微信过了半天才回,今天微积分课吴院长点名,你又不是在。他现在每回都会特意关注你,你要是再不去,他可真就要发飙了。”
齐凡最近的行为在同学们看来简直就是作死,连最近看不惯他的贾震都开始对他同情了。
“齐凡,十年寒窗不容易,你这么个作法,早晚要被开除学籍的。何必呢。”只要不挑战贾震的学霸权威,他也不是什么十足的坏人。
“多谢你们关心。可我早就和你们说过了呀。是因为王教授叫我去帮忙。”
从对面两人的神情来看,显然不信。齐凡也只有无奈。
“算了,等后天吧。后天的微积分课正好有些内容我还需要巩固下,到时你们看,吴院长会不会管我。”齐凡自信王教授肯定已经都打好招呼了。