用“小说阁”微信小程序追更新速度快!
永久免费无需下载,还能切换源站追更
进入微信小程序
第12章 副作用

公共机房内。

齐凡一边翻着书,一边调试着代码。

波士顿房价预测线性回归。

其实就是以线性回归的方式,根据一份波士顿地区的历史房价数据,预测未来的房价走势。

齐凡腹诽,不愧是资本主义国家,即便是举个例子,都是充满了金钱的味道。

其实这所谓的预测房价就是个扯淡,所谓的波士顿房价预测也没有任何意义,不过就是拿这一份数据集来演示线性回归而已。

至于线性回归,齐凡已经了解的差不多了。

它的公式巨简单。

【y=wx b】

不过,y、w、x、b都是向量,并非是初高中数学多元一次方程中的未知数。

普通的“x”是这样的:x=1。

向量的“x”是这样的:x=[0,1,2,3,4,5,6,7,8,9]。

但向量运算除了有其自身一套规则之外,其实和非向量运算也差不多。

向量本质上不过是将数据升维而已,也可以理解成是数据属性的扩充。

就拿波士顿房价数据集来说。

“x”代表了各项评估指标。

[‘CRIM‘,‘ZN‘,‘INDUS‘,‘CHAS‘,‘NOX‘,‘RM‘,‘AGE‘,‘DIS‘,‘RAD‘,‘TAX‘,‘PTRATIO‘,‘B‘,‘LSTAT‘]

CRIM:城镇人均犯罪率。

ZN:住宅用地超过25000平方英尺的比例。

INDUS:城镇非零售商用土地的比例。

CHAS:查理斯河空变量(如果边界是河流,则为1;否则为0)。

NOX:一氧化氮浓度。

RM:住宅平均房间数。

AGE:1940年之前建成的自用房屋比例。

DIS:到波士顿五个中心区域的加权距离。

RAD:辐射性公路的接近指数。

TAX:每10000美元的全值财产税率。

PTRATIO:城镇学生数:教师数的比例。

B:1000(Bk-0.63)^2,其中Bk指代城镇中黑人的比例。

LSTAT:人口中地位低下者的比例。

-----------------

“y”代表了最终的输出结果。

由于房价预测只有一个输出结果,也就是房价。所以y这个向量只有一维,而一维的向量其实就是個普通变量。

整个计算过程,就是要根据数据集给定的x和y的值,来预测出一对最精确的w和b的值。

齐凡脑海中出现了一张二维坐标系。

那几百个房价数据样本,就是坐标系中不同的点。而所谓的线性预测,其实就是找到一条直线,能最大程度将这些样品上的点串起来。

至于为什么是一条直线,而不是曲线,因为它是线性的。 本章未完,请点击下一页继续阅读! 第1页/共2页

→如无内容,点击此处重加载内容←
多次加载无内容,请点页面中间弹出菜单换源阅读!



换源
目录
设置
夜间
日间
报错
章节目录
换源阅读
章节报错

点击弹出菜单

提示
微信小程序“小说阁”可换源免费阅读,点击跳转微信小程序阅读~