西瓜书瞎写
根据一些样例,来训练我们的模型。如果预测的是离散值,例如“好瓜” “坏瓜”,这种学习任务我们称为“分类”(classification);如果预测的是连续值,例如西瓜的成熟度0.95、0.37,这类任务称为“回归”(regression)。
泛化能力(generalization):学得的模型适用于新样本的能力。
西瓜书第五页:空间规模的大小为什么是\(4*4*4+1=65\)?
1.先整体考虑,色泽有4个属性(\(*\)+浅白+青绿+乌黑),同理根蒂和敲声也有4个(\(*\)在书中表示通配符,比如色泽=\(*\) 表示色泽可以取值任何颜色而不影响最终结果“好瓜”)。
因此3个属性有四个属性值可以任意选择,\(4*4*4=64\),此外,考虑极端情况,如果“好瓜”这个概念本身不成立,世界上没有“好瓜这种东西”,也就是说瓜都不存在了,
(色泽=\(\emptyset\))\(\wedge\)(根蒂=\(\emptyset\))\(\wedge\)(敲声=\(\emptyset\)),那么这也算一种情况。也许你又有新的疑问,能不能其中一个或两个属性为空值呢?这是瓜,实实在在的瓜,你能想象一个瓜有敲声,而没有色泽和根蒂的情况吗?最后64+1=65。
2.分开考虑,这里不使用通配符\(*\)。有3个属性,每个属性有3个值。
如果一个属性就能判定结果是否“好瓜”,则3个属性中选一个,属性值有3种,即\(C_3^1*3 = 9\)。
同理,两个属性,\(C_3^2*3*3 = 27\)。三个属性,\(C_3^3*3*3*3 = 27\)。此时27+27+9=63.还有两种情况,一种是无论属性的属性值取什么,都是好瓜,这对应于上个方法的各个属性取通配符,另外一种是空集。63+2=65.
西瓜书\({P_8}\)~\({P_{\rm{9}}}\)页
学习动力:2020年11月11日晚上因宿舍灭蚊而不得不和室友去教学楼学习。