算法应用中的细节问题(2)

Posted by 高庆东 on June 6, 2018
  • 决策树的本质是每分一步就减小熵值,最终使熵值降到最低
  • svm如果线性不可分也不加核函数则可以加松弛变量 J=1/2W^2+C
  • PCA的本质是使所有样本投影的方向使方差最大(拉格朗日)
判断聚类效果:轮廓系数

轮廓系数

ai为样本i与类内其他样本的距离 bi为样本i与类间其他样本的距离

  • 谱为方阵的特征值

验证算法是否收敛

算法收敛:错误样例数存在一个上线(模型的输出是错误的,而错误个数存在上线)

NOVIKOFF定理

以感知机算法为例

novikoff定理