机器学习 数据样本不平衡时处理方法(Resampling strategies for imbalanced datasets) 这一篇介绍一下关于样本不平衡的处理的方式,主要介绍两种采样方式,分别是上采样和下采样。这里主要介绍最简单的上采样和下采样,更多的内容见文章中的链接。 06月28日1 阅读全文
机器学习 分类问题–Logistic Regression方法介绍 这一篇文章主要介绍分类问题的解决。主要介绍逻辑回归,从逻辑回归讲到他的损失函数的定义的来源,也就是Cross Entropy的来源。 04月30日评论 阅读全文
机器学习 交叉检验(Cross Validation)简介 这一篇简单介绍一下交叉检验的技术,以及给出一个交叉检验的实例。交叉检验可以进行模型的选择,查看模型是否存在过拟合或是欠拟合的状态。 04月17日评论 阅读全文