这一篇文章以Kaggle House Price作为例子, 完整的说明一下从数据预处理, 模型构建, 到最后模型选择的一个过程.
機器學習基石上 (Machine Learning Foundations)—Mathematical Foundations
这一篇文章是林轩田老师的机器学习基石上的笔记, 概括了每一周的内容.
Jupyter Notebook操作指南
这一篇介绍Jupyter Notebook的相关的操作. 包括一些常用的快捷键等, 记录在这里方便之后查询.
矩阵运算与优化算法例题
这一篇文章主要介绍在机器学习中的一些基础的数学知识, 包括最优化问题的求解, 矩阵的运算等, 例如矩阵的求导, 矩阵的SVD分解, 拉格朗日乘子法, 高斯分布的均值方差求解等问题.
基于矩阵分解的协同过滤
这一篇文章主要介绍基于矩阵分解的协同过滤算法, 会介绍常用的算法, 例如FunkSVD, 加入正则化, 加入偏置(BiasSVD). 同时会给出相关的代码实现.
决策树案例(Decision Tree)与决策树的可视化
这一篇简单介绍一下使用决策树来进行分类任务, 同时我们会对决策树的结果进行可视化的显示. 这里会使用iris的例子进行分析.
熵, 交叉熵, 和KL散度
在机器学习中, 我们经常会遇到熵, 交叉熵还有KL-散度的概念, 这一篇就主要介绍一下这三者的关系.
主成分分析(Principal component analysis, PCA)例子–Python
这一篇是关于PCA的实战, 我们会举一个例子, 看一下PCA具体在实战中是如何来进行的. 同时我们会比较同一个数据下, 使用PCA(主成分分析)和FA(因子分析)得到结果的不同.
因子分析(factor analysis)例子–Python
这里举一个因子分析的具体的例子, 看一下因子分析是如何进行的, 以及最后的效果.
常用的工具函数整理
这里就是一些常用的工具函数, 可以在需要的时候快速的进行使用.