Python3  机器学习 简明教程.png

1 机器学习介绍

    1.1 什么是机器学习

    1.2 机器学习的应用

    1.3 机器学习基本流程与工作环节

        1.3.1 数据采集与标记

        1.3.2 数据清洗

        1.3.3 特征选择

        1.3.4 模型选择

        1.3.5 训练和测试

        1.3.6 模型使用

    1.4 机器学习算法一览

2 Python 3 机器学习软件包

    2.1 多种机器学习编程语言比较

    2.2 开发环境 Anaconda 搭建

        2.2.1 Windows

        2.2.2 macOS

        2.2.3 Linux

    2.3 Jupyter Notebook 介绍

    2.4 Spyder 介绍

    2.5 Numpy 介绍

        2.5.1 Numpy 数组

        2.5.2 Numpy 运算

        2.5.3 Numpy Cheat Sheet

    2.6 Pandas 介绍

        2.6.1 十分钟入门 pandas

        2.6.2 Pandas Cheat Sheet

    2.7 Matplotilb 介绍

        2.7.1 Pyplot 教程

        2.7.2 plots 示例

        2.7.3 Matplotilb Cheat Sheet

    2.8 scikit-learn 介绍

        2.8.1 scikit-learn 教程

        2.8.2 scikit-learn 接口

        2.8.3 scikit-learn Cheat Sheet

    2.9 数据预处理

        2.9.1 导入数据集

        2.9.2 缺失数据

        2.9.3 分类数据

        2.9.4 数据划分

        2.9.5 特征缩放

        2.9.6 数据预处理模板

3 回归

    3.1 简单线性回归

        3.1.1 算法原理

        3.1.2 预测函数

        3.1.3 成本函数

        3.1.4 回归模板

    3.2 多元线性回归

    3.3 多项式回归

        3.3.1 案例:预测员工薪水

    3.4 正则化

        3.4.1 岭回归

        3.4.2 Lasso 回归

    3.5 评估回归模型的表现

        3.5.1 R平方

        3.5.2 广义R平方

        3.5.3 回归模型性能评价及选择

        3.5.4 回归模型系数的含义

4 分类

    4.1 逻辑回归

        4.1.1 算法原理

        4.1.2 多元分类

        4.1.3 分类代码模板

        4.1.4 分类模板

    4.2 k-近邻

        4.2.1 算法原理

        4.2.2 变种

    4.3 支持向量机

        4.3.1 算法原理

        4.3.2 二分类线性可分

        4.3.3 二分类线性不可分支持

        4.3.4 多分类支持向量机

        4.3.5 Kernel SVM - 原理

        4.3.6 高维投射

        4.3.7 核技巧

        4.3.8 核函数的类型

    4.4 决策树

        4.4.1 算法原理

        4.4.2 剪枝与控制过拟合

        4.4.3 信息增益

        4.4.4 最大熵与EM算法

5 聚类

    5.1 扁平聚类

        5.1.1 k 均值

        5.1.2 k-medoids

    5.2 层次聚类

        5.2.1 Single-Linkage

        5.2.2 Complete-Linkage

6 关联规则

    6.1 关联规则学习

    6.2 先验算法Apriori

    6.3 FP Growth

7 降维

    7.1 PCA(主成分分析)

    7.2 核 PCA

    7.3 等距特征映射IsoMap

8 强化学习

    8.1 置信区间上界算法

        8.1.1 多臂老虎机问题

        8.1.2 置信区间上界算法原理

    8.2 Thompson 抽样算法

        8.2.1 抽样算法 - 原理

        8.2.2 抽样算法 vs. 置信区间上界算法

9 集成学习

    9.1 Stacking

    9.2 Bagging

        9.2.1 随机森林

    9.3 Boosting

        9.3.1 XBoost

        9.3.2 LightGBM

        9.3.3 CatBoost

        9.3.4 AdaBoost

10 深度学习

    10.1 什么是深度学习?

    10.2 人工神经网络ANN

        10.2.1 神经元

        10.2.2 激活函数

        10.2.3 神经网络如何运作?

        10.2.4 神经网络如何训练?

        10.2.5 梯度下降

        10.2.6 随机梯度下降

        10.2.7 反向传播

        10.2.8 商业案例介绍

    10.3 卷积神经网络CNN

        10.3.1 卷积神经网络是什么?

        10.3.2 卷积

        10.3.3 线性整流层 ReLU Layer

        10.3.4 最大池化

        10.3.5 扁平化

        10.3.6 全连接

        10.3.7 商业案例介绍

11 概率模型

    11.1 贝叶斯网络

        11.1.1 朴素贝叶斯

        11.1.2 贝叶斯网络与有向分离

        11.1.3 马尔科夫模型

        11.1.4 实战案例

    11.2 隐马科夫链模型HMM

        11.2.1 隐马科夫链

        11.2.2 隐马科夫链解法

        11.2.3 隐马科夫链应用

    11.3 主题模型

        11.3.1 主题模型理论

        11.3.2 主题模型算法

        11.3.3 实战案例

12 模型选择和提升

    12.1 交叉验证

    12.2 网格搜索

13 项目实战

    13.1 自然语言处理

        13.1.1 自然语言处理简介

        13.1.2 NLTK

        13.1.3 正则表达式

        13.1.4 文本清理

        13.1.5 标识化处理

        13.1.6 词干提取

        13.1.7 文本分类

        13.1.8 取样操作

        13.1.9 词袋

        13.1.10 实战案例:饭店评论

    13.2 移动 App

        13.2.1 Tensorflow Lite

        13.2.2 Core ML

        13.2.3 图片风格迁移

        13.2.4 手写数字识别

    13.3 Kaggle项目

        13.3.1 波士顿房价

        13.3.2 泰坦尼克

        13.3.3 车价预测

        13.3.4 Facebook招聘

2019-01-07