机器学习(从例子中学习)

  • 监督学习(有标注)
    • 逻辑回归
    • 决策树
  • 无监督学习(无标注)
    • K-means聚类算法
  • 增强学习(半监督学习)
    • 不是分类问题,也不是聚类的问题
    • 研究的是决策问题(下棋、机器人寻路)
    • 非完备信息
    • 无训练样本

机器学习常见算法一览

机器学习常见算法
机器学习常见算法
  • 人脸识别大多都采用AdaBoost算法,本质上是决策树
  • 垃圾邮件识别采用朴素贝叶斯算法
  • FP-Growth算法已经取代了Apriori算法
  • 百度搜索结果的排序使用的是逻辑回归算法

增强学习(Reinforcement Learning),也称为强化学习

增强学习基本流程
增强学习基本流程
  • 由动物学习、参数扰动自适应控制等理论发展而来
  • 算法分类
    • 时序差分算法
    • Q学习
  • 基本流程
    • Agent产生一个动作
    • 环境接受该动作后状态改变
    • 同时产生会报反馈给Agent

马尔可夫决策过程 –Markov Decision Processes,MDP增强学习的理论基础)

  • 马尔科夫链(Markov Chain),也称为马氏链
  • 状态转移图就是一个简单的马尔科夫链
  • 数学定义:
    马尔科夫链数学定义
    马尔科夫链数学定义
  • 状态转移的概率只依赖前一个状态
  • MDP模型
    MDP模型
    MDP模型

Q学习算法

  • Q学习算法是一种用来解决马尔可夫决策过程中最优化问题的方法,通过这种算法来更新Q矩阵(决策矩阵)
  • Q函数:
    Q函数
    Q函数
  • 模拟退火(马尔科夫蒙特卡罗(MCMC)思想)
    • 以一定的概率接收目标函数值的下降
    • 缓解了爬山算法容易陷入局部最优的缺陷
  • Q学习算法描述(训练)
    Q学习算法描述(训练)
    Q学习算法描述(训练)
  • Q学习算法描述(使用)
    Q学习算法描述(使用)
    Q学习算法描述(使用)

数据分析和机器学习的区别

  • 数据特点
    • 交易数据vs行为数据
    • 少量数据vs海量数据
    • 采样分析vs全量分析
  • 交易数据的一致性要求远远超过行为数据,典型的交易数据如银行转账,所以处理交易数据不能用NOSQL(NotOnlySQL)数据库
  • 解决的业务问题不同,数据分析用来报告过去的事情,机器学习用来预测未来的事情
  • 数据分析的目标用户是公司高层的决策者,机器学习的目标用户是个体

深度学习

  • 是基于机器学习延伸出来的一个新的领域,由以人大脑结构为启发的神经网络算法为起源加之模型结构深度的增加发展,并伴随大数据和计算能力的提高而产生的一系列新的算法