机器学习概览

人工智能与机器学习的关系图

Alt text

什么是机器学习

Alt text

机器学习的分类

  • 监督学习
    : 给机器的训练数据拥有“标记”或者“答案”

  • 非监督学习
    : 给机器的训练数据没有任何“标记”或者“答案”

  • 半监督学习
    : 一部分数据有“标记”或者“答案”,另一部分数据没有。更常见:各种原因产生的标记缺失

  • 增强学习
    : 根据周围环境的情况,采取行动,根据采取行动的结果,学习行动方式。
    Alt text

机器学习的其他分类

在线学习和批量学习(离线学习)

批量学习 Batch Learning

Alt text

  • 优点 :简单
  • 问题 :如何适应环境
  • 解决方案:定时批量学习
  • 缺点:每次批量学习,运算量巨大,在某些环境变化非常快的情况下甚至不可能
    在线学习 Online Learning
    Alt text
  • 优点:及时反映新环境变化
  • 问题:新数据带来不好的变化
  • 解决方案:需要加强对数据的监控
  • 其他:也适用于数据量巨大,完全无法批量学习的环境

    参数学习与非参数学习
    • 参数学习 Parametric Learning
      : 一旦学到了参数,就不再需要原有的数据集

    • 非参数学习 Nonparametric Learning
      : 不对模型进行过多的假设
      : 注意:无参数学习不代表没有参数!
      ###如何选择机器学习算法?
      ####奥卡姆的剃刀

  • 简单就是最好的
  • 到底在机器学习领域,什么叫“简单”?
    ####没有免费的午餐定理
  • 可以严格地数学推导出:任意两个算法,他们的期望性能是相同的!
  • 具体到某个特定问题,有些算法可能更好
  • 但没有一种算法,绝对比另一种算法好
-------------End Of This ArticleThank You For Reading-------------