你好,我是王天一,我在“机器学习40讲”欢迎你的到来!
在上一季的专栏中,我与你一起走马观花地浏览了学习人工智能所需要的基础数学、当前流行的深度学习、以及其他可能实现智能的技术路径。广义的人工智能概念可以说包罗万象,其中每一个细分的子领域发展到今天都值得大书特书。40篇文章的篇幅绘出的人工智能轮廓就像是一幅低分辨率的全景画,覆盖广度的同时必然难以兼顾深度。
正因如此,新一季的专栏内容将聚焦于人工智能大问题里的一个小目标——机器学习。在新进展层出不穷的今日,机器学习依然占据着人工智能的核心地位,迅猛的发展势头也让现在的机器学习领域充斥着各种听起来狂拽酷炫的新玩意儿。但阳光之下再无新事,再炫目的技术归根结底都是基本模型与方法在具体领域问题上的组合,而理解这些基本模型与方法才是掌握机器学习,也是掌握任何一门学问的要义所在。
既然机器学习领域的文献论著已经汗牛充栋,这个专栏和它们的区别又在哪里呢?在我看来,是融会贯通的系统性。不少关于机器学习的文献虽然深入阐释了不同模型的原理,但对它们之间的关联却缺少清晰的解释,从而使内容的组织流于模型展览,仿佛一串没能串成项链的珍珠宝石。实际上,所有模型就像龙生九子一样,都是从基本模型出发,根据不同改进方法衍生出来。所以,这个专栏最重要的任务就是帮助你把握不同模型之间的内在关联,让你形成观察机器学习的宏观视角,找准进一步理解与创新的方向。
在内容上,“机器学习”分为3个模块。
第一个模块是机器学习概观,介绍机器学习中超脱于具体模型和方法之上的一些共性问题,将从概率的两大派别开始。众所周知,概率在机器学习中扮演着核心角色,而频率学派与贝叶斯学派对概率迥异的认知也将机器学习一分为二,发展出两套完全不同的理论体系。正所谓兼听则明偏听则暗,理解机器学习时应该看到这同一枚硬币的两面,以获得完整的认知。除此之外,本模块还涵盖了计算学习等机器学习的理论问题,以及关于模型和特征的一些实验主题。
第二个模块将讨论频率学派发展出的机器学习理论——统计学习。统计机器学习的核心是数据,它既从数据中来,利用不同的模型去拟合数据背后的规律;也到数据中去,用拟合出的规律去推断和预测未知的结果。统计学习中最基础的模型是线性回归,几乎所有其他模型都是从不同角度对线性回归模型做出的扩展与修正。因此,在这个模块中,我将以线性模型为主线,和你一起浏览它的万千变化,观察从简单线性回归到复杂深度网络的发展历程。
第三个模块将讨论贝叶斯学派发展出的机器学习理论——符号学习,也就是概率图模型。和基于数据的统计学习相比,基于关系的图模型更多地代表了因果推理的发展方向。贝叶斯主义也需要计算待学习对象的概率分布,但它利用的不是海量的具体数据,而是变量之间的相关关系、每个变量的先验分布和大量复杂的积分技巧。在这个模块中,我将围绕概率图模型中的表示、推断、学习三大问题展开介绍,认识贝叶斯面纱下的机器学习。
除了理论之外,在介绍模型时我还会穿插一些基于Python语言的简单实例以加强理解。这些实例会应用诸如Scikit-Learn和PyMC等比较成熟的第三方库,通过调用现成的类来实现不同模型的功能。Python语言的一大优势就是功能丰富又强大的第三方库,将它们束之高阁未免暴殄天物。在快速实现的基础上再进一步深入钻研核心代码,也是比较合理的学习路径。
理解机器学习绝不是简单地了解几个时髦概念,而是要将前沿和基础融会贯通,从中发现贯穿学科发展的脉络。这个专栏不是乾坤大挪移这种水平的内功心法,但如果能打通你修炼机器学习的任督二脉,它的价值就实现了。
我已做好准备,在接下来的三个多月里,和你分享我所理解的机器学习。也请你告诉我,你为什么要学习机器学习?你希望通过这个专栏得到哪些收获呢?
与君共勉!

精选留言
2018-06-06 08:35:57
得体的说法:为了事业与爱情
庸俗的说法:为了屌丝逆袭
2018-06-04 21:04:58
2018-06-04 18:24:57
2018-06-09 18:42:59
2018-06-06 07:13:31
2018-06-07 13:03:00
关注机器学习在磁盘故障预测、性能容量预测方面的应用。想借此机会熟悉相关理论与实践,搭上人工智能的快车。感谢老师的课程,希望有所收获。
2018-11-16 09:23:19
学生目前学习了一些基本的 Python 知识,感觉直接入手机器学习还是有难度的,当然最终目的还是想搞一些机器学习相关的东西。所以想请问老师,在掌握基础的 Python 知识与入门或者进阶的机器学习之间的鸿沟,中间我还需要掌握些什么?有什么可以推荐的学习路线吗??
有些是推荐掌握 Python 知识后,可以从爬虫开始,到数据分析,再到数据挖掘,最后到机器学习,您觉得如何?
2018-12-15 16:20:17
2018-11-13 12:43:23
2018-06-08 17:48:58
大三下学期来了开始自学
看了老师您这门课所涉及的内容的图片
发现自己85%名字都已有所了解
但是问题就是自己总感觉有些模型很像,有些模型有联系,有些思想方法可以推广延伸,(比如从最大熵模型,涉及到熵,想到决策树,本身又是对数模型,想到逻辑回归与CRF,模型的参数估计过程的极大似然估计以及本身的P(Y|X)的形式又让我联想到贝叶斯的概率模型,其对偶求解过程又是SVM推导时候的主要方法)抱歉,这里叙述很乱,从模型分类联系到求解方法,夹杂自己的混乱想法
总得来说,思想缺乏联系,无法在大脑形成网络
看网课,统计学习方法,西瓜书,机器学习实战,自己也调包观察(不过太渣)
每次每个模块感觉自己清楚了,但是完成下一模块后,上次的又有些模糊了,就是理解的不够深入。
每次阅读您的上一门课,总会有所启发,尤其是开篇的那些数学课
希望老师这门课能展现出整体的思想框架,加上实战指导指导对于实际问题如何下手
知识书上可以学到,思想还需老师言传,自己思考
2018-06-06 16:06:57
2020-12-12 17:44:51
非常感谢王老师的课程,您的《人工智能革命》、《裂变》正在学习中,非常庆幸能够遇到您,指引我进入了人工智能的新世界。
2019-01-11 14:23:39
2018-06-05 00:55:01
2018-06-04 23:57:29
2018-06-04 23:51:27
2018-06-04 19:02:50
2021-11-15 15:49:48
2020-12-02 21:54:29
2020-08-10 20:33:50