统计基础知识课件(学它!李航《统计学习方法》课件,清华大学深圳研究院教授制作)

机器心脏修整

参与:张倩、丽慧

李航教师的《统计学习方法》是的,我明白机器学习最好的教材之一。这本书于2005年开始写作,并于2012年完成。第二版于今年5月推出。最新版本包含许多主要的有监督和无监督学习算法和模型,可以说是机器学习的入门。互联网企业的许多机器学习培训课程、面试和笔试问题都参考了本书。为了让大家更系统、更高效地学习本书,作者李航博士推荐了清华大学深圳研究院袁春教授制作的相关课件,可以免费下载。


李航是日本东京大学的计算机科学博士。曾任微软亚洲研究院高级研究员、首席研究员、华为诺亚方舟实验室首席科学家。现在他是人工智能实验室的主任。他的研究兴趣包括信息检索、自然语言处理、统计机器学习和数据挖掘。

《统计学习方法》(第二版)全面系统地介绍了统计学习的主要方法,分为监督学习和非监督学习。第一章介绍了感知器,朴素贝叶斯方法决策树支持向量机、提升法隐马尔可夫模型条件随机场是非常经典的监督学习方法。第二部分主要论述群集方法奇异值分解主成分分析、潜在语义分析、马尔可夫链蒙特卡罗方法和潜在AndyLau分配都是经典的无监督学习方法。

除了介绍和总结统计学习、监督学习和非监督学习的四章之外,每个章介绍都有一种方法。本文试图从具体问题或实例入手,由浅入深地阐明观点,并给出必要的数学推导,使读者能够掌握统计学习方法的本质并学会使用。为了满足读者进一步学习的需要,本书还介绍了一些相关研究,并给出了少量练习。

作为最好的机器学习材料之一,《统计学习方法》清华大学是国内许多大学机器学习相关专业的理想教材之一。袁春教授主要在清华大学教授“计算机视觉”、“大数据机器学习”等课程,《统计学习方法》它被选为“大数据机器学习”课程的主要教材,并围绕这本书推出了课件。

课件内容概述

统计基础知识

课件下载链接:https://pan.baidu.com/s/1HUw0MeBD-1LP-r441oykhw

课件共22章,分别对应图书目录。《章为》前12期的监督学习部分对监督学习方法进行了一些修改,但与第一版相比差异不大。第13-22章章为新的无监督学习部分将在这里详细介绍。

第一章的课件主要总结了机器学习的基本知识,如概念、学术资源、发展过程、期刊会议等,指出了机器学习与统计学习的关系和区别,介绍了统计学习道路上的一些基本知识,包括方法分类、模型、策略、算法等。

此外,第2章至第13章的内容与上一版基本相同。这里只是课件的标题,内容细节可以通过链接下载和查看。

从第13章开始《统计学习方法》第二版中新的无监督学习部分对那些读过它的人来说是很好的。

第13章是无监督学习的介绍,介绍了无监督学习的基本原理和基本问题,以及无监督学习的三个要素和学习方法。它起着提纲的作用。一些关键内容将在稍后的单独课件中描述。

第14章是聚类方法,讨论了“什么是聚类”、“相似性或距离”、“类或簇”、“类间距离”、“层次聚类”以及其他与“类”相关的知识。

第15章是关于奇异值分解。从定义开始,花了大约20页来解释奇异值分解的基本定理,然后是奇异值分解的计算矩阵矩阵的最佳逼近,矩阵的外积展开,等等。

第16章是主成分分析,这是一种常见的无监督学习方法,也是数学降维的常用方法。它主要用于发现数据中的基本结构,即数据中变量之间的关系。

第17章是潜在语义分析,主要通过矩阵分解发现文本和单词之间基于主题的语义关系。这种方法通常用于文本分析。本章详细介绍了词向量空间、主题向量空间的概念和方法,以及基于主题的文本与词之间语义关系的发现。

第18章NicholasTse介绍了概率潜在语义分析,这是一种使用概率生成模型分析文本收集主题的无监督学习方法。该课件重点介绍了生成模型、共现模型、模型参数、模型的几何解释,以及概率潜在语义分析和潜在语义分析之间的关系。

第19章是马尔可夫链蒙特卡罗方法。按照蒙特卡罗方法的顺序,一步一步地解释了马尔可夫链蒙特卡罗方法→马尔可夫链→马尔可夫链蒙特卡罗方法。此外,它还包括大都会黑斯廷斯算法(最基本的马尔可夫链蒙特卡罗方法)和吉布斯的抽样(更简单和更广泛使用的马尔可夫链蒙特卡罗方法)等细节。

在第20页,章介绍介绍了潜在的狄利克雷分布(LDA),包括狄利克雷分布、潜在的狄利克雷分布模型、LDA的变分EM算法等。内容非常详细,PPT超过100页。

21日,章介绍介绍了PageRank算法,包括其基本定义、一般定义、计算方法(迭代算法、幂法、代数算法)等。

课件的最后一章总结了常见的无监督学习方法以及各种方法之间的关系。

除了这个课件,《机器的心脏》之前还报道了这本书的第一版

代码实现项目

。项目作者github该网站收集了一些用于排序的代码,并进行了一些修改,使用Python36实现了第1-13章的课程代码。目前,该项目GitHub上star的数量已超过7800,有兴趣的读者可以参考。

项目地址:https://github.com/fengdu78/lihang-code

您可以还会对下面的文章感兴趣

最新评论

  1. 春梦太浓郁
    春梦太浓郁
    发布于:2022-04-27 19:39:58 回复TA
    机器心脏修整参与:张倩、丽慧李航教师的《统计学习方法》是的,我明白机器学习最好的教材之一。这本书于2005年开始写作,并于2012年完成。第二版于今年5月推出。最新版本包含许多主要的有监督和无监督学习算法和模型,可以说是机器学习的入门。互联
  1. 杜莺晓清
    杜莺晓清
    发布于:2022-04-27 12:01:19 回复TA
    阳光明媚,温暖如初,你还没来我怎敢老去。

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。

使用微信扫描二维码后

点击右上角发送给好友