全球软件开发大师课:基于SciKit的机器学习视频教程
体系课

全球软件开发大师课:基于SciKit的机器学习视频教程

  • 机器学习

使用各种机器学习技术 探索数据集 执行各种分类算法任务 使用回归算法、聚类算法和超参数等

¥99
本课程包括
  • 7小时11分钟的视频随时观看
  • 可在APP随时观看
  • 结业证书
课程合作品牌
机械工业出版社
你将收获
  • 使用各种机器学习技术 探索数据集 执行各种分类算法任务 使用回归算法、聚类算法和超参数等

数千家企业正在使用三节课企业版学习

无限制学习2000+门课程,200+精选学习专题

免费申请体验>
课程介绍

通过scikit-learn中包含的大量示例代码来学习现代机器学习中的主要概念和技术。

通过课程中的Jupyter Notebook的代码,很好地介绍和概述了scikit-learn库中的API。

适合人群
  • 计算机相关专业学生
  • 对使用Python和scikit-learn库来编写机器学习程序很感兴趣的程序员和统计学家
讲师介绍
Python社区中工作已有20年从事数据科学和机器学习相关领域的工作
擅长领域:
  • 机器学习
戴维·梅尔茨(David Mertz)最初是通过人文学科教授的方式来编写程序的,后来他是一名高级软件开发人员,现在经营着自己的开发公司Gnosis Software(“我们知道!”)。lBM developerWorks,英特尔开发人员网络,0'ReillyONLamp和其他出版物的常规专栏和文章。
传播工业技术、工匠技能和工业文化,助力我国自主创新能力提升
擅长领域:
  • 智能制造
  • 企业创新与商业模式
  • 数字化思维与认知
  • 数字化领导力
机工社先后获评“全国优秀出版社”“全国百佳出版单位”“中国500最具价值品牌”“世界媒体500强”“国家文化出口重点企业”“中国版权最具影响力企业”“中国图书海外馆藏影响力出版100强”和“教育部教材出版基地”。机工旗下出版物曾获得全国科学大会奖、国家图书奖、中国出版政府奖、全国优秀科技图书奖、中国好书、全国教材建设奖等众多国家奖项。机工社新世纪的快速发展,在业界引起广泛关注,2014年其改革发展实例被收录进哈佛大学案例库应用于教学实践,并通过哈佛大学的出版网络向全球发行,成为中国文化产业战略管理“走出去”第一家。 传播工业技术、工匠技能和工业文化,助力我国自主创新能力提升,是机工社的使命与追求。愿与各界机构、各界人士携手同行,集知播识,再铸辉煌。
课程大纲
共0节 时长0分钟 全部收起
课程简介
6分钟
第1课:什么是机器学习
共11节 | 1小时20分钟
  • 1.0 学习目标
    1分钟
  • 1.1 安装
    9分钟
  • 1.2 了解ML库
    8分钟
  • 1.3 介绍机器学习中的各种技术
    6分钟
  • 1.4 了解“深度学习”与其他机器学习技术之间的区别
    9分钟
  • 1.5 了解分类算法,回归算法,聚类算法,以及过拟合次/欠拟合
    14分钟
  • 1.6 了解降维,特征工程,特征选择
    6分钟
  • 1.7 区分类别变量,序数变量和连续变量
    5分钟
  • 1.8 执行独热编码
    5分钟
  • 1.9 使用超参数和网格搜索
    4分钟
  • 1.10 了解选择和指标
    12分钟
第2课:搜索数据集
共5节 | 30分钟
  • 2.0 学习目标
  • 2.1 发现数据中的异常和数据完整性问题
    12分钟
  • 2.2 清理和调整你的数据
    5分钟
  • 2.3 选择特征和目标
    6分钟
  • 2.4 实现训练集/测试集划分并且选择模型
    6分钟
第3课:分类
共9节 | 53分钟
  • 3.0 学习目标
    1分钟
  • 3.1 了解特征重要性
    5分钟
  • 3.2 在决策树中建立切点
    7分钟
  • 3.3 使用通用API
    5分钟
  • 3.4 使用更加优质的数据集
    4分钟
  • 3.5 多个分类器之间的比较
    9分钟
  • 3.6 了解有关特征重要性的更多信息
    6分钟
  • 3.7 使用多类别分类
    10分钟
  • 3.8 了解预测概率和决策边界
    7分钟
第4课:回归
共6节 | 42分钟
  • 4.0 学习目标
    1分钟
  • 4.1 scikit-learn中的样本数据集
    11分钟
  • 4.2 不同回归器之间的比较
    9分钟
  • 4.3 使用线性模型
    6分钟
  • 4.4 了解线性模型的缺陷
    8分钟
  • 4.5 使用非线性回归器
    7分钟
第5课:聚类
共7节 | 53分钟
  • 5.0 学习目标
    1分钟
  • 5.1 聚类算法之间的比较
    6分钟
  • 5.2 聚类检验假设
    5分钟
  • 5.3 聚类为N类
    14分钟
  • 5.4 聚类为未知数量的类别
    13分钟
  • 5.5 使用基于密度的聚类算法:DBScan和HDBS
    8分钟
  • 5.6 评估聚类算法
    6分钟
第6课:超参数
共4节 | 22分钟
  • 6.0 学习目标
    2分钟
  • 6.1 探索一个超参数
    8分钟
  • 6.2 搜索多个超参数
    6分钟
  • 6.3 使用Gridsearch CV
    6分钟
第7课:特征工程和特征选择
共11节 | 1小时30分钟
  • 7.0 学习目标
    1分钟
  • 7.1 理解一个合成的例子
    10分钟
  • 7.2 了解降维
    2分钟
  • 7.3 使用主成分分析(PCA)
    10分钟
  • 7.4 使用其他分解算法:NMF,LDA,ICA,t-dist
    12分钟
  • 7.5 实现特征选择:单变量
    8分钟
  • 7.6 实现特征选择:基于模型的特征选择
    10分钟
  • 7.7 了解维数扩展(多项式特征)
    10分钟
  • 7.8 使用独热编码
    6分钟
  • 7.9 使用StandardScaler,RobustScaler,MinMaxScaler,Normalizer等进行缩放
    15分钟
  • 7.10 四分位数化和二值化
    5分钟
第8课:管道
共4节 | 28分钟
  • 8.0 学习目标
    1分钟
  • 8.1 了解命令式顺序处理
    11分钟
  • 8.2 使用管道
    9分钟
  • 8.3 对管道进行网格搜索
    7分钟
第9课:稳健的训练集/测试集划分
共4节 | 26分钟
  • 9.0 学习目标
    1分钟
  • 9.1 了解训练集/测试集划分
    6分钟
  • 9.2 了解多种划分手段
    12分钟
  • 9.3 使用交叉验证
    7分钟
总结
3分钟
购课须知

课程有效期:

自购买课程之日起 365 天,部分参与营销活动产品以活动规则为准,请同学在有效期内学习、观看课程。

上课模式:

课程采取录播模式,请注意自学课无班级微信群、班主任带班及助教批改服务。

注:自学课不支持退款,确保你是真的需要再进行报名,报完名之后还请认真学习。