Pandas数据清洗与建模
体系课

Pandas数据清洗与建模

  • 数据挖掘与分析

Dan教给你清理和处理数据所必需的技术和技巧。

¥59
本课程包括
  • 2小时41分钟的视频随时观看
  • 课程包含 5 道测试题
  • 可在APP随时观看
  • 结业证书
课程合作品牌
机械工业出版社
你将收获
  • 使用Pandas的数据类型
  • 对数据类型进行转换
  • 使用字符串方法和正则表达式
  • 使用Pandas和Python的日期时间方法
  • 学会数据建模

数千家企业正在使用三节课企业版学习

无限制学习2000+门课程,200+精选学习专题

免费申请体验>
课程介绍

课程简介:

在用Python进行Pandas数据清洗和建模的视频课程中,Daniel Y. Chen为《用Python基础语句进行Pandas数据分析视频课》构建了基础。在这一系列课程中,Dan教给你清理和处理数据所必需的技术和技巧。Dan向你展示如何使用某些内置的Python库对数据进行再加工,以清理加载到Pandas中的数据。一旦完成数据清理,你将会想要对它进行分析,所以Dan接下来会向你介绍用于模型拟合的其它库。

讲师介绍: 

Daniel Y. Chen(丹尼尔·陈)是弗吉尼亚理工大学遗传学、生物信息学和计算生物学(GBCB)跨学科博士研究生,也是软件工程方向的讲师及课程开发人员。目前在该所大学生物复杂性研究所的社会和决策分析实验室工作,在那里他利用数据为政策制定提供决策信息。他是畅销书《Python数据分析:活用Pandas库》的作者。

适合人群
  • 数据科学的新手,尤其是那些有Python编程经验的人
  • 具备基本的编程技能,尤其是Python相关经验的学员
  • Python数据科学初中级学者
讲师介绍
《Python数据分析:活用Pandas库》的作者
擅长领域:
  • 数据库
弗吉尼亚理工大学遗传学、生物信息学和计算生物学(GBCB)跨学科博士研究生,也是软件工程方向的讲师及课程开发人员。目前在该所大学生物复杂性研究所的社会和决策分析实验室工作,在那里他利用数据为政策制定提供决策信息。他是畅销书《Python数据分析:活用Pandas库》的作者。
传播工业技术、工匠技能和工业文化,助力我国自主创新能力提升
擅长领域:
  • 智能制造
  • 企业创新与商业模式
  • 数字化思维与认知
  • 数字化领导力
机工社先后获评“全国优秀出版社”“全国百佳出版单位”“中国500最具价值品牌”“世界媒体500强”“国家文化出口重点企业”“中国版权最具影响力企业”“中国图书海外馆藏影响力出版100强”和“教育部教材出版基地”。机工旗下出版物曾获得全国科学大会奖、国家图书奖、中国出版政府奖、全国优秀科技图书奖、中国好书、全国教材建设奖等众多国家奖项。机工社新世纪的快速发展,在业界引起广泛关注,2014年其改革发展实例被收录进哈佛大学案例库应用于教学实践,并通过哈佛大学的出版网络向全球发行,成为中国文化产业战略管理“走出去”第一家。 传播工业技术、工匠技能和工业文化,助力我国自主创新能力提升,是机工社的使命与追求。愿与各界机构、各界人士携手同行,集知播识,再铸辉煌。
课程大纲
共0节 时长0分钟 全部收起
课程导读
图文
第1课 Pandas数据类型
共4节 | 11分钟
  • 1.0学习目标
    1分钟
  • 1.1 理解Pandas中的数据类型
    1分钟
  • 1.2 数据类型转换
    5分钟
  • 1.3 分类数据的转换和操作
    3分钟
第2课: Pandas中的非结构化文本和字符串
共7节 | 27分钟
  • 2.0学习目标
    1分钟
  • 2.1 理解字符串
    3分钟
  • 2.2 使用字符串方法
    4分钟
  • 2.3 使用更多的字符串方法
    3分钟
  • 2.4 利用字符串格式
    6分钟
  • 2.5 利用正则表达式(regex)
    9分钟
  • 2.6 访问正则表达式库
    1分钟
第3课: 使用函数
共6节 | 22分钟
  • 3.0学习目标
    1分钟
  • 3.1 使用函数
    2分钟
  • 3.2 apply应用的基础知识
    6分钟
  • 3.3 逐行和逐列使用apply
    5分钟
  • 3.4 使用向量化函数
    6分钟
  • 3.5 使用lambda函数
    3分钟
第4课:使用groupby进行拆分计算:拆分-应用-合并
共5节 | 17分钟
  • 4.0学习目标
    1分钟
  • 4.1 聚合数据
    6分钟
  • 4.2 转换数据
    4分钟
  • 4.3 筛选数据
    1分钟
  • 4.4 使用pandas.core.groupby.DataFrameGroupBy对象
    5分钟
第5课:Python和Pandas中的日期和时间
共13节 | 29分钟
  • 5.0学习目标
    1分钟
  • 5.1 使用Python的日期时间
    1分钟
  • 5.2 转换为日期时间
    2分钟
  • 5.3 加载带有日期的数据
    1分钟
  • 5.4 提取时间成分
    3分钟
  • 5.5 实现时间计算和时间增量
    1分钟
  • 5.6 使用datetime方法
    2分钟
  • 5.7 获取股票数据
    1分钟
  • 5.8 基于日期提取数据
    3分钟
  • 5.9 使用日期范围
    4分钟
  • 5.10 平移值
    6分钟
  • 5.11 进行重采样
    2分钟
  • 5.12 时区的处理
    2分钟
第6课:建模,连接Pandas之外的世界
共8节 | 53分钟
  • 6.0学习目标
    1分钟
  • 6.1 线性回归
    8分钟
  • 6.2 逻辑回归
    4分钟
  • 6.3 泊松或负二项式模型
    3分钟
  • 6.4 生存模型
    9分钟
  • 6.5 模型诊断
    14分钟
  • 6.6 正则化技术
    6分钟
  • 6.7 聚类和主成分分析(PCA)
    8分钟
第7课 用Python进行Pandas数据清理和建模:总结
1分钟
课程总结
图文
课后测试
共5题
购课须知

课程有效期:

自购买课程之日起 365 天,部分参与营销活动产品以活动规则为准,请同学在有效期内学习、观看课程。

上课模式:

课程采取录播模式,请注意自学课无班级微信群、班主任带班及助教批改服务。

注:自学课不支持退款,确保你是真的需要再进行报名,报完名之后还请认真学习。