数据科学基础 第一部分:基本概念、数据清洗和数据库
体系课

数据科学基础 第一部分:基本概念、数据清洗和数据库

  • 数据库

如何获得和使用Python运行时数据科学环境 数据科学过程的基础知识和每个步骤的必要条件等

¥259.99
本课程包括
  • 16小时10分钟的视频随时观看
  • 可在APP随时观看
  • 结业证书
课程合作品牌
机械工业出版社
你将收获
  • Python运行时数据科学环境
  • 数据科学过程的基础知识

数千家企业正在使用三节课企业版学习

无限制学习2000+门课程,200+精选学习专题

免费申请体验>
课程介绍

Data Science Fundamentals LiveLessons将教给你成为一名有效的数据科学家所需要的基本概念、理论和技术。这些视频向你展示了Python及其相关库系统中应用的、示例驱动的课程,在这些课程中,你可以使用真实的数据集并看到真实的结果。在此过程中,你将学习专业数据科学家使用的实践和计算技术。更具体地说,你将学习如何通过使用API获取Internet上可公开访问的数据。你将学习如何解析XML和JSON数据,将其加载到关系数据库中。

此课程不提供资料下载

适合人群
  • 有抱负的数据科学家希望进入这个领域,学习必要的基本知识
  • 记者、顾问、分析师或其他任何从事数据工作并希望采取程序化方法探索数据和进行分析的人
  • 定量研究人员对将理论应用于实际项目和采用计算方法建模感兴趣。
讲师介绍
传播工业技术、工匠技能和工业文化,助力我国自主创新能力提升
擅长领域:
  • 智能制造
  • 企业创新与商业模式
  • 数字化思维与认知
  • 数字化领导力
机工社先后获评“全国优秀出版社”“全国百佳出版单位”“中国500最具价值品牌”“世界媒体500强”“国家文化出口重点企业”“中国版权最具影响力企业”“中国图书海外馆藏影响力出版100强”和“教育部教材出版基地”。机工旗下出版物曾获得全国科学大会奖、国家图书奖、中国出版政府奖、全国优秀科技图书奖、中国好书、全国教材建设奖等众多国家奖项。机工社新世纪的快速发展,在业界引起广泛关注,2014年其改革发展实例被收录进哈佛大学案例库应用于教学实践,并通过哈佛大学的出版网络向全球发行,成为中国文化产业战略管理“走出去”第一家。 传播工业技术、工匠技能和工业文化,助力我国自主创新能力提升,是机工社的使命与追求。愿与各界机构、各界人士携手同行,集知播识,再铸辉煌。
课程大纲
共0节 时长0分钟 全部收起
1.1欢迎来到本课程
3分钟
1.2为什么是数据科学,为什么是现在
6分钟
1.3数据科学的潜力
20分钟
1.4建立数据科学开发环境
7分钟
1.5 Python(3)引语
18分钟
1.6Python 2与Python 3的对比
6分钟
1.7测试你的知识-Wordbuzz
21分钟
1.8 Wordbuzz-把它们放在一起
10分钟
1.9 Python回顾和参考资料
7分钟
1.10 Python用于数据科学
13分钟
2.1数据科学过程介绍
7分钟
2.2定义你的问题
5分钟
2.3获取数据
16分钟
2.4整理数据
22分钟
2.5探索数据
22分钟
2.6通过三角闭合的建议
16分钟
2.7 Python开发流程
12分钟
2.8 Python中的三元闭包
22分钟
2.9推荐系统的挑战
9分钟
2.10获得评价基线
14分钟
2.11检查和评价结果
9分钟
2.12展示和传播
12分钟
2.13数据科学的应用——更便宜的床,更好的早餐
5分钟
3.0第三课-获取数据——源和方法
2分钟
3.1数据科学思维
12分钟
3.2数据科学技术栈
13分钟
3.3数据来源-来源和服务
14分钟
3.4网络的工作原理
16分钟
3.5使用Python进行HTTP请求
12分钟
3.6用开放数据添加上下文
8分钟
3.7用Python——JSON和XML解析数据
22分钟
3.8数据和文件格式
13分钟
3.9使用API
20分钟
3.10 使用Python参数化API请求
22分钟
3.11探索Foursquare API
11分钟
3.12下载Foursquare Venues
16分钟
4.0第4课-添加结构解析数据和数据模型
1分钟
4.1 ETL管道介绍
9分钟
4.2数据模型——为数据添加结构
19分钟
4.3构建抽象——面向对象编程
9分钟
4.4用Python创建类
16分钟
4.5定义方法和更新状态
16分钟
4.6魔法方法、类属性和内省
18分钟
4.7探索并组织Foursquare的响应
19分钟
4.8应用数据模型——用类表示Foursquare实体
18分钟
4.9用方法建模行为
11分钟
4.10使用Setter方法和虚拟属性定制模型接口
18分钟
4.11让事情DRY通过继承
21分钟
4.12面向对象编程用例
15分钟
4.13支持(和反对)OOP的理由
11分钟
5.0第5课- 存储数据——使用关系数据库的持久性
1分钟
5.1 SQLite数据库介绍
22分钟
5.2使用SQLite shell检查数据库
10分钟
5.3数据库概况
10分钟
5.4模式中有什么-将数据模型映射到数据表
18分钟
5.5对象关系映射器介绍
5分钟
5.6 Python中的ORM和peewee
15分钟
5.7使用peewee创建和查询记录
18分钟
5.8 Python中的端到端ETL
7分钟
5.9 ORMs的优点和缺点
4分钟
5.10提取、转换、加载——将它们放在一起
8分钟
6.0第6课-验证数据来源和质量控制
1分钟
6.1探索性数据分析介绍
14分钟
6.2使用图形工具快速理解数据
14分钟
6.3使用peewee检查数据库和构建模式
16分钟
6.4与peewee进行数据质量检查
14分钟
6.5使用peewee查找丢失的数据和空值
9分钟
6.6处理丢失数据
9分钟
6.7隐含描述数据的EDA
4分钟
6.8在peewee中检查查询和显示结果
13分钟
6.9 peewee分组和聚集
11分钟
6.10对Venues进行排名和排序
15分钟
6.11 SQL关系和连接
7分钟
6.12与peewee连接
19分钟
6.13使用连接跨数据集查询
20分钟
6.14将peewee翻译成SQL
5分钟
6.15 SQL连接的可视化介绍
12分钟
购课须知

课程有效期:

自购买课程之日起 365 天,部分参与营销活动产品以活动规则为准,请同学在有效期内学习、观看课程。

上课模式:

课程采取录播模式,请注意自学课无班级微信群、班主任带班及助教批改服务。

注:自学课不支持退款,确保你是真的需要再进行报名,报完名之后还请认真学习。