数据科学:基于Python和R语言实现
体系课

数据科学:基于Python和R语言实现

  • 数据挖掘与分析
  • Python
  • R语言

学习谷歌Colab记事本进行数据科学编程、学习数据科学中使用的Python的基本子集等

¥169
本课程包括
  • 7小时6分钟的视频随时观看
  • 可在APP随时观看
  • 结业证书
课程合作品牌
机械工业出版社
你将收获
  • 学会使用Anaconda和Jupyter notebooks
  • 了解开放数据科学概念、角色和工作流

数千家企业正在使用三节课企业版学习

无限制学习2000+门课程,200+精选学习专题

免费申请体验>
课程介绍

用Python数据科学和R LiveLessons是为了定制的初学者数据科学家寻求使用Python或R数据科学。本课程包括数据准备基础、数据分析、数据可视化、机器学习和交互式数据科学应用。学生们将学习如何建立预测模型,以及如何使用Anaconda平台为他们的业务线创建交互式可视化应用程序。本课程将介绍数据科学家如何使用Python和R来构建一个由数百种高性能开源工具组成的系统。

这些活动的笔记可以在https://anaconda.org/datasciencepythonr上找到。

适合人群
  • Python数据科学初学者
  • 使用Python或者R做数据科学相关工作的学员
  • 对Python感兴趣的相关学员
讲师介绍
传播工业技术、工匠技能和工业文化,助力我国自主创新能力提升
擅长领域:
  • 智能制造
  • 企业创新与商业模式
  • 数字化思维与认知
  • 数字化领导力
机工社先后获评“全国优秀出版社”“全国百佳出版单位”“中国500最具价值品牌”“世界媒体500强”“国家文化出口重点企业”“中国版权最具影响力企业”“中国图书海外馆藏影响力出版100强”和“教育部教材出版基地”。机工旗下出版物曾获得全国科学大会奖、国家图书奖、中国出版政府奖、全国优秀科技图书奖、中国好书、全国教材建设奖等众多国家奖项。机工社新世纪的快速发展,在业界引起广泛关注,2014年其改革发展实例被收录进哈佛大学案例库应用于教学实践,并通过哈佛大学的出版网络向全球发行,成为中国文化产业战略管理“走出去”第一家。 传播工业技术、工匠技能和工业文化,助力我国自主创新能力提升,是机工社的使命与追求。愿与各界机构、各界人士携手同行,集知播识,再铸辉煌。
课程大纲
共0节 时长0分钟 全部收起
第1课 使用Python和R的数据科学:简介
5分钟
第1课 面向所有人的开放数据科学
共7节 | 29分钟
  • 1.0学习目标
    1分钟
  • 1.1使用Anaconda代码仓库进行数据科学工件
    3分钟
  • 1.2使用Anaconda Navigator开发环境打开
    2分钟
  • 1.3执行基本的Jupyter操作
    3分钟
  • 1.4用Pandas摄取、分析和清理数据
    7分钟
  • 1.5使用Bokeh可视化数据
    4分钟
  • 1.6使用Scikit Learn创建机器学习和预测建模
    10分钟
第2课 开放数据科学的背景概念
共4节 | 17分钟
  • 2.0学习目标
    1分钟
  • 2.1了解开放数据科学的概念
    2分钟
  • 2.2确定开放数据科学团队中的不同角色
    6分钟
  • 2.3了解开放数据科学工作流程
    8分钟
第3课 使用Pandas进行数据清洗
共10节 | 1小时26分钟
  • 3.0学习目标
    1分钟
  • 3.1加载、查看和绘制Pandas数据框
    10分钟
  • 3.2修改内容和创建新列
    10分钟
  • 3.3使用boolean masks进行数据选择
    9分钟
  • 3.4从磁盘读取数据
    11分钟
  • 3.5数据分组
    9分钟
  • 3.6连接到数据库
    16分钟
  • 3.7使用时间序列数据
    7分钟
  • 3.8读写Excel文件
    10分钟
  • 3.9将代码发布到Anaconda Cloud
    3分钟
第4课 Anaconda
共7节 | 34分钟
  • 4.0Anaconda环境管理器概述
    1分钟
  • 4.1描述Anaconda发行版本
    4分钟
  • 4.2 熟悉Conda工具的用途
    3分钟
  • 4.3关联Anaconda企业组件
    10分钟
  • 4.4熟悉核心技术组件
    5分钟
  • 4.5描述典型的数据科学工作流
    2分钟
  • 4.6与团队一起在Anaconda企业版中创建项目
    8分钟
第5课 使用Bokeh
共7节 | 43分钟
  • 5.0使用Bokeh创建交互式可视化
    1分钟
  • 5.1描述Bokeh
    5分钟
  • 5.2用boke .charts绘制Pandas数据
    6分钟
  • 5.3用bokeh.plotting管理绘图
    10分钟
  • 5.4使用小部件和绘图链接进行交互性
    14分钟
  • 5.5创建web绘图
    3分钟
  • 5.6使用Bokeh服务器创建数据应用程序
    5分钟
第6课 Conda
共11节 | 1小时13分钟
  • 6.0Conda包管理工具
    1分钟
  • 6.1从Navigator安装软件包
    9分钟
  • 6.2从Navigator添加channels
    4分钟
  • 6.3从Navigator中升级、降级和删除包
    3分钟
  • 6.4从Navigator创建一个新环境
    6分钟
  • 6.5选择Conda环境和Jupyter内核
    8分钟
  • 6.6从命令行使用Conda
    11分钟
  • 6.7了解pip和conda之间的区别
    13分钟
  • 6.8保持pip和conda最新
    2分钟
  • 6.9导出、保存和共享Conda环境
    9分钟
  • 6.10在Anaconda Cloud和Conda-Forge上查找包
    7分钟
第7课 课程中的数据处理和可视化
共7节 | 1小时13分钟
  • 7.0学习目标
    1分钟
  • 7.1配置一个R分析环境
    5分钟
  • 7.2使用dplyr和tidyr访问和处理数据
    10分钟
  • 7.3使用ggplot创建可视化效果
    22分钟
  • 7.4使用线性模型进行预测分析
    15分钟
  • 7.5使用rBokeh和Shiny创建交互式可视化
    9分钟
  • 7.6用rpy2搭建R和Python之间的桥梁
    11分钟
第8课 构建统计和预测模型
共5节 | 22分钟
  • 8.0 学习目标
    1分钟
  • 8.1使用Scikit-Learn创建一个预测模型
    6分钟
  • 8.2用模型生成预测
    5分钟
  • 8.3评分模型
    8分钟
  • 8.4可视化模型性能
    3分钟
第9课 Anaconda Fusion的Excel和Python
共4节 | 11分钟
  • 9.0学习目标
    1分钟
  • 9.1了解Fusion解决了哪些问题
    2分钟
  • 9.2安装并启动Fusion
    4分钟
  • 9.3连接电子表格到编码表
    4分钟
第10课 使用Mosaic的数据库和分布式数据
共4节 | 8分钟
  • 10.0学习目标
    1分钟
  • 10.1了解Mosaic解决的问题
    2分钟
  • 10.2 安装并启动Mosaic
    1分钟
  • 10.3 使用Mosaic注册数据集和创建数据视图
    5分钟
第11课 Dask的分布式和并行计算
共4节 | 22分钟
  • 11.0 学习目标
    1分钟
  • 11.1 描述Dask与Dasks的关系
    6分钟
  • 11.2 描述Dask数据框的创建
    10分钟
  • 11.3 分析和绘制Dask数据
    5分钟
使用Python和R的数据科学:总结
3分钟
购课须知

课程有效期:

自购买课程之日起 365 天,部分参与营销活动产品以活动规则为准,请同学在有效期内学习、观看课程。

上课模式:

课程采取录播模式,请注意自学课无班级微信群、班主任带班及助教批改服务。

注:自学课不支持退款,确保你是真的需要再进行报名,报完名之后还请认真学习。