互联网行业的数据采集(下)
知识小课

互联网行业的数据采集(下)

  • 数据挖掘与分析

大数据分析入门

¥39.9
本课程包括
  • 33分钟的视频随时观看
  • 课程包含 5 道测试题
  • 可在APP随时观看
  • 结业证书
你将收获
  • 了解大数据架构及大数据分析的Pipeline
  • 了解互联网行业常见的四种数据采集方式
  • 了解爬虫的常见框架-Scrapy和分布式爬虫以及反爬虫策略
  • 了解前后端埋点原理
  • 了解离线数据、实时数据分析的分析场景及框架

数千家企业正在使用三节课企业版学习

无限制学习2000+门课程,200+精选学习专题

免费申请体验>
课程介绍

很多同学都有过数据采集的经历,不知道在数据采集实操过程中,你是否也会以下疑问呢:

大数据架构具有怎样的作用呢?什么是Hadoop生态圈和经典大数据分析Pipeline?

常见的数据来源有哪些?

在进行互联网爬虫采集数据时,有哪些反反爬虫策略?

在埋点采集数据时,如何确定是前端埋点还是后端埋点?

如何通过日志上报的方式进行数据采集呢?

在对已有数据库进行同步时,离线同步和实时同步流程是怎样的呢?它们具体有哪些应用场景呢?

......

本节课,拥有丰富大数据分析经验的刘恒老师将结合实例按照业务流程来解答同学们的疑问。

适合人群
  • 0-1岁数据分析方向从业者
  • 想要提升数据分析能力的互联网从业者
  • 对大数据分析感兴趣的学习者
讲师介绍
北京大学硕士,8年互联网公司从业经验
曾就职于爱奇艺,乐视云计算等公司。
课程大纲
共0节 时长0分钟 全部收起
「课程说明」
共4节 | 3分钟
  • 学前说明
    图文
  • 讲师介绍
    图文
  • 学习系统使用说明
    3分钟
  • 版权声明
    图文
「课程导论」
共1节 | 1分钟
  • 课程结构
    1分钟
「大数据离线分析」
共2节 | 14分钟
  • 常见离线分析架构及应用场景
    14分钟
  • 本章反馈
    作业
「大数据实时分析」
共2节 | 14分钟
  • 常见实时分析架构及应用场景
    14分钟
  • 本章反馈
    作业
「课程总结」
共1节 | 1分钟
  • 课程总结
    1分钟
课程反馈
共1节
  • 课程反馈
    图文
课后测试
共5题
购课须知

课程有效期:

自购买课程之日起 365 天,部分参与营销活动产品以活动规则为准,请同学在有效期内学习、观看课程。

上课模式:

课程采取录播模式,请注意自学课无班级微信群、班主任带班及助教批改服务。

注:自学课不支持退款,确保你是真的需要再进行报名,报完名之后还请认真学习。