简介
数据科学作为一门跨学科领域,涉及到统计学、数据分析、机器学习及其在各个领域的应用。为了帮助数据科学岗位的专业人士全面提升技能,三节课精心打造了《数据科学岗位能力模型》,旨在助力数据科学家在数据驱动的决策过程中发挥关键作用,实现技术的深入掌握和应用。
本能力模型深入剖析了数据科学岗位在不同级别所需的技能和知识,包括数学能力、编程语言、数据分析、机器学习、深度学习、数据治理、数据挖掘等,为数据科学岗位的专业人士提供了一条清晰的职业发展路径。
核心内容
- 初级能力:
- 数学能力:掌握离散数学、线性代数、统计学基础、概率论等。
- 数据思维:学习数据可视化、5W2H分析法、假设检验等。
- 数据分析能力:了解业务拆解、数据指标体系、数据获取等。
- 机器学习:掌握Excel、SQL、Power BI等基础数据分析和可视化工具。
- 中级能力:
- 数据分析工具:深入学习SPSS、SAS、Tableau、SQL等数据分析工具。
- Python基础:掌握Python编程、数据处理、文件操作等。
- R语言:学习R语言编程、数据可视化、统计分析等。
- 数据挖掘与存储:了解数据挖掘流程、数据仓库、数据合并等。
- 高级能力:
- 机器学习:掌握Boosting、Bagging、EM算法、决策树模型等高级机器学习技术。
- 深度学习:学习基础学习、卷积神经网络(CNN)、循环神经网络(RNN)、生成对抗网络(GAN)等。
- 数据计算:掌握Spark、Hbase、Storm等大数据处理技术。
- 计量经济学:了解ML、RL、因果推断等经济学模型。
- 专家能力:
- 数据挖掘与存储:深入学习数据挖掘算法、数据仓库管理、数据安全等。
- 机器学习:掌握高级机器学习模型、特征工程、模型评估与优化等。
- 数据治理:了解数据治理框架、数据质量管理、数据资产目录等。
- 数据提升:学习数据采集、数据清洗、数据集成等数据预处理技术。