如何用8步成为数据科学家

2024-11-20 03:36:00
推荐回答(1个)
回答1:

数学,或者计算机。(1)计算机科学一般来说,数据科学家大多要求具备编程、计算机科学相关的专业背景。简单来说,就是对处理大数据所必需的Hadoop、Mahout等大规模并行处理技术与机器学习相关的技能。零基础学习Hadoop该如何下手?想从事大数据、海量数据处理相关的工作,如何自学打基础?(2)数学、统计、数据挖掘等除了数学、统计方面的素养之外,还需要具备使用SPSS、SAS等主流统计分析软件的技能。其中,面向统计分析的开源编程语言及其运行环境“R”最近备受瞩目。R的强项不仅在于其包含了丰富的统计分析库,而且具备将结果进行可视化的高品质图表生成功能,并可以通过简单的命令来运行。此外,它还具备称为CRAN(TheComprehensiveRArchiveNetwork)的包扩展机制,通过导入扩展包就可以使用标准状态下所不支持的函数和数据集。R语言虽然功能强大,但是学习曲线较为陡峭,个人建议从python入手,拥有丰富的statisticallibraries,NumPy,SciPy.org,PythonDataAnalysisLibrary,matplotlib:pythonplotting。如何系统地学习数据挖掘?做数据分析不得不看的书有哪些?怎么学习用R语言进行数据挖掘?(3)数据可视化(Visualization)信息的质量很大程度上依赖于其表达方式。对数字罗列所组成的数据中所包含的意义进行分析,开发Web原型,使用外部API将图表、地图、Dashboard等其他服务统一起来,从而使分析结果可视化,这是对于数据科学家来说十分重要的技能之一。有哪些值得推荐的数据可视化工具?(4)跨界为王麦肯锡认为未来需要的“translators”,能够在IT技术,数据分析和商业决策之间架起一座桥梁的复合型人才是最被人需要的。”translators“可以驱动整个数据分析战略的设计和执行,同时连接的IT,数据分析和业务部门的团队。如果缺少“translators“,即使拥有高端的数据分析策略和工具方法也是于事无补的。