数据分析的常见工作类型:
工作能力:取数每天的工作内容也比较简单、重复和机械,就是写SQL取数,根据业务的需求做数据统计、简单报表制作,总体上说价值感比较低,基本都是新人在做
取数是数据分析和后面一系列建模工作的基础,能够高效的完成取数,以及对于数据的底层架构的深入了解,也不是一件很容易的事情,这也就是“以力取胜”
必备技能:Excel(如果会VBA就更好了);SQL取数(核心技能);数据库(需要熟悉,具体看你公司用的什么数据库)
挖掘工程师:数据挖掘工程师的主要工作是利用已有的算法模型,对业务数据进行清洗、建模
算法工程师:算法工程师更看重理论基础,比如机器学习算法原理、相关数学原理等。算法工程师的主要工作一般是研究算法、为公司的相关业务需求优化算法
必备技能:数据库;python;数据挖掘算法;机器学习算法
市场业务分析:比如说零售公司的某个业务出了问题,比如销售,分析师的任务就是要搞清业务数据异常的原因,
取数据、做调查、做分析、找业务等等,最终输出分析报告给业务部门
运营分析:每天主要的任务就是从某个系统导出excel表,然后整理一个新的excel表。至于看得懂看不懂这个excel,完全看业务能力,跟技术操作没啥关系
业务分析师的任务就是发现问题-分析问题-得出结论,为业务人员的营销策略提供数据支撑
这个岗位比较看重你的思维能力和分析能力,需要你对数据有着敏锐的洞察力,同时也需要对业务有一定的知识储备
必备技能:SQL;统计学基础;EXCEL分析基础;python/R语言;思维方法与分析模型
都是研究行业数据和竞品数据,然后研究企业发展、为公司决策者提供战略决策指导意见的
商业分析师的工作内容就是通过对市场、竞对、企业的现状分析判断,提出未来的运营、产品方向建议,从而提升份额、提高营收
必备技能:SQL;商业分析模型与方法;市场营销与金融知识;SPSS等工具
统计及数据科学常见的职业方向:
- 机器学习工程师 Machine Learning Engineer:
代表了技术含量较高的方向,工作内容主要是开发机器学习系统和用这些系统解决实际问题。一般需要ship production code,做出来的是数据产品。
包含“会一些ML的软件工程师”和“会写生产代码的机器学习专家”两种,也就是说,侧重点会有差异,但是机器学习和软件开发技能都需要。有EE或者CS博士学位最佳,统计等计量学科博士,如果辅修了CS master,也合适。如果只有EE/CS硕士学位也可以,但是硕士生们需要额外自学很多机器学习知识才能胜任,只靠在学校里简单上一两门课,可能不够。此外,找工作的时候,也需要一些运气成分才能找到合适的岗位。
工作内容俗称analytics (product analytics or business analytics),从数据中提取insight,估计投资回报比,为产品方向提建议,所用工具一般较基础,比如写SQL query取数据、用R/Python做简单的分析、用Tableau/Excel作图比较常见,能自己开发Dashboard算是analyst里面技术强的;工作需要产生各种形式的报告;在统计层次上,懂基本t-test和线性回归即可。
一般是统计、数据科学、商务分析、工业工程等专业的硕士担任。
此类职位工作内容以高级建模为主,会针对复杂的问题来设计技术方案,比如Uber叫车的ETA、各种定价系统、airbnb和金融行业的Fraud Detection、Amazon物流管理,FB/linkedin的社交网络或者ebay/Airbnb/Uber这样供需双方Marketplace市场规模的实验。这些例子,听上去就不是写SQL能解决的,也不是会写代码就能做出来的,都需要比较深的领域知识。
一般是统计、运筹、经济、工业工程、EE、CS等专业的博士担任,需要某领域的深刻理解。
数据工程师职业的天然优势:
- 转行成本低,只要有一些数理基础,能学一点简单的SQL和python,就能找到一份不错的data相关的工作;
- Data这边也分很多工作种类,除了Hardcore的phd,ms的做模型的ds之外,也有ds-a这种需要conduct experimentation来跑result拿insight推动决策进行。soft skill要求高。 另外说别人浮躁不浮躁的,得无论什么方式,心态,只要拿到面试,过了面试,好好工作继续提升,就没有浮躁一说。
- 数据学的东西的确很杂,ML,SQL,PYTHON,Product,AB Testing, Data viz, Stats,communication这些,所以一旦有机结合起来,到了senior level,我觉得发展不会逊色CS的。