搞了一年大数据后,我有这些职场感悟

发布时间:2018-12-03 00:00      浏览:44
作者:Abhishek Parbhakar
来源:36Kr

大学毕业后我就成为了一名数据科学家,到现在已经工作了一年。进入这个领域时我抱有各种各样的期待,以下就是我的一些想法。


数据科学确实是一个回报不错的领域,但也有其优缺点。这篇文章仅基于我有限的经验和学识,因此你可以对我文中的观点有所保留。


背景介绍


在说我的观点之前,我想先简单的介绍一下自己的背景。


我在学校的时候就很喜欢数学并学会了基础的编程。后来,我在印度理工学院孟买分校(IIT Bombay)学习电气工程,并与哈佛大学教授一起工作近一年,拿到科学计算硕士学位。毕业后,我进入了一家专注于AI的咨询公司,为印度和欧洲的客户做数据科学的项目。


我必须承认自己还处于学习初期。我有时会犯一些错误并且会自问:这些年来我学到了什么?


1. 数据科学是很有趣的,如果……


数据科学是一个能让你把所有炫酷的事情放在一块做的稀有工作,它包括了数学、编码和研究。这是一份早上读论文,下午写算法,晚上编代码的工作。这真的很有趣!几天前,当我访问母校时,一位大三学生问我:我如何描述我的工作?我脱口而出:


就像有人付钱让你做作业一样!


但问题是:你只能做“某一些”数学运算、编码和研究。你不能不做其中规定的任何部分,也无法在已给领域中深入。在某些情况下,你也许可以不用读任何研究论文,就能直接使用代码库并开始编码。由于时间有限,你唯一有机会深入研究的部分就是数据准备(以及要进行的演示,如果有的话)。


如果你是一个热爱编码并非常想做这个工作的人,这中间的数学运算则会让你发疯。你没有机会去展示你忍者般的编码技能。从编码爱好者变成数据科学家后,你只有两个选择:让数学蹂躏你,或者你征服它。如果你是一个喜欢解决复杂问题的数学爱好者,那么数据的准备和单调的编程又会让你觉得乏味至极。一个形象的比喻是:


想象一下,如果有人给你一个订书机,让你去整理并装订一屋子的纸质文件,感觉如何?这就是数据清理过程的感觉。有时你可能会想,如果有人做数据准备的工作,而你只要根据其建立模型就好了。但不幸或者说幸运的是,这从来不会发生。


也许有人会说,这些你不喜欢的事情只占据你所有工作中的一小部分,但事实是,它对于你的整个工作有着远超于其自身比例的影响(参考帕累托定律)。


要想在数据科学领域坚持做下去,就要努力在编码和数学/研究之间达到适当的平衡。最重要的是,要享受工作中的不同方面,并同时保持对结果的关注


同样,数据科学作为一个正在不断进化发展的领域,它没有任何明确的成功指南。这就需要大量辛苦的工作,不断的学习,以及最重要的——忘却(因为你不知道什么时候“最好的”就变成了“还可以”)。


总结一下:


优点:数据科学让你同时处理许多有意思的事:编码、运算、研究,有时还包括演示。


缺点:数据科学可能不会让你在其任何一个方面做得太深。

2. 数据科学说是“科学”其实更“商业”


行业里的数据科学家跟在欧洲粒子物理研究所或者印度空间研究组织工作的科学家不一样。数据科学家“真正”在做的是把科学的工具应用到商业里,并为其创造价值。数据科学家的工作不是简单的找到最优解决方法,而是找到一个易于向客户解释并可销售的方案。


在数据科学中,当遇到竞争假设时,商业逻辑通常胜过科学逻辑


了解人工智能,尤其是熟知其子领域机器学习这块你就可以开始数据科学的工作,但这还不够。


要想在数据科学项目中有所作为,“科学”是不充分条件,你还需要知道经济和市场,以让你的工作具有商业价值。


3. 数据科学的工作是有影响力的,但其实跟其他工作一样


作为一个数据科学家你“很可能”创造巨大的“影响”,但作为一个老师、一个软件工程师、一个记者或者销售员同样可能创造巨大影响。


数据科学正在改变着我们的世界,这无可厚非。但作为一个数据科学家,你能够发挥关键作用的领域是有限的。那种认为数据科学是“改变”网络世界的神秘力量的想法并不完全正确。


此外,“影响”这个词是非常主观的,对于其界定也有许多方面,如:


它有/创造了多少货币价值;


谁是最大的受益者;


你的在其中的角色有多独特和重要;


它在多大程度上是可自我延续的。


你想要什么样的“影响”,而公司给你提供的机会能创造什么样的“影响”,这可能会有很大不同。


如果你是一个聪明且有野心的人,想要在数据科学领域做出“影响”,那么确保你是“合适”这个领域的人,并且你所指的影响与公司能提供给你的机会一致

4. 当下的经济决定了数据科学


如今数据科学家是一个“抢手”的工作,以致许多招聘者经常联系你,问你是否考虑换公司的情况也不少见。数据科学家在公司里很受尊重而且薪资不菲。


如果你的首要动机是钱的话,我建议你不必做一个数据科学家。


如果你做数据科学只是为了钱,那么我想提醒你,同样的经济规则早晚会让这样的高收入消失。只有你对这个领域的兴趣能够让你持续做下去。


5. 数据科学家的经验是你的垫脚石


数据科学家的工作能帮助你在这个数据驱动的世界里打下坚实基础,并可以更切实地评估AI相关技术的局限性及其功能。


即便你选择离开现有的工作,作为一个数据科学家的经验对你的未来是非常有益的。比如在:


学术研究上(作为硕士/博士/博士后/独立研究者):数据科学家通常花费大量的时间在做实验、读科学文献和与他们的同事讨论想法上。所有这些工作对于做学术研究来说都是非常可贵的。


初创企业中:当然你可以在一个AI创企里担任科技类的职位,或者开创你自己的公司同样在数据科学领域。但你也可能在一个AI创企里担任一个非科技类的职位,例如销售、商业策划或者财务。你的知识和经验能帮助你更好地理解和销售产品,预估项目成本和其他所需,最重要的是你不会觉得自己是个门外汉。有很多理由让你想要从事非科技类的工作,其中一个可能的理由就是在那些成功的科技企业的高管里有不少是经常从事编码工作的人。


政府以及国际组织中:各国政府越来越关注AI系统对社会的影响,以及如何最好地将其应用于可持续发展。你可以利用你作为数据科学家的经验在AI政策相关领域工作,在这里会需要对于AI的深刻理解以制定对社会最有益的政策法规。

注意:以上都是我的个人观点,你可以同意或保持自己的观点。我的目的不是写理想的数据科学家的工作是怎样的,也不是数据科学“应该”如何做,更不是描述谁可以成为一个数据科学家。这些只是我想分享的一些观点,是我从这一年作为“数据科学家”的工作中得来的。

© 2011~2015 3 北京勺海市场调查有限责任公司 | 京ICP备12031756号 | 京公网安备11010802012285号

电话:010-84284411    地址:中国北京朝阳区东三环中路建外SOHO18号楼1506室   技术支持:千晨科技