统计学四年,我是怎么从”数学恐惧症”变成数据分析师的
先说背景:普通211统计学本科,后来读了数据科学硕士,现在在一家互联网公司做数据分析主管。
说实话,当年选统计是因为听说”好就业”,结果进来之后发现——这专业是真的难,数理统计、随机过程、回归分析……每一门课都能让你怀疑人生。但走过来之后,我得说:这条路选对了。
大一:被高数和线代暴打的开始
大一上学期,数分、高代、Python编程。
高等数学和线性代数是基础中的基础。我那会儿数学底子一般,第一学期高数差点挂科,后来拼命补才勉强跟上。
编程是从零开始学的。Python真的是好东西——语法简单、生态丰富、做数据分析是真的爽。我建议每个人都认真学,别像我一样大三才后悔没好好打基础。
大一下学期,概率论来了。
这门课是统计学的”灵魂”。随机变量、概率分布、大数定律、中心极限定理——这些概念你得彻底理解,不然后面的课全是天书。
这个学期我开始用GitHub管理代码了。虽然当时只是把课程作业传上去,但养成了好习惯。
大二:专业核心课,hard模式启动
大二上学期,数理统计登场。
参数估计、假设检验——这两章我反复看了至少五遍。不理解没关系,多做题是真的有用。我那会儿刷了茆诗松的《概率论与数理统计》习题集,后来考研/保研面试的时候这些基础救了我。
回归分析也开始了。线性回归、逻辑回归——这些在现在的工作中天天都在用。
大二下学期,随机过程、多元统计、SQL数据库。
随机过程真的难,马尔可夫链、泊松过程、布朗运动……我学的时候云里雾里的,后来读研才慢慢理解。但这门课对做量化金融、时间序列分析很有用。
SQL是从这时候开始学的。我强烈建议每个统计人都把SQL学精通——这是数据分析师的必备技能,比Python还重要。
大三:决定方向的分水岭
大三上学期,我开始认真考虑未来的方向。
这时候有几条路可以选:
- 互联网/数据科学方向
- 金融/量化方向
- 生物统计方向
- 继续学术
我最后选择了互联网方向,因为觉得这个方向最有趣,而且薪资也不错。
这个学期我还开始刷Kaggle了。虽然没拿什么好名次,但积累了不少项目经验。
大三下学期,机器学习、贝叶斯统计、时间序列分析。
机器学习是统计和CS的交叉领域。吴恩达的课我看了两遍,sklearn的文档我翻烂了。
这时候要开始找实习了。我投了十几家公司,最后在一家电商公司找到了数据分析实习。实习期间真正接触了业务——用户画像、AB测试、留存分析……这些在学校里根本学不到。
大四:收获的季节
大四上学期,拿到了保研offer,同时秋招也拿了几个offer。
最后我选择了读研,因为觉得本科出去能做的数据分析太浅了,想往更深的算法方向走。
毕设我做了一个用户流失预测的项目,用的是XGBoost模型。这个项目后来成了我简历上的亮点。
考研还是就业?
说实话,统计学的就业面是真的广。
本科就业:数据分析员、商业分析师、运营分析师——这些岗位本科能进,但天花板低。
读研之后:数据科学家、算法工程师、量化分析师——这些岗位硕士起步,薪资高得多。
我选择读研,现在回头看是对的。研究生期间积累的项目和论文,让我有能力竞争更好的岗位。
统计学人必须知道的竞赛
-
全国大学生统计建模大赛(★★★★★):最对口的专业竞赛。我拿了国家二等奖,面试的时候面试官专门问了我的参赛经历。
-
Kaggle等数据科学竞赛(★★★★★):能拿奖牌是最好的能力证明。我虽然没拿奖,但项目经验很有用。
-
数学建模竞赛(★★★★★):统计背景的人做建模有优势。
-
挑战杯(★★★★☆):可以做一个基于数据分析的社科研究。
统计学毕业都能去哪?
互联网公司:字节跳动、阿里、腾讯、美团、百度——这些公司都在招数据分析师和数据科学家。我现在就在某大厂做数据分析。
金融行业:银行、券商、基金的数据分析岗。我有同学去了头部券商做量化,薪资很可观。
咨询公司:尼尔森、艾瑞、麦肯锡——做市场研究或者数据分析顾问。
政府机构:统计局、银保监会——稳定的体制内工作。
生物医药:CRO公司——做临床试验的数据分析。SAS统计师在医药行业很稀缺。
该考什么证书?
说实话,GitHub比证书重要多了。但有几个证书还是有用的:
-
SAS认证:如果你想做生物统计或者金融风控,这个证书很值钱。
-
FRM/CFA:如果你想进金融行业,这两个证书能补足金融背景。
-
软考:国企或者体制内工作认可这个证。
最后说一句:实习经历比证书重要100倍。在面试中,我更关心你做过什么项目、遇到过什么问题、怎么解决的——这些才是真正能力的体现。