PRELOADER

Dinghow的个人博客

Current post : 《四年研究生总结》

10/22/2024 —— 

0. 前言

img1

当签完字完成终版论文的提交,我终于长舒了一口气,从大四提前一年进组,到完成硕士学位论文,快四年时间,一晃而过,回顾这段时间,一阵唏嘘之下是更平和的心态。四年前我自己并没有确定好是否要踏踏实实去做一个方向的学问,也不能完全下定做一名一眼也望不到头的engineer的决心,于是乎选择了现在看来性价比偏低的三年制学硕,还时时安慰自己“好歹也算个top2 title”。大家常说人生没有如果,马后炮也没有必要,人生节点上点击各种支线都会有不同形式的喜怒哀乐,时至今日的我,依然有着做好一门学问的热情,畅想在不同人文地理风情的环境下在一个小的topic上做成代表性的researcher。不过转过头来,对于四年前的我来说,再做一次选择,还会是现在的道路,在这条支线上,我学会了如何去尽自己的努力去克服困难,如何提升自己的心态明确自己的目标,对于做好一个领域的应用也充满了极大的兴趣和动力。

img1

1. 研究生阶段回顾

这四年来自己在coding、工程、阅读写作能力上均有不同程度的成长,而数学能力的极大值点应该还是在大四保研结束的那段时间,重新学了一遍高数、线代,看了抽代和组合数学,当时拿到了旷视研究院SLAM组的实习,onboard后突然被告知需要到硕士课题组提前实习,想到有机会体验国家新兴的研究机构,并且有助于硕士阶段提前做一点东西,我找mentor商量之后他也坦然表示祝好,时至今日依然挺感谢他的大度。在组内刚回国的年轻导师一开始也给了大家比较大的研究自由度,于是我打算跟着好学长群宝做一做3D点云的recognition。本科时候对DL的熟练程度相当于新手入门,加上自己“再不摸鱼就来不及了”的想法,整个大四期间除了赶毕业论文以外基本没有高强度focus做过事,把manifold learning用在点云表征上,从跑实验到写paper加起来花了两个月不到的时间,然后产出了我硕士期间用以毕业用的唯一一篇期刊论文(笑)。大四的时光是非常快乐的,在上一篇(已经是3年前)的博文中也有提到,每天划水、读读paper、健身、打游戏、毕业旅行,幸福感拉满。倘若我继续在megvii实习下去,公司中高强度节奏上推动我去做事,可能现在的我已经选择继续读博的道路了吧(lol),真是不怪自己怪环境。

img1

从大四摸鱼到硕士入学,我逐渐意识到按现有的条件想做顶会工作是非常困难的,而且到研三如果想找工作的话能否实习也得打上大大的问号,找一个好的research intern对自己来说是两全其美的选择。利用研一课程的掩护,我开始了学校科技园两头跑的生活。我实习的组是商汤研究院下面做AI Data的team,在各种model方法排列组合霸榜各大顶会的时候,也算是提前开始接触了data-centric AI,做的方向主要是pixel-level的半自动/自动数据标注业务,半工程半研究,比较适合我的技能树。在商汤的一年半时光极大地提高了我各方面的能力,我有时自嘲自己的硕士是在商汤读的,从学会各种效率工具、学会team work到学会如何高效快速阅读paper、做paper reading想idea,跟几位mentor和同侪实习生交流中,学到了一些从工程和从发paper角度出发思考问题的方式,王斌跟我说的一个观点对我影响颇深:“如果idea是合理且符合直觉的,就没有做不work的道理,一定会是中间某个环节出了问题,不要怀疑自己的想法,反复推倒重来。”

img1

这段商汤研究生生涯印象最深的几个片段:完全模块化拆解顶会论文的代码,一行一行对齐,找到了花里胡哨包装之下真正work的module;不断地解决hard case,优化模型效率,上线之后平均提高了60%的分割标注效率;iccv和cvpr ddl前疯狂赶due的日日夜夜,特别是cvpr的matting论文在试错了很多idea后,最终coding+写paper总共两周完成,得到Adobe同行的较高评价“The paper tackles the interactive matting problem, which isn’t thoroughly researched. I don’t know of other papers trying to tackles these problems like this. The method is nice and makes sense. It is not too complex but it nicely addresses the problems the paper is looking to solve.“;还有和商汤各个业务部门对接实际需求,从0到1和开发同学一起上线了alpha版的3D det半自动标注工具……有趣的事情还许多,在这个扁平化团队里,大家都是包含着技术热情,一起吃饭散步讨论怎么把效果做得更好,这样的时间回忆起来仍然是让人兴奋的。今日火热的LLM及CV大模型,让data的重要程度优于网络结构设计,OpenDataLab团队工作的重要意义越来越大,真的十分开心大家在做着一些可能改变国内科技前沿的事。回顾起来让我遗憾的事情也有不少:花了大把时间做出了应用效果很好的模型,但苦于不会包装不善写作,顶会顶刊的投稿总是borderline,related的审稿人给出较高的评价,而更多的是完全不相关领域的reject意见;没能把3D det模型的to do完全实现,没能把一些确定会work的idea做到matting模型上;最大的遗憾,是我被迫要双线作战导致的效率损失,研一时常常每天忙到一两点,放弃了许多校园生活,然而多花时间却并不能弥补无法full time带来的效率问题,我常想如果我能有那么几个月时间focus在一个问题上,我坚信我可以解决得更好,这样的过程对于我来说也是非常享受的,然而现实是大把时间花在了处理学校事务和无意义的内耗上。

有时非常羡慕那些选择读博并去了优秀团队的本科同学,有踏踏实实钻研一门学问的条件,对我而言却是可触不可及的事,而这样的机会曾经也摆在我的面前。不过看着身边AP们亚历山大的考核,和在强组读Phd的好友的时常交流,我意识到我这种浮躁的性格难以熬过博士毕业后到教职稳定的煎熬过程,我更喜欢的还是做有实际价值,有着正向反馈的事,硕士毕业工作对我而言也算是局部最优解了。之前的主要精力关注在AI的data层,而之后的工作方向是AI的infer & deploy层,想起来还挺有趣,我正好跳过了热度最高的model方法层。在22年经历了一段艰难的秋招时光,差不多一年时间没有去认真follow前沿的工作,每日刷arxiv的习惯也被刷leetcode代替,恰好这一年AIGC大爆炸,让我一下子仿佛回到了石器时代,未来的这段时间,需要抓紧追上,希望自己能在新的方向上做出一些有用的东西,正文的最后,依然放上一段毕业论文的致谢作为结尾:

最后的最后,回想我三年前写下的“希望我能保持着‘同济天下’的情怀,演奏好科研这篇‘乐章‘ ”,虽然我遗憾没有做出特别出彩的工作,但还是希望我一直能保 持一颗赤子之心,踏实做事,踏实做人,但行好事,莫问前程。