安安在大二结束时,已经系统掌握了AI算法、系统部署和芯片架构三个层面的关键技术。她主修计算机科学,辅修电子工程,在AI系统方向有较明确的目标。她的学习轨迹从算法出发,逐步延伸到模型框架、系统平台,最终进入硬件部署层。
也就是说,安安已经把人工智能的关键知识学得比较系统:从写算法、搭建模型,到在硬件上实际跑起来,她都能独立完成。她学的是计算机专业,又辅修电子工程,所以她的目标方向很明确——做AI系统,然后看看能不能蹭一下架构。
在算法层面,她不只是会用现成工具,而是能自己写出并改进各种主流神经网络(像卷积神经网络、循环网络、Transformer等)。她做过很多实战项目:比如用机器学习预测金融数据,用强化学习模拟交易环境,还搭建过推荐系统。
在工具层面,她熟练使用常见的深度学习框架(PyTorch、TensorFlow/Keras),并能把模型转换成适合不同平台运行的格式(比如ONNX、TensorRT)。她甚至写过一个小型的训练框架,理解底层运作原理。
在系统部署上,她会把训练好的AI模型放到云端或者边缘设备上运行,懂容器化(Docker)、远程调度、模型热更新等关键技术,能做一整套从训练到部署的流程。
在硬件方向,她能在实验芯片和FPGA上部署轻量化的神经网络,还懂硬件电路语言(Verilog)。她调过数据通路、分析过延迟,做过嵌入式系统开发(比如在STM32上),理解软件和硬件之间如何交互。她还接触过国产AI芯片的优化测试,能看懂底层通信协议文档,知道芯片运行中的瓶颈在哪里。
在大二暑假开始前,安安原本的计划是继续打磨她那个在国产RISC-V平台上部署的轻量级图像识别系统,看看有没有可能让它跑到某种实际物联网应用上。其实就是,她原计划继续改进自己做的一个小型图像识别系统,想看看能否真正跑到物联网设备上。
因为Brady的推荐,她破格能够参与淞沪J大的暑研。她收到了录取通知。邮件来自实验室的副主任,是某位国内架构设计领域的大牛教授的主导项目。他们在构建一个“端到端、软硬协同优化的嵌入式AI推理系统原型平台”,整个暑研面向的并不是课程学习,而是真正面向科研进度的工程试验环境。
安安被编入一个小型学生小组,负责的子任务是:将实验室上游模型架构组训练出的AI模型,量化并部署到一个指定的嵌入式设备上,并做关键路径的推理性能优化。
实验室其他的大佬,科研届学术之明日之星博士博士后师兄师姐,和大牛教授们负责训练AI算法,优化架构,调试新实验。安安得到了旁观和旁听的许可。
在暑研初期,安安本来只是按部就班地做些预处理、图转换、模型压缩。
忙归忙,除了参与科研,上下课路上眼睛东看看西看看,也还能忙里偷闲5G冲浪一下。
但很快,加上她的努力争取,积极请教,导师看过她早期提交的边缘模块技术笔记之后,专门找她谈话。
于是,安安不再只是调个TensorRT参数、跑跑模型,而是开始协助架构组处理一些仿真角度的建模与评估任务。模型结构设计一旦敲定,她的任务是把它映射到实际资源约束下的部署方案,考虑算力分配、精度丢失边界、buffer复用策略,然后配合测试组,在真实板子上做量化方案的角落测试(corner case simulation)。
在此之前,她只知道什么叫8-bit量化,知道怎么把float32变成int8,知道怎么用ONNX加个简化器。但现在,她开始理解了:为什么要量化、在哪些路径上必须保留精度、量化后图结构怎样影响访存、访存如何约束算子调度。
有一次,她的测试脚本甚至暴露出一个架构组没考虑到的带宽分布不均的问题,之后成为调整算子映射策略的一个依据。
她开始频繁地旁听架构组与教授的设计评审会议。虽然她没有资格发言,但能听。
她看着上游博士和博士后在讨论稀疏卷积的memory pattern如何绑定DRAM的页分布策略,看着他们用手画cache hit/miss模拟图,看他们争论某段路径是否应该复用片上SRAM还是外部RAM buffer,看他们对齐NUMA结构下多核算子调度的一致性策略。
起初她完全听不懂,但她开始记、查、问。
到了暑研的中后期,安安已经能把实验室给的实验模型——一个简化版的MobileBERT——拆开成好几个小部分,逐段测试它们在硬件上的运行情况。她会根据板子的性能限制,估算不同场景下每个模块大概需要多少时间,并把这些结果做成图表,反馈给设计组,帮助他们决定下一轮怎么“削减”模型,让它更高效。
这些工作不算抢眼,但对整个实验室的研究流程来说却很关键,就像是闭环里必不可少的一环。
最终,项目最终顺利收尾,实验室发布了一个演示视频,模型成功在目标平台上跑了起来。安安负责的部分被整合进最终系统,还被整理成一个可重复使用的模块,成为实验室的长期成果。
——————————————————————————————————————
夜深的淞沪半岛酒店。
从实验室赶回来时,已是凌晨一点。安安肩上背的电脑包,因为几天没整理,压得肩膀都酸。推开房门,扑面而来的是酒店套房一贯的气味:冷冽的中央空调,混合着木质地板与清洁剂残留的清香,窗外黄浦江灯火映在玻璃上,像一条暗金色的河。
这是Brady常包的套房,安安因为暑研,临时借住。她明白,这地方本不属于她,但眼下,它是她的避风港。
把书包重重放下,她几乎没坐多久,就又打开电脑,把实验室的算法日志上传完毕。凌晨两点,窗外的游船鸣笛声传来,提醒着这座城市依旧醒着。安安却没有时间浪费。
——托福,GRE。
她点开了TPO软件,戴上耳机,开始今天的训练。
屏幕上一行行阅读题目的长难句像砖头一样砸下来。她盯着:“Although the prevailing paradigm…”,心里清楚这就是她的短板。理科的她,面对公式、代码能一口气解完,可在英文的逻辑长句前,却经常卡住。
她不允许自己再拖延。她一字一句拆分,把从句画出来,主谓宾标出来,再在笔记本上写下关键词。纸张一摞摞翻过去,笔芯磨得快断。她英语底子不好,就用笨办法。
三点,阅读两篇做完。她揉揉太阳穴,又立刻切到听力。
酒店安静得出奇,只有冰箱运转的低鸣。她闭着眼,跟着录音一句句跟读:“The astronomer observed that…” 声音轻却坚定,她甚至自己录下来,反复听,直到发音不卡。
手机旁边放着一张纸条,上面密密麻麻写着天文、生物、心理学的词汇。她一边背,一边在本子上画小图:太阳黑子、神经元、弗洛伊德的人格三层理论。她要记住它们,不是死记,而是带着画面。
四点,她开始口语。定时器一响,她深吸气,假装自己正在考场。
“Ok, I believe that… because first…” 她语速比平时快,眼睛盯着镜子里的自己,强迫自己吐字清晰。说完一题,立刻回放,批判自己:“这里吞音了,这里逻辑不够。”再来一遍。
她知道,只有不停重复,才能把弱点磨平。
五点,最后一项——写作。她规定自己:三十分钟写一篇。屏幕上闪烁着空白的Word文档,她敲下第一句:“In contemporary society…” 指尖颤抖,但很快,逻辑架构在脑海中排好——观点、理由、让步、总结。她想象自己在和考官争论,语气渐渐坚定。
写完已是五点半,东方天边已经泛白。她把文件保存,关上电脑。整个人仿佛被抽干,可嘴角还是勾了勾。
今天,又比昨天更接近目标了一步。
安安蜷在沙发上,抱着厚厚的词汇书,困意汹涌而来。可她仍然在昏睡前小声对自己说:
“GRE Verbal,我一定要拿下。”
窗外,黄浦江的水波反射出第一缕晨光,照进这间套房。没有人看到,一个小镇来的女孩,正用最笨拙却最执着的方式,把自己往顶尖世界推。
第二天下午,淞沪J大实验楼的会议室。
空调出风口“咔哒”一声卡住了,屋子里热气蒸腾。安安坐在最角落,屏幕上滚动的是昨天量化部署的测试曲线。她盯着曲线上某个突然下滑的点,眼睛涩得厉害。昨夜在半岛酒店,她只睡了不到三小时。
身边的暑研项目的研究生师兄注意到了。那人盯着她一会儿,低声说:
“你昨晚是不是又熬夜了?黑眼圈都快盖不住了。调bug是没完的事,小心撑不住。”
安安抿了抿唇,没说话,手里的笔还在图纸上画算子分布。
“我知道你想表现。”师兄叹口气,“可这里不是高考,暑假的科研没必要拼命到这个程度。”
安安终于抬头,眼神里有一丝固执的光。她没打算告诉前辈自己在备考出国,但她还是笑笑:
“可这是我唯一的机会。”
暑研的师兄愣了一下,本想再说什么,但看到她眼里那股倔劲,终究只是摇了摇头。
接下来的几个小时,她像没事人一样继续写脚本,调量化参数,把小组的推理延迟模拟跑完。可谁都没看见,等实验散场后,她一个人走在红砖小路上,手指因为长期握笔和敲键盘而微微颤抖。
她回的晚。回到半岛酒店的套房,她几乎没有犹豫,就重新打开了TPO,继续啃阅读长难句。——她心里有一道线,别人或许不知道,但她很清楚:科研和考试,她两样都不能输。
夜色笼罩了黄浦江,半岛酒店的落地窗外,江水上点点灯光浮动。套房的书桌上,安安把实验室的日志本往角落一推,换上耳机,屏幕切到托福TPO的听力练习。索性房间大,电话叫工作人员来铺夜床只是有些歉意,耽误打扰不到她什么。
凌晨一点半,铺夜床的工作人员开门退出去时,酒店走廊偶尔传来低声的脚步声,有人玩得尽兴回来了,而她桌前的小台灯还亮着。
她反复播放一段学术讲座录音:教授在用一口清晰却语速飞快的美音讲地质学岩层沉积与化石碳年代测定。第一次,她只听懂零碎的单词:“sediment… isotope… radioactive decay…”。第二遍,她盯着屏幕上打出的转写文本,用笔一行一行跟着划重点。第三遍,她逼着自己不看文字,做笔记——箭头、缩写、乱七八糟的符号挤满了A4纸。
等到计时器跳到 1:58:00,她揉了揉发酸的手腕,眼睛却没有丝毫松懈。这是她给自己设定的铁律:每晚两套听力,不管科研任务压到多重,也绝不打折。
短暂休息后,她把厚重的《GRE核心填空3000题》摊开。纸页边角已经被翻得卷起,许多单词旁写满了她自己编的小例句。
obfuscate:使模糊、使混乱 ——她在旁边写下:“科研里的 log 太复杂,常常 obfuscate 真正的问题。”
pellucid:清晰的、透明的 ——她写:“我要的写作,是 pellucid 的逻辑。”
她知道这些单词不是死记就能过关,于是把它们和自己经历的科研场景绑在一起。
GRE阅读部分,她设定自己在 8 分钟内读完一篇长文,然后立刻做题。文章讲 18世纪英国农田改革与社会分层,论点抽象、句子拗口。她一边圈出转折词“however”“although”,一边快速写下逻辑箭头。做题时,她手心都微微冒汗。错了两道,她咬紧嘴唇,把那一页撕下来,重写一遍逻辑链。
凌晨三点,安安的桌上摊着两杯冰掉的美式,纸屑、便签、耳机线缠在一起。窗外的江风拍打玻璃,而她笔尖依旧在划。
她给自己留了四小时睡眠,定好闹钟。爬上床前,喉咙沙哑,却还是小声重复那几个刚背下的生词:
“ephemeral… magnanimous… laconic…”
像是对抗困意的咒语。
Brady给她的住宿环境已经很好了,如果她再不知好歹贪图享乐不好好学习,那真的该死。
学吧,只要学不死,就往死里学,没办法,谁叫她底子薄弱呢?
只盼功夫不负有心人,愿事事如意。
特别鸣谢清华和北理毕业的朋友提供暑研内容参考。
作者有话说
显示所有文的作话
第86章 第 86 章