《晚点 LatePost》了解到,近期又有多名来自互联网公司的技术业务负责人离职,参与大模型相关创业。
其中包括阿里巴巴淘系技术部的贾荣飞,与某公司 AI 平台部负责人。据了解,前者将做 3D 技术相关的应用层创业;后者则将做通用大模型。
贾荣飞在离职前任职于阿里巴巴,他在淘系技术部担任商品 3D 重建及 AI 设计算法负责人,协助搭建了业内首个基于神经辐射场(NeRF)技术、通过二维图像实现商品 3D 建模的工具 ObjectDrawer。
在加入阿里以前,贾荣飞在搜狗最高升任至广告算法总监,任内参与了搜狗视频搜索、网页搜索、个性化新闻、精准展示广告等产品的建设。
另一位是某平台原 AI 平台部负责人,他曾牵头设计、建造并优化某互联网公司的 AI 算力系统。
根据公开资料,他 2014 年博士毕业于中国科学院大学,随后加入百度研究院,作为技术负责人开发 Minwa 超级计算机项目。一年后他入职商汤科技,任数据与计算平台部执行研究总监,负责搭建大规模高性能 AI 计算平台和深度学习训练框架。在商汤科技任职期间,他还花了两年时间在香港中文大学攻读博士后,所发论文涉及分布式计算、机器学习与算法优化。
目前参与大模型创业基本有两类选择,一种是从零开始自研模型,这意味着需要花费大量的成本采购算力、清洗数据、设计模型框架。另一种是基于已有大模型做微调,用更加专有的数据与行业认知做出垂类应用。前者对于资源整合能力的要求更高,也是国内互联网大厂的竞争主场,相比之下,后者则更适合初创公司尝试。
在去年 9 月的一次对谈中,OpenAI CEO Sam Altman 称自己对初创公司训练模型的能力持怀疑态度,但认为他们可以在链接基础模型和行业需求之间发挥巨大价值。“他们所做的 1% 训练,对于应用来说至关重要”,能做好这一点的初创公司将能利用飞轮效应,获得更多的用户数据不断精进,进而拉开和竞争对手的差距。(文丨孙海宁 编辑丨高洪浩)