一觉醒来“炸开锅”了… 两位中国顶尖Al科学家朱邦华和焦剑涛远走美国,被英伟达“

烟雨故人归期 2025-07-19 23:43:20

一觉醒来“炸开锅”了… 两位中国顶尖Al科学家朱邦华和焦剑涛远走美国,被英伟达“挖墙脚”挖走了。 先说这两位科学家的来头,朱邦华本科毕业于清华电子系,在加州大学伯克利分校拿到博士学位,主攻大模型架构优化和多模态AI芯片设计。 他开发的Starling-7B模型在Chatbot Arena评测里,把同规模的Mistral模型打得落花流水,还联合创建了行业权威的LLM评测平台LMArena。 焦剑涛更厉害,2011年清华特等奖学金得主,斯坦福大学电子工程博士,研究方向是信息论。 2023年他俩合伙创办的生成式AI公司Nexusflow,用开源模型NexusRaven-V2在函数调用任务上超过了GPT-4,被HuggingFace的CEO公开点赞。 这两位一个是技术落地的实战派,一个是理论创新的先锋军,在AI领域那是实打实的“黄金搭档”。 他们加入的英伟达Star Nemotron团队,正在开发企业级智能体。 智能体就是能理解人类指令、自主调用工具完成复杂任务的AI系统,朱邦华负责的模型后训练和智能体开发,能让AI更精准地执行企业级任务;焦剑涛研究的多模态推理,能让AI同时处理文字、图像、语音等多种信息。 这两项技术要是结合到英伟达的Blackwell架构芯片上,美国在AI基础设施领域的领先优势可就更大了。 要知道,英伟达的Blackwell芯片,已经占数据中心收入的70%,正在推动AI芯片从Hopper架构向Blackwell过渡。 这两位的加盟,说不定能让美国在自动驾驶、智能制造这些关键领域提前两年突破。 再看看咱们国内的AI发展,2025年中国智能算力规模达到1037.3 EFLOPS,年增速43%,DeepSeek R1大模型开源后7天用户破亿,金融、制造等行业的AI应用渗透率超过40%。 但光鲜背后有隐忧:训练芯片国产化率不足30%,高端算力还得依赖进口;高校AI实验室的GPU数量,连Meta一个团队的零头都比不上。 就说清华大学的AI实验室,总共就几十块GPU,人家Meta一出手就是三十五万片定制芯片。 这种差距,让咱们的科研人员在训练大模型时,就像开着拖拉机跟人家的高铁赛跑。 很多人就纳闷了,为什么我们现在发展的都这么快了,还是有那么多科学家想往国外跑,难不成外国的月亮真的更圆? 看看美国企业的挖人手段就明白了,Meta从OpenAI挖人,首年薪酬最高1亿美元;挖苹果的庞若明,直接开出2亿美元总薪酬,比苹果CEO库克的薪水还高。 黄仁勋更是直言,英伟达团队里6名核心成员有4个是华人,他就是认准了中国科学家的实力。 这种“真金白银”的诱惑,加上美国高校和企业掌握的顶尖科研资源,让不少人才动摇了。 就像斯坦福大学李飞飞教授说的,现在高校AI实验室的资源,连科技公司的零头都比不上,70%的AI博士毕业后都进了私企。 咱们的科研环境和美国相比,其实也有不少不足。 首先是评价体系的问题,很多高校还是“唯论文论”,一个青年学者要是两三年没发顶会论文,职称评定就悬了。 可AI研究是个“烧钱烧时间”的活儿,像朱邦华他们开发的NexusRaven-V2模型,光训练数据就用了1000亿tokens,这得十分大量的经费支持。 而且学术自由的空间也有限,DeepMind最近因为商业压力,把生成式AI论文的发表审查期延长到6个月,这种限制在国内也有苗头。 还有资源分配的问题,“东数西算”工程虽然在推进,但东部高校的算力需求,和西部数据中心的供给之间,还没完全打通经脉。 不过咱们也在积极改进,国家自然科学基金今年试点“包干制”,科研经费可以自主支配;北京、杭州等地设立了AI专项人才基金,给顶尖科学家提供“一站式”科研服务。 华为、阿里这些企业联合高校建立了开源模型社区,让中小企业也能用上大模型技术。就拿液冷技术来说,浪潮信息的液冷散热系统,把数据中心能耗降低40%,宁夏中卫的数据中心PUE降到1.15,这些硬措施正在缩小咱们和美国的差距。 但光靠政策还不够,得让科学家有实实在在的获得感。 去年某高校给引进的AI团队,开出“年薪百万+实验室自主管理权”,结果半年就出了三项专利。 这说明只要把机制搞活,人才自然愿意留下来。 咱们常说“栽下梧桐树,引得凤凰来”,可这梧桐树不光要枝繁叶茂,还得让凤凰觉得这窝搭得踏实、住得舒心。 最后我想说,人才流动是全球化的常态,但咱们不能总当“人才输出国”。 看看黄仁勋的话,他说中国科学家是“世界一流”,这既是夸奖也是警示。 咱们得把科研环境这块“土壤”养好,让更多像朱邦华、焦剑涛这样的人才,在国内就能干出世界级的成果。 毕竟真正的科技强国,从来不是靠“挖墙脚”挖出来的,而是靠自己的梧桐树招来金凤凰。

0 阅读:3
烟雨故人归期

烟雨故人归期

感谢大家关注我