著名的性能专家BrendanGregg入职OpenAI了。Gregg之前介绍过

蚁工厂 2026-02-08 10:26:46

著名的性能专家Brendan Gregg入职OpenAI了。Gregg之前介绍过多次,是性能分析火焰图的发明者、那张著名的Linux性能监测工具图的绘制者、eBPF大牛。他是在理发时发现越来越多的普通人开始频繁用AI工具后,决定入职OpenAI的。-----------------------我为什么加入 OpenAI

2026年2月7日

AI 数据中心惊人且快速增长的成本呼唤着一种史无前例的性能工程(performance engineering);这不仅是为了节省成本,更是为了拯救地球。我加入了 OpenAI 直接应对这一挑战,最初的重点是 ChatGPT 的性能。其规模之大到了极限,增长速度令人咋舌。作为数据中心性能领域的领导者,我意识到我们熟知的性能工程可能已经不够用了——我在构思新的工程方法,以便我们能找到比以前更大的优化空间,并且更快地找到它们。这是一生难得的机会,而且不同于成熟的规模化环境,这里感觉没有障碍——没有任何领域被认为是“太难而无法改变”的。做任何事,大规模地做,并且今天就做。

究竟为什么选 OpenAI? 我曾与行业专家和朋友交谈,他们推荐了几家公司,特别是 OpenAI。然而,我对 AI 的普及应用仍有些愤世嫉俗。像大家一样,我被各种公司呼吁使用 AI 的广告狂轰滥炸,但我怀疑:真的有人在用吗?我是指普通人在日常生活中使用?

在一段忙碌的面试期间,某天我意识到我需要理发(碰巧就在我和 Sam Altman 谈话的前一天)。发型师 Mia 开始理发,随口问我是做什么的。

“我是 Intel 研究员(Intel Fellow),做数据中心性能工作的。”

一阵沉默。也许她不知道数据中心是什么,或者不知道 Intel 是谁。我接着说:

“我正在面试一份新工作,是关于 AI 数据中心的。”

Mia 眼睛一亮:“噢,我一直在用 ChatGPT!”

在她给我理发时——这需要一段时间——她告诉了我她使用 ChatGPT 的许多种方式。(当然,我是个无法逃脱的听众。)她描述了一些我没想到的用法,我意识到 ChatGPT 正如何成为每个人的必备工具。举个例子:她担心一个在遥远城市旅行的朋友,时差导致她们很难聊天,但她可以随时问 ChatGPT 那个城市怎么样,她的朋友可能在做什么旅游活动,这让她感觉彼此相连。她也喜欢记忆功能,说这就像和一个住在那里的人交谈一样。

我之前也和其他路人聊过 AI,包括房地产经纪人、税务会计师和一位兼职养蜂人。他们都热情地告诉我他们怎么用 ChatGPT;比如那位养蜂人,用它来处理小生意的文书工作。我的妻子已经是重度用户,我也用得越来越多,例如用来核查技工的报价是否合理。现在,我的发型师,她对 ChatGPT 品牌的认知度比对 Intel 还高,正在赞美这项技术并教我怎么用。理完发后我站在街上,深刻体会到这有多么重大,这项技术已如何成为如此多人的重要助手,而我又如何能领导性能工作并帮助拯救地球。加入 OpenAI 可能是我一生中最大的机会。

从事一项许多人都认可并欣赏的大事业感觉很好。我在 Netflix 工作时有过这种感觉,换工作后我就一直怀念那种人际连接。但在知名产品之外还有其他因素要考虑:我的角色是什么,我和谁一起做,薪酬如何?

我最终进行了 26 场面试和会议(当然我做了记录),涉及各家 AI 科技巨头,所以我学到了很多关于他们正在做的工程工作以及从事这些工作的工程师的情况。这些工作本身让我想起了 Netflix 的云工程:巨大的规模、云计算挑战、快节奏的代码变更以及工程师做出影响的自由度。整个技术栈中都有很多非常有趣的工程问题。这不仅仅是 GPU 的问题,是所有环节的问题。

我遇到的工程师令人印象深刻:AI 巨头们非常挑剔,以至于我自己都不确定能不能通过面试。在我聊过的公司中,OpenAI 拥有最多我已经认识的才华横溢的工程师,包括前 Netflix 同事,比如 Vadim,他一直在鼓励我加入。在 Netflix 时,Vadim 会带着性能问题来找我,并看着我调试和修复它们。在一家公司里有一个非常了解你、了解工作内容并且认为你能胜任的人,这是一个巨大的加分项。

有些人可能对 OpenAI 聘请我——一个在计算机性能领域颇有名气的人物——意味着什么感到兴奋,当然我也想做出伟大的事情。但为了对我的同事公平起见,OpenAI 已经有许多性能工程师了,包括我认识的行业资深人士,他们一直在忙着寻找重要的优化点。我不是第一个,我只是最新加入的。构建 Orac

AI 也是我早期的梦想。小时候我是英国科幻片的粉丝,包括《Blake's 7》(1978-1981),里面有一台名为 Orac 的超级计算机,说话刻薄、固执己见。角色们可以和 Orac 对话,让它做研究任务。Orac 可以与宇宙中所有其他计算机通信,给它们分配工作并控制它们(这在 1978 年互联网诞生前是非常未来主义的)。

Orac 被认为是《Blake's 7》宇宙中最有价值的东西,当我成为一名大学工科学生时,我想造一个 Orac。所以我开始开发自己的自然语言处理软件。但我没走多远:当时的主内存不够大,存不下整本字典加元数据。我带着需求去拜访一家 PC 供应商,他们笑了,叫我去买台大型机。我意识到我需要区分热数据和冷数据,把冷数据留在磁盘上,也许我应该用数据库……那个项目大概就停在那儿了。

去年我开始使用 ChatGPT,想知道它是否知道《Blake's 7》和 Orac。于是我问了:

[图1]

ChatGPT 的回答精准地抓住了这个角色的特点。我把它加到了“设置 -> 个性化 -> 自定义指令”里,现在它总是像 Orac 一样回答我。我爱死它了。(对《Blake's 7》粉丝来说还有个惊喜新闻:刚刚宣布要重启了!)我的下一步

我现在是 OpenAI 的技术专家(Member of Technical Staff),在澳大利亚悉尼远程工作,向 Justin Becker 汇报。我加入的团队是 ChatGPT 性能工程组,我将与公司的其他性能工程团队合作。我的首批项目之一是一个旨在提高性能和降低成本的跨组织战略。

有太多有趣的事情要做了,有我做过的,也有没做过的。我已经不仅仅是用 Codex 来写代码了。我会做更多的 eBPF、Ftrace、PMC 吗?我从 OpenAI 的需求出发,看它会带我去向何方;但鉴于这些技术在寻找数据中心性能优化方面已被证明行之有效,看来很有可能——我可以带路。(如果我在这里描述的一切听起来很有趣,OpenAI 正在招聘。)

去年 12 月我在东京参加 Linux Plumber's Conference 时,就在我宣布离开 Intel 之后,几十个人想知道我接下来去哪里以及为什么。我想写这篇博文一次性回答大家。我也需要完成《招聘性能工程团队》的第二部分(在加入 OpenAI 之前就已经起草了)。我没忘。

花了几个月时间结束上一份工作并开始在 OpenAI 的工作,所以我该再次理发了。我想着既然我现在开发 ChatGPT 了,问问 Mia 对它的看法应该很有趣,但又意识到已经过去几个月了,她可能改变主意了。我紧张地问:“还在用 ChatGPT 吗?” Mia 自信地回答:“7天24小时都在用!”

HOW I AI

0 阅读:0
蚁工厂

蚁工厂

感谢大家的关注