硅谷AI研究员中国十日行:谦逊、开放、不谈哲学,只想训练更好的模型

Favoritecollect
Shareshare

作者: Florian Brand

编译:深潮 TechFlow

深潮导读: 这篇文章的背景是 SAIL(一个把 Substack 上顶级 AI 写手联合起来的媒体联盟,成员包括 Nathan Lambert、Sebastian Raschka、ChinaTalk 等)组织了一次中国 AI 实验室的访问团,作者 Florian 跟团去了月之暗面、小米、MiniMax、智谱、美团、阿里、蚂蚁、魔搭、零一万物、宇树等十几家公司,写了这篇观感。

Florian Brand 是德国特里尔大学(Trier University)和德国人工智能研究中心(DFKI)的博士生,研究方向是大语言模型的应用与评估。

算不上「很有名」,但在开源 AI 圈子里有一定能见度,外国 AI 从业者第一视角看中国 AI 生态也挺有意思的。

正文

过去大约 10 天,我有幸与 SAIL 的伙伴们一起拜访了中国的 AI 实验室。作为一个在六个月内首次访问中国和美国的人,我发现两地的差异令人着迷,但更令人着迷的是相似之处。

给我留下最深刻印象的是,我遇到的 AI 研究者都非常谦逊。

他们高度评价其他实验室和同行。DeepSeek 被频繁提及,可能因为我们访问前几天他们刚发布了一个模型,人们谈论 DeepSeek 的论文时带着真正的钦佩。

许多研究者彼此是亲密朋友,来自同一所大学或共享同一个家乡。他们坦诚地讨论自己的工作,研究成果几个月后会发表成论文。

这是与西方 AI 圈最大的差异之一。在美国,氛围往往更像零和游戏。实验室对定位很谨慎。研究者思考竞争,有些人对自己评价很高。领导者在泄露的备忘录中互相侮辱和攻击。这种差异可能可以用事实来解释:美国领先的实验室是闭源的,而许多中国实验室是开源的。中国实验室对字节跳动的豆包"有所忌惮",豆包是使用最多的聊天机器人,且是闭源的,领先优势很大。

与此同时,整体氛围与旧金山出奇地相似。研究者们极度在线,在 Twitter 和小红书上大量阅读,后者越来越受欢迎。他们都用 Claude Code 或自己的 CLI 来构建下一个模型。有些人在我们开会时监控训练运行,观察奖励曲线上升。他们在思考进一步扩展规模,抱怨算力不够。他们对当前基准测试的状态感到沮丧。

他们的主要关注点是训练更好的模型。这与旧金山不同,那里的研究者会思考 AI 的政治或哲学影响。他们不考虑大规模失业、永久底层阶级,或者他们的模型是否有意识。他们只想训练出色的模型。

当听说你用了他们的模型时,他们的眼睛会发光。 他们渴望在下一代模型中修复当前模型的所有缺陷。他们通宵达旦推动模型发布,之后仍然出现在办公室。

我遇到的大多数研究者都很年轻,许多人都在 20 岁出头或 25 岁左右。有些是本科生,但更常见的是在读博士,同时在业界工作。他们的共识是,相比学术界,业界现在更有趣,这个观点我非常认同,因为我做过完全相同的事。实验室非常重视这类人才获取,积极招聘实习生和研究生;这是西方实验室不做的。

研究者的乐观情绪也延伸到普通民众,他们似乎对技术以及 AI 和机器人的前景更加乐观。旅途中有人讲述他们的父母和祖父母使用豆包和 DeepSeek 做各种事情的故事,包括讨论数学定理。这与西方明显不同,那里的普通民众厌恶 AI。

总的来说,这次旅行让我对这个生态系统有了一点点了解。不可能在几天内了解如此庞大文明的文化。作为开放 AI 生态系统和开放研究的坚定支持者,我对两者的未来都非常乐观,希望未来能有大量的国际合作。

我要感谢在月之暗面、小米、MiniMax、智谱、美团、阿里巴巴、蚂蚁灵犀、魔搭、零一万物、宇树以及其他地方遇到的所有了不起的人。感谢你们的时间和热情接待。同时感谢 SAIL 组织这次行程,感谢所有参与的作家和记者。我非常感激能在如此短的时间内遇到这么多杰出而有抱负的人。

Disclaimer: This article is copyrighted by the original author and does not represent MyToken’s views and positions. If you have any questions regarding content or copyright, please contact us.(www.mytokencap.com)contact
More exciting content is available on
X(https://x.com/MyTokencap)
or join the community to learn more:MyToken-English Telegram Group
https://t.me/mytokenGroup