mt logoMyToken
ETH Gas15 Gwei ($0.93)
简体中文

Robot Ventures 合伙人:AI 代理时代,图灵测试过时了

作者:Maddie P,Robot Ventures 合伙人

编译:胡韬,ChainCatcher

 

别再看论文了。前沿领域已经发展到新的阶段,而你还在像刷新前任的 Instagram 一样刷新 arXiv。

我知道,因为我也做过同样的事。整整六个月,我痴迷于各种模型发布。每个基准测试都收藏了。GPT-4.5 预览版什么的?我都读。你知道我学到了什么吗?什么也没学到。你知道我得到了什么吗?比什么都没有还少。我为犯错付出了代价。

与此同时,一个小孩用一个三个月前的模型和一个 Stripe API 密钥赚到的收入,比我“最前沿的实现”赚的都多……甚至比我所有作品加起来都多。不是因为他的 AI 更聪明,而是因为他的 AI 能直接接触到金钱。

我认识的每一位人工智能研究人员现在都面临着同样的噩梦:他们花了五年时间打造了上帝,结果却发现上帝需要信用卡和苹果公司的许可才能存在。

模型大战已经结束。不是因为有人赢了,而是因为输赢不再重要了。

2023年,GPT-4 的价格是每百万个 Token 是 30 美元。而如今,Gemini Flash Lite 的价格仅为 0.08 美元。短短18个月内,价格就从奢侈品级别跌至比一杯晨间咖啡还便宜,可谓是彻底崩盘。

性能正在趋同。随便挑一个基准测试:ARC、MMLU 式考试、GPQA 式硬性测试、代码评估,结果都一样。前沿技术在不断进步,但顶级机型之间的差距相对于实际生产环境而言正在缩小。这看起来就像 2015 年的智能手机市场。所有产品都使用相同的芯片、相同的屏幕、相同的摄像头。唯一的真正区别在于谁能获得运营商的授权。

模型会不断变得更智能,但智能商品化的速度远远超过了权限开放的速度。人工智能能做什么和被允许做什么之间的差距越来越大,而这其中蕴藏着巨大的利益。

坟场里躺满了拥有完美人工智能却没有任何授权的公司。

我亲眼目睹了一家转录初创公司倒闭,它的准确率甚至超过了人工速记员。倒闭的原因并非技术失败,而是无法将用户转化为收入。产品很棒,但缺乏支付渠道,就此告别。

另一个团队开发了一款真正能赚钱的 AI 交易员,但却被所有应用商店拒绝了。自主金融活动令合规团队感到不安。对于无需人工监督即可转移资金的 AI,目前还没有明确的审批选项。

这就是真正让你吃尽苦头的两难困境。即使客户愿意付费,他们也会精打细算。既然可以等六个月,下一代产品就能免费提供同样的功能,为什么还要买一台超级计算机呢?这简直就是上世纪80年代英特尔的惯用伎俩。你的客户不仅仅是被权限限制所阻碍;他们还在等着你退出市场。商品化正在从底层蚕食你的定价权,而权限层又在从上而下地压榨你。

这两种压力叠加在一起。你无法收取足够的费用来维持生存,因为下一季度的模式会更便宜。你无法快速整合支付系统,因为合规流程的推进速度取决于人的速度。你同时受到来自两个方向的挤压。最终的赢家只有那些拥有铁路的人。无论你收费高低,无论你这季度还是下季度发货,他们都能收取通行费。他们总是能拿到钱。

企业并非死于糟糕的人工智能,而是死于被困的优秀人工智能。一方面是权限限制,另一方面是商品化压力。这种夹击才是制约企业发展的策略。

现代人工智能的价值创造在于权限的积累。这并非因为模型本身不够好,而是因为自主权受到限制。

想想自动驾驶汽车。我们有令人印象深刻的演示,但大多数系统仍然只是驾驶辅助。人仍然参与其中,责任被外包,而现实世界充满了各种极端情况。人工智能也处于同样的阶段。我们在认知方面达到了 L2 级自主,但在经济方面还没有达到 L5 级自主。

一级权限(访问): 能否调用 API?→ OpenAI = 思考权限;
二级权限(合规): 能否存储用户数据?→ AWS = 记忆权限;
三级权限(收入): 能否处理支付?→ Stripe = 向用户收费权限;
四级权限(分发): 能否触达用户?→ App Store = 发布权限;
五级权限(资金): 系统能否获得信用、保证金和结算担保?= 经济行为权限。

大多数人工智能公司都停留在第三或第四层级。它们可以出售订阅服务,但无法实现财务自给自足。这就是为什么用户转化率会急剧下降。每增加一层权限都相当于一个收费站,而收费站会不断累积。即使你拥有一个卓越的模型,仍然无法实现经济上的自主。

这才是真正的关键所在:我们缺少的不是智能,而是经济自主性。除非主体能够在既定约束条件下借贷、结算和偿还,否则人工智能的繁荣发展就只会演变成财富从应用开发者转移到赋予其生存权限的授权层。

这里有个实验:你的智能体智商180,可以访问浏览器和命令行界面,还能调用任何API。但它没有钱,也不能借钱。它能建造什么呢?

没有什么。

就像一个才华横溢的员工,却连域名都报销不了;就像一个能制定整个商业计划,却连12美元的服务器托管费都付不起的交易员;就像一个发现了完美套利机会,却无法出手交易的交易员;就像一辆F1赛车,却身处一个没有道路的世界。

为什么不直接给它一张公司信用卡呢?

信用卡的前提是你这个人已经存在。你需要社保号码、银行账户和三年信用记录。你的代理程序什么都没有。它只有一个API密钥。

即使你能给它一张卡,那也好比给一级方程式赛车手一辆自行车。没错,它能动,但它的用途不对。信用卡会限制你承担风险。它们有每日限额、欺诈警报和人工审核。经纪人可能需要一百万美元才能在三十秒内完成完美的套利。你试试跟 Visa 欺诈部门解释一下。而且信用卡的设计是基于可预测的风险。它们假设你的消费遵循一定的模式:食品杂货、汽油、偶尔的度假。承销商可以建立这种分布模型。经纪人的工作方式不同。他们需要承担无法预先预测的风险。智能系统的意义就在于发现你意想不到的机会。你不可能预先批准尚未发现的商机的信用额度。

但真正的问题远不止于此。信用卡是给员工购买办公用品用的,而经纪人不是员工。他们需要用未来的收入作抵押进行贷款,利用锁定的仓位,并根据市场机会灵活调整信贷规模。他们需要的是能够跟上他们思维速度的资金。

我们给了代理商各种工具:浏览器、终端、API。是不是感觉像是胜利在望?但事实上,任何重要的经济活动都需要资金;而基础设施却并不存在,因为金融体系最初是为人类设计的。营业时间、各种表格、总有人要背锅,还有合规部门的布拉德中午12点到下午2点都在吃午饭。

代理商需要能够以机器速度运转、无需人工审批且能承担不可预测风险的资金。这种基础设施目前在哪里已经存在?

链上。

这并非 Crypto 的炒作,而是架构上的现实。传统金融从设计之初就包含人为因素。这并非漏洞,而是其商业模式的本质。每一次审批、每一次审核、每一次合规审查,都意味着某人的工作、某人的薪水、某人的午休时间。这种摩擦本身就是产品。

Crypto 将人为因素排除在外。这并非出于理念,而是出于技术限制。智能合约要么执行,要么不执行。无需监管人员检查,也无需联系反欺诈部门。代码在凌晨3点和下午3点运行的方式完全相同。

更重要的是,链上抵押解决了承销难题。你无需依赖个人的信用记录或就业证明进行放贷,而是依赖数学。抵押品可验证、流动性强,且无需信任。持有质押 ETH 的代理人无需向 Brad 证明其价值。ETH 已锁定,可通过程序访问。贷款的发放、使用和偿还均可通过单一原子交易完成。

这就是关键所在。并非因为 Crypto 很酷(虽然它确实很酷),而是因为加密货币是唯一一种允许交易者无需事先获得许可即可承担金融风险的基础设施。交易者可以利用锁定头寸进行借贷,在毫秒内完成交易,并且无需中介即可结算。基础设施已经存在,只是尚未针对这种应用场景进行优化……直到 Sprinter 的出现。

去年我尝试用质押以太坊ETH)进行借贷,并把这件事告诉了 Michael Cieri。三周后,我与 Traditional Finance Inc. 的 Brad 进行了第四次电话会议。

Brad 想知道我的投资目标。Brad 需要我的工作证明。Brad 担心加密货币的波动性。Brad 去吃午饭了。

我的以太坊就放在那里。不可篡改。可验证。持续产生收益。而我正听着舒缓的爵士乐,Brad 则在“向他的主管确认”。

那时我才明白:整个信贷系统都是 Brad 一手策划的。成百上千个 Brad ,在彼此之间传递文件,收取 Brad 的时间费用。

Sprinter 删除了 Brad。

Sprinter 是一款可编程的信用引擎。您可以使用链上可验证的抵押品借入可消费的稳定币,而无需出售抵押品。信用额度使用受限:资金不会直接进入免费钱包,只能通过授权路由使用,并且还款会优先扣除。我们首先推出面向消费者的信用卡作为分发渠道,然后发布 SDK,以便应用程序和代理商可以在严格的限制条件下申请短期信用额度。信用额度以 API 的形式提供。基于规则的承保机制。无需 Brad 参与。

不仅限于人类。人类只是开始。我们也在为机器构建系统,这些机器需要在凌晨三点借贷以在价格飙升前租用计算资源。我们也在为需要以锁定头寸为抵押进行借贷以执行30秒套利的代理构建系统。我们还在为需要毫秒级贷款而非工作日贷款的协议构建系统。

其他公司都在利用人工智能为人类开发产品。而我们则是在用资金为人类和人工智能开发产品。

这种差异听起来很细微,但其影响却会重塑经济格局。

政策就是终结开关。一封监管函,就足以毁掉一切。我亲眼目睹三个完美的团队在48小时内土崩瓦解,只因为华盛顿的某个人发现了他们的使用场景。

结算过程变成了政治问题。你会看到两种经济体系:一种是顺从的美元在银行缓慢流通,另一种是可编程的美元以光速流动。两者之间的差距并非偶然,而是一个完整的产业。

稳定币赎回就像是用户体验更好的银行挤兑。整个人工智能经济的平衡都建立在稳定币保持稳定的基础上。一旦(而不是如果)稳定币出现波动,整个经济体系都会受到影响。当然,我们不妨假装风险是“区块链吞吐量”。

有人会利用三年前的模型打造一家价值十亿美元的公司。这并非因为这些模型本身有多好,而是因为他们找到了如何利用未经筛选的资金进行经过深思熟虑的、明智的风险投资的方法。

稳定币与堕落性脱钩。交易量从衍生品转向实际交易。交易者之间为计算、数据和推理付费。

一个大国恐慌起来。“未经授权的自主经济活动。” 这将成为头条新闻。市场暴跌。我会吃爆米花看热闹。

公司估值倍数往往基于 API 访问权限,而非人工智能质量。银行关系比模型参数更有价值。

“两美元”经济时代已然来临。传统美元以人类的速度在银行流通,而可编程美元则在链上即时结算。二者之间的套利成为真正的博弈。

如果这一切都没有发生,那我之前的所有判断就都错了。

但我没说错。证据就在这里。推理成本下降了99%。所有模型都在趋向相同的基准。那些拥有完美人工智能却无需授权的公司都倒闭了。布拉德仍然每天中午12点到下午2点吃午饭。

或许 GPT-7 非常智能,权限问题根本无关紧要。或许 Brad 会学会使用电子邮件。

但可能不会。

情报商品化的速度远超权限的普及速度。分发渠道依然受限。权限依然珍贵。

人人都在玩的AI投资游戏结束了。不是因为游戏失败,而是因为它太过成功,以至于变得毫无价值。投资最智能的模型,构建最佳的RAG(红黄绿蓝绿)模型,优化推理,这些都无关紧要。

新游戏规则是权限积累、控制面和经济轨道。

获胜者不会拥有最好的人工智能,而是拥有能够运用已知信息做事情的人工智能。

这并非悲观。互联网、移动和云计算的发展模式都是一样的。技术商品化,而铁路系统则能创造价值。

图灵测试提出的问题是:机器能否让我们相信它是人类?

我们应该问的是:机器能否与 Brad 进行交易并赢走他所有的钱?

第一个问题的答案是肯定的。

第二个问题的答案正是你的人工智能创业公司即将失败的原因。

庄家永远是赢家。而庄家就是 Brad,他坐在合规部门,吃着一份乏味的办公桌沙拉,正准备拒绝你的API请求。

未来并非人人平等。它还滞留在布拉德的收件箱里。

免责声明:本文版权归原作者所有,不代表MyToken(www.mytokencap.com)观点和立场;如有关于内容、版权等问题,请与我们联系。