全球 AI Agent 支付格局
昨天阿里巴巴的 Qwen 發布會上,演示者讓 AI 點了「霸王別姬 40 杯伯牙絕弦時」,大多數觀眾看到的是便利,我看到的是金融科技變革的信號彈。這不是只有下單點外賣,這是 AI 從「資訊處理」走向「經濟行為」跨越的一步。
我們常說商業是由三條河流匯聚而成,資訊流、商品流與資金流。過去兩年,大模型已經將資訊流的效率推到了極致,但如果 AI 只能陪你聊天、寫詩,卻不能替你買一張機票或結婚紀念日訂一束花給老婆,那它始終只是一個被困在對話框裡的超級大腦。想要讓 Agent 真正落地,必須打通資金流這一步。
為什麼這一步走得如此艱難?核心矛盾在於,現有的支付體系是為「人類」設計的。
傳統支付流程假設有一個人類用戶全程在場,你打開 App,選商品,點支付,驗證身分,確認交易。每一步都是你親手操作,出了問題自己負責。但 Agent 的使用場景完全不同。試想一下,你對 Agent 說「幫我留意東京銀座五星級 Hotel 的住宿費,低於 5000 塊自動下單」,然後就去做其他事情。半夜在睡覺的時候,Agent 發現有便宜的住宿,它需要替你做決定、替你付錢。
這時候一系列棘手問題就浮出水面,Agent 怎麼證明這筆交易是你授權的?如果你醒來說沒讓它訂,誰來判定?你的支付憑證存在哪裡?Agent 能不能直接接觸你的信用卡?商家怎麼分辨下單的是一位真實的顧客,還是一個惡意軟件?
這些問題不解決,AI 商業化就是空中樓閣。在全球範圍內,幾大巨頭正沿著截然不同的路徑試圖攻克這座堡壘。
OpenAI
OpenAI 走的是一條最務實、最快可落地的路:把交易留在 ChatGPT 內,但把收款、清算、退款與合規留在商家既有的金流體系。
這場攻勢的起點是 2025 年 9 月 29 日,OpenAI 推出 ChatGPT Instant Checkout,首發讓美國用戶可在對話內直接向 Etsy 商家購買,並預告百萬級 Shopify 商家將陸續支援。
隨後的幾個月節奏極快:
10 月 6 日將結帳能力納入「Apps in ChatGPT」的大框架,宣告未來各類對話式服務都能透過標準化協議走到成交;
11 月 24 日推出 Shopping Research,把「多步搜尋—比價—取捨」做成上游漏斗,將意圖培養到可下單狀態後導向 Instant Checkout;
12 月 8 日與 Instacart 的深度整合,更是把「選品、組車、結帳」全留在聊天窗內,證明了高頻、多品項場景也能徹底跑通端到端閉環。
這套方案的技術核心不是讓 ChatGPT 觸碰卡號,而是用「委託式支付」把敏感憑證交給合規方。OpenAI 與 Stripe 共同開源了 ACP(Agentic Commerce Protocol),並在官方說明中提出了 SPT(Shared Payment Token) 機制。
簡單說,使用者在 ChatGPT 內完成支付方式選擇後,由 Stripe 發行一個可共享的 Token。在 OpenAI 的 Delegated Payment Spec 中,這類 token 具有「單次使用、可設上限金額與到期時間」等約束。OpenAI 只負責把 token 隨結帳請求轉交商家,讓 ChatGPT 能發起交易、但看不到也不持有用戶真實支付憑證。OpenAI 明確強調自己不是 Merchant of Record(名義賣家),實際的扣款、清算、退款與爭議處理仍由商家與其 PSP 承擔。這是一招極其聰明的「借力打力」。
Google
Google 展現了它作為平台霸主的野心,走的是一條「開放標準+聯盟」的宏大路線。
今年 1 月 11 日,Google 在 NRF 大會上正式發布了 Checkout in Gemini,並宣布與 Walmart 深度合作。這意味著用戶可以直接在對話中完成從選品到下單的全過程,甚至能與 Walmart 既有的購物車合併,把從「想買」到「買到」的摩擦係數降到最低。
而在這看似簡單的體驗背後,其實支撐著兩大核心協議。首先是 UCP(Universal Commerce Protocol),它是這次體驗的基石,涵蓋了從商品發現到售後的全流程。其精髓在於「邊界感」:用戶調用 Google Pay 的資訊結帳,但 Retailer 仍是名義賣家(Seller of Record),Google 僅做撮合,不碰觸交易主體的權利。
如果說 UCP 解決了「怎麼買」,那麼早前推出的 AP2(Agent Payments Protocol) 則解決了「誰允許買」。這套協議引入了 Mandates 機制——一種加密簽名、可稽核的授權合約,將「Agent 被允許做什麼」轉化為可驗證的證據鏈。這套標準背後站著一個豪華的「聯盟」,包括 Adyen、American Express、Coinbase、Mastercard、PayPal 在內的 60 多家組織共同推進。Google 的策略很明確:不追求單一平台鎖定,而是要做 AI 時代的基礎設施提供者。
Anthropic
相較於 OpenAI、Google 把「站內結帳」做成原生產品,Anthropic 的定位更像基礎設施派:Claude 本身沒有公開推出內建的支付功能,而是把「付款」視為一種高風險、需嚴格控權的工具能力。
Anthropic 主推的 MCP(Model Context Protocol)解決的是「Agent 如何以標準方式安全地呼叫外部工具」——不由 Claude 完成支付,而是 Claude 透過 MCP 去調用 Stripe、PayPal 或企業內部財務系統,完成建立付款流程、查詢交易狀態等動作;多數情境下仍會回到支付方或商家的既有結帳頁做最後確認。
更值得注意的是,Anthropic 在 2025 年底把 MCP 捐給 Linux Foundation 旗下的 Agentic AI Foundation(AAIF)。這個動作釋放的訊號很強,MCP 不再只是某家模型公司的「插件接口」,而是被放進中立的非營利治理框架中,承諾以開放、社群驅動方式演進。對支付與企業系統而言,這等同於降低「被單一供應商鎖定」的疑慮——商家與支付處理商可以更放心地把 MCP 當作長期投入的標準化接入層,讓 agent payment 以工具化、可控權、可審計的方式逐步規模化。
這三家巨頭的選擇,折射出截然不同的野心與路徑:
OpenAI 走的是「產品閉環先行」:把結帳直接做進 ChatGPT,以 Instant Checkout 配合 ACP(與 Stripe 共建)先搶佔對話式交易的入口,再逐步向外擴展生態。
Google 走的是「平台+標準」:試圖用 UCP 和 AP2 將商務交互與支付授權標準化,以此降低接入摩擦、拉攏盟友,同時確保成交依然發生在 Search 和 Gemini 的流量主場上。
Anthropic 則更像是在做「工具層基礎設施」:他們將支付視為可控工具能力的一部分,主攻 MCP 的連接與安全邊界,並透過將協議捐贈給 Linux Foundation AAIF 來釋放「協議中立開放」的長期承諾,短期內並未將站內支付產品化作為主戰場。
中國
雖然阿里巴巴沒有明說,但這次接入的支付底層能力正是 Alipay 支付寶提供的 ACT 協議(智能體商業信任協議)。
中國 AI 支付的賽道並非只有支付寶一家。微信支付的 MCP 版本在去年 7 月就已上線體驗版,京東有「AI 購」在內測,美團的「小美」也已公測。但在協議的系統性與完整度上,阿里巴巴支付寶的 ACT 確實走得更遠。為了將 AI 支付的黑盒打開,ACT 協議將架構拆解為四個核心領域,每一域都對應解決一個關鍵難題。
ACT 協議
首先是「委託授權域」,解決的是「怎麼聽懂人話」的問題。人類的指令往往是模糊的,比如「幫我買張 100 塊左右的椅子」,但支付必須精確。ACT 定義了一套極其詳細的結構化表達,包含 30 多個字段:「品類約束、單筆金額上限、日累計上限、什麼支付工具、價格容限(比如 100塊左右到底是多少)、甚至包括超限時是自動取消還是暫停通知」。有了這些,那句模糊的指令就被解析成了帶有數位簽名的嚴格契約,後續的糾紛追溯便有據可依。
其次是「商業交互域」,解決的是 Agent 與商家系統的對話。這裡有一個非常生動的例子:當你讓 Agent「幫爸媽買台掃地機器人」時,Agent 傳給電商平台的不應只是「掃地機器人」這幾個字。ACT 協議能確保「爸媽」這個詞背後隱含的「老人適用」、「防纏繞」、「高溫殺菌」等隱式意圖和用戶偏好被結構化地傳遞過去,讓平台能像老練的導購一樣進行精準推薦。
第三是「支付服務域」,核心思路是隔離。ACT 的設計原則是不讓 Agent 碰觸敏感資訊。用戶的帳戶會生成一個 Token,這個 Token 有著嚴格的使用範圍限制:只能在特定商戶、特定時間窗口內使用。對於 Agent 來說,它拿到的是一把一次性的鑰匙,用完即廢,徹底隔絕了安全隱患。這是一種在現有支付體系上做最小改動的務實思路。
最後是「信任服務域」,這是 ACT 最獨特、也是歐美協議比較欠缺的一塊。網路上環境複雜,羊毛黨和惡意爬蟲軟件到處都是。商家怎麼區分下單的是正常的購物 Agent 還是惡意程式?ACT 引入了 Agent 身分管理(KYA)和行為風控體系。傳統風控看的是人類的點擊流,而 ACT 建立了一套針對 Agent 行為模式(如瞬間高頻下單)的新風控標準,並建立了聲譽評價機制。
美中支付協議誰跑得更快?
如果把這些協議放在一起對比,我們會發現這不是簡單的優劣之分,而是側重點的博弈。
第一,協議完整度與落地速度是兩回事。
ACT 在紙面上的設計無疑是最周全的,四個域環環相扣,字段定義最細。但 OpenAI 的 Instant Checkout 已經實實在在地跑在了前面,接入了 Etsy 和百萬級的 Shopify 商戶。協議設計得再完美,如果不先跑起來迭代,很容易變成空談。在這方面,OpenAI 的實用主義讓它搶得了先機。
第二,生態開放性上,Google 更有優勢。
AP2 的圈子太豪華,幾乎囊括了全球支付體系的半壁江山。這意味著 AP2 未來可能直接打通銀行卡通道,而不必依賴某一個特定的支付服務商。相比之下,OpenAI 與 Stripe 的深度綁定,既是優勢也是掣肘。
第三,MCP 正在成為「公共基礎設施」。
雖然 Anthropic 沒有下場做支付,但 MCP 協議卻展現出了驚人的生命力。OpenAI 支持它,Google 兼容它,支付寶也上線了 MCP Server,甚至最後捐給了 Linux Foundation。這是一種極為聰明的「不爭之爭」不做裁判也不做運動員,而是做比賽用的哨子。
第四,信任服務與跨終端互操作,是 ACT 的獨門絕技。
「如何給 Agent 建立信用評價?」、「手機、眼鏡、汽車的支付體驗如何統一?」這些問題在美國協議中比較少提到。這或許與中國獨特的市場環境有關,中國撿便宜、找漏洞的用戶更多,IoT 設備也更多樣,倒逼協議層面必須給出解決方案。
為什麼會有這些差異?
這場全球競賽的背後,其實是三種力量在拉扯。
首先是基礎設施的差異。中國的移動支付滲透率極高,支付寶和微信本身就是超級 App,疊加 Agent 能力相對容易。而美國的支付鏈條漫長而分散,信用卡體系涉及發卡行、收單行、卡組織等多方,迫使 Google 必須走聯盟路線才能撬動。
其次是生態結構的不同。千問背後是阿里生態的系統級打通,從淘寶的商品庫到高德地圖的位置服務,Agent 調用這些能力鏈路極短。而海外是開放生態,AI 公司需要分別對接電商、支付和物流,協調成本幾何級數上升。這也是為什麼 Google 必須搞 UCP 這樣的開放協議。
最後是監管環境的影響。中國的支付監管相對集中,合規框架成熟。而美國涉及聯邦與各州的雙重監管,這可能也是 Anthropic 選擇暫避支付鋒芒的原因之一。
落地演進:兩種場景與競爭走向
理解了協議,我們再看看它具體怎麼用。目前的技術重點支持兩種場景:
一是即時確認支付,也就是「人在迴路中」。你和 Agent 聊天,它推薦商品,你點確認,驗證身分後完成交易。這和傳統電商區別不大,風險可控。
二是委託授權支付,這是真正的深水區。比如「幫我注意機票票,有票就買」,你睡著了,Agent 在凌晨自動下單支付。這正是 ACT 協議那 30 多個字段和授權憑證發揮作用的地方,它需要極其精確的意圖表達和防偽機制。
正如螞蟻金服 CTO 朱林提出的「AI 支付三階段」理論:我們正處在從第一階段「Agent 能收付款」向第二階段「支付體驗沉浸化」過渡的時期,千問目前的體驗就屬於此類。而最終的第三階段,將是實現完全根據用戶意圖的自動化支付。
未來的格局會如何演變?
目前 OpenAI 綁定 Stripe,Google 拉聯盟,Anthropic 做標準,支付寶推 ACT。有意思的是,協議層面其實存在巨大的合作空間,畢竟誰也不希望協議碎片化導致生態割裂。
真正的競爭將集中在應用層。誰能讓用戶習慣在自己的入口完成購物,誰就佔住了這個位置。OpenAI 有 ChatGPT 的龐大用戶,Google 有搜索和 Android,支付寶有中國的支付入口。
接下來看什麼?
這個領域還在早期,接下來有幾個方向值得密切關注:
異步執行的成熟度:「監控價格自動下單」這類場景,用戶不在場,風險最高。這塊的體驗和風控還需要時間打磨。
跨平台互操作:現在各家 Agent 基本只能在自家生態內玩。如果用戶想讓 Agent 同時比較亞馬遜、淘寶、京東、拼多多、Temu的價格然後下單,目前還做不到,這需要協議層面的打通。
監管框架的演進:Agent 代替用戶做支付決策,出了問題責任怎麼認定?現有的消費者保護法規是假設人類用戶在操作。這塊需要新的規則。
信任體系的建立:怎麼給 Agent 建立身分認證和信用評價?怎麼讓商家區分好的 Agent 和壞的 Agent?這個問題不解決,商家對 Agent 流量的態度會很矛盾。
那杯由 AI 點單的奶茶,背後是一整套正在重構的基礎設施。我們正在經歷從「人找貨」到「貨找人」,再到「AI 替人找貨」的變革。在這場變革中,誰能最先解決「信任」與「支付」的問題,讓 Agent 順暢地幫人類買單,誰就掌握了通往 AI Agent 商業帝國的鑰匙。這場關於 Agent 支付的戰爭,才剛剛打響。
聰明的讀者讀到這裡,心裡肯定想到了那 Coinbase 的 x402 協議、Circle 的 CCTP呢?我將在下一篇解說。













另外中國的購買可以秒退款,這個會幫助用戶有較強的試用意願
circle被殺得很慘😰