【AI科普】從Token成本認知轉變到AI護城河：數據、流程與入口決定應用壁壘

最近一段時間，作者持續開設AI導入各行業的課程與講座。隨著和企業管理者、政府機關人員交流增多，作者有感外界雖然普遍認識到AI的重要性，但對AI產業的底層邏輯、成本如何演化、能力最終會沉澱在哪一層，以及應用壁壘在什麼環節，仍然存在不少疑問。因此，作者通過本文嘗試把這些被反覆提及的問題梳理清楚，以幫助外界更完整地理解AI產業從成本變化到競爭壁壘轉移的整體脈絡。

AI產業正在經歷一個關鍵轉折：token成本從隱性成本變成顯性成本。

過去，很多模型服務採用包月制、補貼制或寬鬆限額制，用戶容易形成一種錯覺：AI調用幾乎沒有成本。

現在，模型公司開始按使用量精細計費，企業和重度用戶立刻感受到token支出上升。這顯示AI基礎設施仍在早期，並未推翻AI的長期經濟性。

隨著模型競爭、開源普及、本地部署、推理優化和模型路由成熟，AI會逐步走向「應用側近零邊際成本」。AI推理本身始終有成本，但這些成本會越來越低，並被基礎設施層、平台層、企業內部系統或套餐制吸收。最終，應用開發者和普通用戶不需要為每一次模型調用精打細算。

AI成本下降是長期主線

AI推理成本長期下降，是產業演化的主線。

今天token貴，主要有三個原因：前沿模型供給稀缺，推理基礎設施仍在早期，很多應用還在粗放調用最強模型。

這種狀態難以長期維持。未來成本下降會來自五個方向：

模型競爭：閉源模型之間會持續價格競爭，API價格會被壓低。
開源模型：開源模型會提供可替代方案，削弱少數模型公司的定價權。
本地部署：企業會把大量高頻、標準化、隱私敏感任務放到本地或私有雲中執行。
推理優化：模型壓縮、量化、蒸餾、KV cache、批處理、專用芯片會降低單次調用成本。
模型路由：不同任務調用不同模型，避免所有問題都使用最貴的前沿模型。

今天token支出上升，只代表AI仍處於基礎設施稀缺期，但它並不能推翻AI成本下降這條長期主線。

AI無法達到物理零成本，但會形成「應用側近零邊際成本」

嚴格說，AI不可能達到零邊際成本。每一次模型推理都要消耗GPU或ASIC、電力、內存帶寬、網絡、數據中心容量和工程維護。只要有計算，就有成本。

因此，「0邊際成本」不能被理解為會計事實或物理事實。AI的單位認知、生成與互動成本會持續下降，並在成熟產業結構中被基礎設施層吸收，使應用側感知到的邊際成本接近於零。

這和移動互聯網很像。

今天用戶刷短視頻、發消息、瀏覽網頁，很少逐次計算流量成本。流量仍然有成本，只是成本已經被電信套餐、Wi-Fi、企業網絡和平台服務吸收。

AI也會如此。未來，普通用戶不會總是按token思考。企業也不會把每個功能都直接暴露為API成本。AI能力會被封裝進訂閱、套餐、私有化部署、操作系統、辦公軟件、硬件設備和企業內部基礎設施之中。

移動互聯網流量與AI token相似，但不能等同

AI token最容易被拿來類比移動互聯網流量。這個類比有用，但必須精確理解。

移動流量的核心是「傳輸信息」。AI token的核心是「生成和處理信息」。這是根本差異。

比較維度	移動互聯網流量	AI token
成本性質	主要是數據傳輸成本	計算、內存、存儲、網絡與模型服務的綜合成本
單位資源標準化程度	較高，1GB流量大致可比較	較低，不同模型、上下文和任務的token成本差異巨大
質量決定因素	網速、覆蓋率、延遲、穩定性	模型能力、上下文長度、推理深度、工具調用、可靠性
使用可預測性	相對可預測	較難預測，Agent任務可能多輪推理並多次調用工具
成本下降路徑	通信技術升級、基站密度提升、頻譜效率提升、Wi-Fi替代	芯片進步、模型壓縮、推理優化、開源模型、本地部署、模型路由
用戶付費方式	流量包、寬帶、Wi-Fi、套餐	API按量、訂閱制、token包、企業私有部署、平台補貼、硬件內置
對應產業角色	電信運營商、寬帶商、虛擬運營商	模型公司、雲廠商、推理平台、模型路由商、企業AI基礎設施
是否會趨向低成本	是，單位流量成本長期下降	是，但不會像流量那樣完全標準化
最大差異	傳輸已存在的信息	生成、理解和處理信息

這張表指向一個結論：AI token會像流量一樣被基礎設施化，但它比流量更複雜。

對企業決策來說，這意味著不能只把AI採購理解為買一個更便宜的模型，而要同時考慮任務類型、部署方式、數據位置、系統整合和長期運營成本。

移動流量可以高度標準化，因為1GB就是1GB。AI token則不同。調用小模型的一千個token，和調用前沿模型的一千個token，成本和價值完全不同。短文本摘要的一千個token，和長程Agent推理的一千個token，也不是同一種東西。

所以，AI token不會簡單變成「新流量」。它更接近「雲計算 + 電力 + 移動流量 + SaaS席位費」的混合物。

未來AI付費模式也會多種並存：

消費者使用訂閱制、token包、會員制或硬件內置AI；
企業使用私有部署、混合雲、API採購和自建推理集群；
平台用廣告、會員、生態收入補貼AI成本；
高頻應用通過模型路由和本地模型控制單位成本。

開源模型與本地部署，是AI世界的「Wi-Fi」

移動互聯網成本下降，不只靠運營商降價，也靠Wi-Fi普及。Wi-Fi把大量高頻、重流量、低邊際價值的使用場景，從昂貴的移動網絡中分流出來。

AI也需要自己的「Wi-Fi」。這個角色會由開源模型、本地部署、企業私有模型和小模型承擔。

大量AI任務不需要最強模型。例如文檔摘要、客服問答、信息抽取、內部知識庫查詢、標準文案生成、基礎代碼輔助、表格處理、流程自動化。

這些任務會逐漸從昂貴的前沿模型API中分流，轉向便宜、穩定、可控的本地模型和開源模型。

這會改變AI產業的成本結構。閉源模型仍然重要，但不再壟斷所有場景。前沿模型負責高難度任務，開源模型和本地模型承擔日常高頻任務。企業不再被單一API價格綁架。

模型路由會成為AI產業的關鍵中間層

今天很多AI應用成本高，往往出在模型使用方式過於粗放，任務本身未必昂貴。

所有任務都調用最強模型，是典型的早期錯誤。成熟的AI系統會做模型路由：

簡單任務，用小模型；
標準任務，用便宜模型；
複雜推理，用前沿模型；
隱私任務，用本地模型；
低延遲任務，用邊緣模型；
高可靠任務，用多模型交叉驗證。

模型路由的功能，是在成本、速度、準確率、上下文長度、隱私要求和可靠性之間做動態調度。

這一層成熟後，AI產業會從「模型產品一體化」走向「模型基礎設施—路由中間層—應用服務層」。應用公司不再需要押注單一模型。它們要做的是理解場景、組織數據、設計流程、沉澱用戶關係。底層模型可以被替換、組合和優化。

成本下降不等於總支出下降

AI的單位成本會下降，但AI總支出未必下降。當一種資源變便宜，人們會用得更多。

雲計算單價下降後，企業雲支出仍然上升。帶寬變便宜後，短視頻和直播讓總流量暴增。AI也會如此。

今天，一次AI問答可能只是幾千token。未來，一個Agent任務可能需要讀取文件、制定計劃、調用工具、生成中間結果、自我檢查、反覆修正、與其他Agent協作。單個token更便宜，但一個任務消耗的token可能大幅增加。

所以，AI成本管理更應該看投入產出比，不能只盯著最低token價格。

如果一次AI任務花費10元，替代100元人工成本，這是好成本。如果一次AI調用只花1分錢，但沒有創造價值，仍然是浪費。

AI經濟性的核心指標，在於每單位成本能創造多少有效產出。順著這條線往下看，接下來更需要討論的是：低成本智能最後會沉澱在哪一層，會被誰掌握，又會如何轉化為持續價值。

AI應用的壁壘在數據、流程和入口

AI應用不能照搬移動互聯網的燒錢獲客模式。

很多通用AI產品轉移成本很低。今天用這個聊天機器人，明天換另一個，沒有太大負擔。簡單套殼產品很難留住用戶。

但這不代表所有AI應用都沒有壁壘。有壁壘的AI應用，會深度嵌入數據、流程和權限系統。

AI應用類型	網絡效應或鎖定強度
通用聊天機器人	較弱
簡單文案、圖片生成工具	較弱到中等
企業知識庫AI	中等到強
代碼Agent	強
銷售、客服、法務、財務工作流Agent	強
個人AI助理	可能很強
AI操作系統或入口級產品	可能極強

有價值的護城河主要來自七類資產：私有數據、用戶記憶、工作流嵌入、工具鏈整合、權限系統、組織流程改造和分發入口。

一個接入CRM、客服系統、知識庫和審批流程的AI Agent，不是換一個模型就能替代。一個接入代碼倉庫、項目管理、測試流程和部署系統的代碼Agent，也不是簡單API替換就能完成遷移。

AI應用的競爭，最後還是落在誰掌握了更關鍵的場景和流程。

模型會部分商品化，但前沿能力仍有溢價

模型會商品化，但不會全部商品化。

普通能力會快速商品化。摘要、翻譯、客服、基礎文案、分類、信息抽取、簡單代碼，會越來越便宜，越來越標準化，越來越可替代。

當模型整體能力不斷提高，越來越多任務不再需要最強模型。

但前沿模型仍然會保留溢價。複雜推理、科研、工程開發、長程Agent、法律分析、醫療輔助、金融決策和企業級自動化，仍然需要最高能力模型。這些場景中，模型能力只要高出一點，就可能創造巨大價值。

未來模型市場會形成四層結構：基礎模型能力商品化，中端模型靠性價比競爭，前沿模型服務高價值任務，模型路由負責動態分配需求。

AI產業終局是分層，不是單一巨頭包辦一切

AI早期看起來像模型公司包辦一切：訓練模型、提供API、做產品、做企業交付。

這是早期基礎設施不成熟的結果，不是終局。成熟的AI產業會分為五層：芯片、服務器、數據中心、能源和網絡構成算力基礎層；通用模型、專用模型、開源模型、企業私有模型構成模型基礎層；推理優化、緩存、監控、模型路由和成本治理構成推理與路由層；工具調用、記憶系統、任務編排和工作流自動化構成Agent與流程層；行業應用、辦公軟件、操作系統、硬件入口和企業服務構成應用與入口層。

這種分層會讓AI能力變成可採購、可調度、可替換、可優化的基礎設施。對應用層來說，重點在於選用合適的模型，進入關鍵場景，完成高價值任務。

模型與應用之間，數據與工具最容易被低估

如果沿著黃仁勳在達沃斯世界經濟論壇談到人工智能產業時提到的「五層蛋糕」框架來看，市場常常高估模型層的獨占性，低估數據與工具層的長期價值。

模型提供通用能力，數據決定能力落到哪個場景，工具決定能力能否執行任務，流程決定能力能否沉澱為組織效率。缺少數據與工具層，模型只能停留在問答和生成；接入數據與工具層，模型才會進入業務流程。

這也是AI應用護城河的來源。

因此，模型可以更換，數據遷移成本高；API可以替換，流程重構成本高；界面可以模仿，入口和權限卻不容易複製。這也是為什麼很多人高估模型本身，卻低估了數據、工具和流程這些更慢、更重、但也更穩固的資產。

AI token會從顯性成本變成底層基礎設施

token成本認知，以及AI護城河，它們都指向同一條產業邏輯。

token成本顯性化，會迫使企業重新審視AI使用方式。粗放調用最強模型的階段會過去，模型路由、開源模型、本地部署和推理優化會成為標準配置。AI能力會逐步從昂貴API，變成可調度的底層基礎設施。

成本下降之後，競爭焦點會轉移。模型仍然重要，但應用壁壘不會主要來自接入哪個模型。更穩固的壁壘來自數據、流程和入口。

誰掌握高質量私有數據，誰能讓AI進入核心流程，誰佔據高頻入口，誰就能把低成本智能轉化為持續價值。

AI token的認知轉變，會把市場從「模型崇拜」推向「場景效率」。AI應用的護城河，也會從模型能力轉向數據資產、流程深度和入口控制。

相關帖子

AI 重塑會展業：從人力密集到人機協同，琴澳會展人才如何轉型？

從網絡素養到學術治理：學會成員於亞太傳播論壇重磅發聲

解碼智慧政務新範式：AI落地的「閉環方案」

【AI科普】從Token成本認知轉變到AI護城河：數據、流程與入口決定應用壁壘

AI 重塑會展業：從人力密集到人機協同，琴澳會展人才如何轉型？

從網絡素養到學術治理：學會成員於亞太傳播論壇重磅發聲

解碼智慧政務新範式：AI落地的「閉環方案」

【AI科普】Harness Engineering：普通人也能懂的AI駕馭術

第二十三次澳門居民互聯網使用年度調查報告(2025)發佈會PPT

Internet Usage Trends In Macao 2025 (Executive Summary)

澳門居民互聯網使用趨勢報告2025（完整報告）

Special Report on the Digital Literacy of Minors in Macao 2024 (Executive Summary)

澳門未成年人網絡素養專題報告2024

“Generative AI” Usage in Macao 2024 (Executive Summary)

合作夥伴

網站相關

聯繫我們