In
一句話總結:國際研究暨顧問機構 Gartner 最新報告指出,儘管人工智慧(AI)模型的關鍵運算單位 Token 單價預計在 2030 年前趨近於零,但企業的整體 AI 推論成本卻可能不減反增,主要原因在於 AI 應用需求量的大幅飆升與複雜度提升。
核心要點
- 國際研究暨顧問機構 Gartner 預測,到 2030 年,人工智慧(AI)模型的關鍵運算單位「Token」單價將大幅趨近於零。
- 儘管單價驟降,Gartner 報告強調,隨著 AI 技術的快速演進與應用普及,企業的 整體 AI 推論成本 反而可能不減反增。
- 大型語言模型(LLM)的推論成本預計在 2030 年之前降低逾 90%,而模型效率則有望提升 高達 100 倍。舉例來說,具備 1 兆參數的 LLM,其推論成本相較於 2025 年將減少超過九成。
- Gartner 資深總監分析師威爾·索默(Will Sommer)提醒,企業採購長(CPO)不應將通用 Token 價格下跌誤解為進階推理能力已普及,因為支援 複雜推理所需的運算資源 依然稀缺。
- 未來對 Token 的需求量將因 AI 技術發展而大幅飆升,尤其是 AI 代理程式 等更先進技術,每項任務所需消耗的 Token 量,比傳統簡易聊天機器人多出 至少 5 倍至 30 倍。
- 因此,即使 Token 單價降低,龐大的總使用量仍將導致企業的 整體 AI 推論成本增加。
- Gartner 強調,未來的 AI 競爭力核心不在於單一模型的效能,而是 「多模型協調策略」,這意味著企業需運用小型語言模型(sLLM)或特定領域模型處理重複任務,並將最尖端模型用於高價值、複雜的推理。
一句話結論
面對 AI Token 單價趨零卻總成本上升的矛盾,企業必須重新思考其 AI 部署戰略,透過 精準的「多模型協調」 與資源優化,才能在 2030 年前的 AI 浪潮中保持競爭力並有效管理營運成本。