
(圖/ gemini AI)
中華雲新聞網 (文/記者 莊雲川)
Google近期針對旗下生成式人工智慧平台Gemini調整使用配額機制,不再以用戶提問次數作為計算標準,而是改採「運算量(Compute Usage)」作為額度依據。新制度上路後,引發部分用戶反彈,認為額度消耗速度明顯加快。對此,Google近日宣布一系列改善措施,希望提升使用體驗並回應市場關切。
根據Google說明,新的配額計算方式將綜合評估提示詞(Prompt)複雜度、對話長度以及所使用功能的運算需求。系統會在每5小時重新計算一次額度,但仍受到每週總使用量上限限制。
複雜提問耗額度快 用戶抱怨使用體驗下降
不少Gemini用戶指出,在新機制下,即便提問次數不多,只要涉及較複雜的分析、推理或多步驟任務,便可能快速消耗大量配額,導致短時間內無法繼續使用高階模型功能。面對外界批評聲浪,Google已陸續針對開發者及一般用戶進行調整。Gemini團隊負責人Josh Woodward表示,Google已開始為Gemini 3.1 Pro導入新的額度管理方式,限制單次提示所能消耗的最大運算配額,避免個別高負載請求一次耗盡大量資源。此舉可望讓用戶在相同額度下獲得更多實際使用次數,提高整體使用效率。
系統錯誤不再扣額度 用量資訊將更透明
除了調整配額計算方式外,Google也宣布,若使用過程因系統異常導致請求失敗,將不再計入用戶配額。只有成功完成的任務才會正式扣除使用額度。針對許多用戶反映「不知道額度到底消耗在哪裡」,Google坦言目前用量頁面資訊仍不夠完整,因此正開發更透明的監控介面,讓用戶能清楚掌握各項功能與任務的配額使用情況。
Flash-Lite免費使用 模型設定可自動記憶
在模型使用方面,Google也帶來利多消息。未來透過Gemini 3.1 Flash-Lite進行提問時,將不會消耗任何Gemini配額,提供用戶執行日常查詢與輕量工作時的免費選項。同時,Google也優化模型切換體驗。當使用者選定特定模型後,系統將自動記錄偏好設定,並套用至後續新開啟的對話。除非使用者自行更改,或因配額耗盡而自動降級至較輕量模型,否則系統不會主動切換模型版本。
Omni影片功能Bug修復 AI Ultra額度翻倍
Google也證實,先前Gemini Omni影片生成功能確實存在配額計算異常問題。部分用戶反映僅生成一至兩支影片便耗盡大部分額度,影響正常使用。官方表示,目前相關問題已完成修復,並同步提高Google AI Ultra方案用戶的Omni影片生成額度,最高可達原本的兩倍,進一步滿足高頻率影音創作需求。
未來將推按量付費 重度用戶可彈性加購
Google透露未來將推出「按量付費(Pay-as-you-go)」機制。當用戶額度不足時,可直接購買額外AI運算資源,而無需等待系統重置配額。市場分析認為,此舉將有助於吸引企業用戶及重度AI使用者,讓Gemini在與其他AI平台競爭時擁有更具彈性的商業模式,同時也能滿足不同層級用戶的使用需求。
隨著AI模型運算成本持續攀升,如何在服務品質、資源分配與商業獲利之間取得平衡,已成為各大AI業者共同面對的重要課題。Google此次調整Gemini配額制度,也反映生成式AI市場正逐步走向更精細化的資源管理模式。
發表回覆
取消回覆投票表決
最新消息
獲取最新新聞
訂閱我們的新聞,以獲取最新新聞和獨家更新。