4月18日|谷歌發佈突破性混合推理模型Gemini 2.5 Flash,該模型創新性地引入可調節“思考預算”功能,在保持高性能的同時顯著降低使用成本。在閉源思考模式下,其成本僅為0.6美元/百萬tokens,相比全功能思考模式(3.5美元/百萬tokens)大幅降低600%。值得注意的是,即便在基礎模式下運行,其性能依然超越前代Gemini 2.0 Flash。性能表現方面,Gemini 2.5 Flash在大模型排行榜中以1392分ELO評分高居第二,僅次於GPT-4.5-preview,與Grok-3表現相當。
新聞來源 (不包括新聞圖片): 格隆匯