美股
基金
外匯、加密貨幣
滬、深港通
港股
 
納斯達克
 
恆生指數
 
道瓊斯
 
標準普爾
 
 
新聞分享
如欲分享新聞,請填寫收件人及閣下之電郵,再按「送出」。*必需填寫
收件者電郵*
請用分號「;」分隔不同電郵地址,例子:a@a.com;b@b.com
閣下之電郵*
分享內容
谷歌Gemini 2.5升級「全能王」推理、程式皆拿榜首!輾壓o3與Claude 4
谷歌 (GOOGL.US) 深夜攜全新 Gemini 2.5 Pro 強勢歸來,僅用一個月碾壓舊版 Gemini 2.5。數學、程式設計、推理全面封神,穩坐所有榜單第一名,全面領先競爭對手如 o3、C...
重設
送出
視窗將於5秒內關閉
谷歌Gemini 2.5升級「全能王」推理、程式皆拿榜首!輾壓o3與Claude 4
鉅亨網新聞
推薦
1
利好
2
利淡
3
 
 

谷歌 (GOOGL.US)      深夜攜全新 Gemini 2.5 Pro 強勢歸來,僅用一個月碾壓舊版 Gemini 2.5。數學、程式設計、推理全面封神,穩坐所有榜單第一名,全面領先競爭對手如 o3、Claude 4 和 DeepSeek-R1 。

這次升級的 Gemini 2.5 Pro 在效能上展現出驚人的提升。其在整體 Elo 分數上提升了 24 分 ,尤其是在 Web Arena 上的 Elo 分數更是大幅躍升 35 分,達到 1443 分 。

在 LMArena 排行榜上,其 Elo 分數躍升 24 分,達到 1470 分,穩居榜首,並在所有領域都排名第一,這充分證明了其在處理複雜任務方面的強大能力 。Google 官博介紹稱,這次發布的是 Gemini 2.5 Pro 的升級預覽版,被譽為 Google 迄今為止最聰明的模型 。

此外,Gemini 2.5 Pro 無論是數學、程式設計還是推理能力,都刷新了業界的「最先進水準」(SOTA),穩居所有榜單之首,徹底碾壓了包括 o3、Claude 4 和 DeepSeek-R1 在內的所有競爭對手,為人工智慧的發展樹立了新的里程碑。

token 價格不變 性價比極高

更令人振奮的是,儘管性能實現了質的飛躍,新版本 Gemini 2.5 Pro 的 token 價格卻保持不變,這使得其具備極高的性價比。與市場上的競爭對手相比,Gemini 2.5 Pro 的輸出價格僅為 o3 的四分之一,與 Claude 4 相比更是顯著經濟。

這對廣大開發者和企業而言,無疑是一大利好消息,意味著他們能夠以更低的成本獲得頂級的 AI 能力,加速創新應用開發和部署。

新版 Gemini 2.5 Pro (06-05) 還引入了多項創新功能,進一步提升了模型的可用性和開發效率。其中最引人注目的便是高達 32k 的「思考預算」(Thinking Budget)功能,以及改進的函數呼叫能力。

「思考預算」功能導入 提升開發靈活性

這些新特性賦予了開發者更大的靈活性和精確度,使其能夠更有效地控制模型運行的成本和延遲,實現更為複雜和客製化的 AI 解決方案。根據 Google 官方部落格的介紹,此次發布的 Gemini 2.5 Pro 是一個升級預覽版,是 Google 迄今為止最聰明的模型,預計在幾週後將成為普遍可用的穩定版本,非常適合企業級應用,滿足各行各業對高效能 AI 的需求。

在程式設計領域,Gemini 2.5 Pro 的表現同樣令人印象深刻。它在 Aider Polyglot 等高難度程式設計基準測試中名列前茅,展現了卓越的程式碼生成、理解和除錯能力。

同時,在 GPQA 和被譽為「人類最後考試」(HLE)等極具挑戰性的基準測試中,Gemini 2.5 Pro 也展現了頂尖性能。這些測試全面評估了模型的數學、科學、知識和推理能力,其優異的表現再次證明了 Gemini 2.5 Pro 的綜合實力。

此外,Google 也針對先前 2.5 Pro 版本的用戶回饋進行了改進,顯著提升了其風格和結構,現在它能提供更有創意、格式更優的回答,使其在內容生成和交流互動方面更加自然流暢。

目前,開發者已可透過 Google AI Studio 和 Vertex AI 中的 Gemini API 開始使用更新的 2.5 Pro 進行開發。其便捷的存取方式和強大的功能,將極大地促進 AI 技術的應用創新。同時,Gemini 2.5 Pro 也已在 Gemini App 中正式上線,讓廣大普通用戶也能體驗到其尖端 AI 能力所帶來的便利與智慧。

網友實測 驗證強大實力

為了驗證 Gemini 2.5 Pro 在真實任務中的表現,眾多網友紛紛進行了實測,結果令人驚嘆。一張「劈柴圖」的廣泛流傳,暗示著業界普遍認為 Gemini 已是「獸中之王」。

在編碼能力方面,其對 o3 和 Claude 4 的碾壓已不再是空談——新版 Gemini 2.5 Pro 成功通過了六邊形物理模擬測試,證明了其在複雜物理環境建模和模擬方面的卓越能力。更令人驚豔的是,它還能透過 Three.js 創造出逼真的 3D DNA 模型,展現出強大的圖形處理和視覺化能力。

資料科學家 Diego 進行了一項引人注目的測試:他讓 Gemini 2.5 Pro 06-05 編寫一段 Python 程式碼,用於視覺化單行道中交通燈的工作原理,並要求車輛以隨機速率進入。程式碼運行後的效果顯示,動畫整體精美,運行流暢,沒有明顯問題。

作為對比,GPT 4.5 生成的程式碼效果則顯得畫面粗糙,車輛也不符合物理規律,這凸顯了 Gemini 2.5 Pro 在程式設計和模擬精確度方面的顯著優勢。Diego 先前也測試了 Claude Sonnet 3.7 和 Grok 3,這些對比進一步鞏固了 Gemini 2.5 Pro 在 AI 領域的領先地位。

Google Gemini 2.5 Pro (06-05) 的發布,標誌著 Google 在人工智慧領域又邁出了堅實的一步。其卓越的性能、高效的成本效益以及不斷創新的功能,無疑將加速 AI 技術的普及和應用。隨著「李在明時代」的開啟,我們預期 Google 將繼續引領 AI 技術的發展,為全球用戶帶來更多創新與便利。

(美股為即時串流報價; OTC市場股票除外,資料延遲最少15分鐘。)
新聞來源 (不包括新聞圖片): 鉅亨網
相關股份
0/0
公佈日期
指標
暫時沒有相關新聞。
 
美股網站地圖
支援電郵: support@aastocks.com
阿斯達克網絡信息有限公司 (AASTOCKS.COM LIMITED) 版權所有,不得轉載
免責聲明
閣下明確同意使用本網站/應用程式的風險是由閣下個人承擔。

AASTOCKS.com Ltd、香港交易所資訊服務有限公司、中國投資信息有限公司、深圳證券信息有限公司、Nasdaq, Inc.、其控股公司及/或該等控股公司的任何附屬公司、或其資訊來源及/或其他第三方數據供應商均竭力確保所提供資訊的準確和可靠度,但不能保證其絕對準確和可靠,且亦不會承擔因任何不準確或遺漏而引起的任何損失或損害的責任(不管是否侵權法下的責任或合約責任又或其他責任)。

AASTOCKS.com Ltd、香港交易所資訊服務有限公司、中國投資信息有限公司、深圳證券信息有限公司、Nasdaq, Inc.、其控股公司及/或該等控股公司的任何附屬公司、或其資訊來源及/或其他第三方數據供應商均對資訊不作任何明示或隱含的要約、陳述或保證 (包括但不限於可銷售性及特殊用途合適性的資訊保證) 。

AASTOCKS.com Ltd、香港交易所資訊服務有限公司、中國投資信息有限公司、深圳證券信息有限公司、Nasdaq, Inc.、或其控股公司及/或該等控股公司的任何附屬公司、或其資訊來源及/或其他第三方數據供應商不會就任何原因導致的中斷、不準確、錯誤或遺漏或因此而造成的任何損害賠償(不論直接或間接、相應而生、懲罰性或懲戒性)對任何人承擔責任。

AASTOCKS.com Ltd不負責,亦不承擔任何由於不可抗力的事故或在AASTOCKS.com Ltd不可合理控制的情況下導致的損失或損害,如颱風、暴雨、其他自然災難、政府或有關機構的限制、騷動、戰爭、病毒爆發,網絡故障或電信故障,引致AASTOCKS.com Ltd不能履行協議內的責任或提供服務。

Morningstar 免責聲明:版權所有©2020 Morningstar,Inc。保留所有權利此處包含的資料,數據,分析和意見(“信息”):(1)包含Morningstar及其內容提供者的專營資料; (2)除特別授權外,不得複製或轉載; (3) 不構成投資建議; (4)僅供參考,(5)並未為所載資料的完整性、準確性及時間性作出保證。Morningstar對於閣下使用任何相關資料而作出的任何有關交易決定、傷害及其它損失均不承擔任何責任。 請在使用所有資料前作出核實,並且在諮詢專業投資顧問意見前勿作任何投資決定。 過往業績並不代表將來表現,任何投資項目的價值及所得收入皆可升可跌。

本網站/應用程式包含的內容和信息乃根據公開資料分析和演釋,該公開資料,乃從相信屬可靠之來源搜集,這些分析和信息並未經獨立核實和AASTOCKS.com Limited並不保證他們的準確性、完整性、實時性或者正確性。

在本網站/應用程式的資料、金融市場數據、報價、圖表、統計數據、匯率、新聞、研究、分析、購買或者出售評分、財金教學及其他資訊僅作參考使用,在根據資訊執行證券或任何交易前,應諮詢獨立專業意見,以核實定價資料或獲取更詳細的市場信息。AASTOCKS.com Limited不應被視為游說任何訂戶或訪客執行任何交易,閣下須為所有跟隨在本網站/應用程式的資料、評論和購買或出售評分執行的交易負責。

AASTOCKS.com Limited之信息服務基於「現況」及「現有」的基礎提供,網站/應用程式的信息和內容如有更改恕不另行通知。AASTOCKS.com Limited有權但無此義務,改善或更正在本網站/應用程式的任何部分之錯誤或疏漏。

用戶在沒有AASTOCKS.com Limited明確的書面同意情況下,不得以任何方式複製、傳播、出售、出版、廣播、公佈、傳遞資訊內容或者利用在本網站/應用程式的信息和內容作商業用途。

投資涉及風險。 閣下可自行决定利用本網站的財金教學作學術參考用途,但 AASTOCKS.com Limited不能並不會保證任何在本網站/應用程式現在或未來的購買或出售評論和訊息會否帶來贏利。過往之表現不一定反映未來之表現,AASTOCKS.com Limited不可能作出該保證及用戶不應該作出該假設。

AASTOCKS.com Limited也許連結訂戶或訪客至其有興趣的網站,但AASTOCKS.com Limited只提供此服務給訂戶或訪客並不為此安排負責。

AASTOCKS.com Limited對於任何包含於、經由、連結、下載或從任何與本網站/應用程式有關服務所獲得之資訊、內容或廣告,不聲明或保證其內容之正確性或可靠性。 對於閣下透過本網站/應用程式上之廣告、資訊或要約而展示、購買或取得之任何產品、資訊資料,本公司亦不負品質保證之責任。

AATV是AASTOCKS.com Limited旗下的視頻網站平台。

閣下確認:(i) AATV只為提供資訊,並不為了任何交易目的;(ii) AATV節目內容以及其提供的資料並不構成任何AASTOCKS為售賣任何證券作出招攬、提出要約、意見或推薦,或對任何證劵或投資的收益或是否合適提供法律、稅務、會計、或投資意見或服務;及(iii)AATV並非為任何人士或法律實體在其他司法管轄區或國家使用,而在當地可能因該使用或分發而違反當地法律或法規。

AATV中節目內容中的個人意見和觀點僅供參考及討論,亦並不代表AASTOCKS.com Limited的立場。投資者必須按其本身投資目標及財務狀況自行作出投資決定。AASTOCKS.com Limited不對以下任何情況對閣下或任何人直接或間接負責:(i)AATV的不准確性,錯誤或遺漏,包括但不限於報價和財務數據; (ii)AATV中節目傳輸的延遲,錯誤或中斷; (iii)閣下由AATV中節目內容招致任何損失。

我們保留權利不時更改本免責聲明並於本網站/應用程式刊登更新版本。閣下必須定期查閱於本網站/應用程式刊登的資訊,以確保您即時知悉任何有關的改動。 如閣下於本免責聲明更新後仍繼續使用本網站/應用程式,即代表閣下同意接受更改後的本免責聲明的約束。

本免責聲明應受中華人民共和國香港特別行政區(「香港」)法律管限。閣下同意接受香港法院的專屬司法管轄權管轄。

本免責聲明的中英原文如有任何岐異,一切以英文原文為準。

更新日期為: 2023年1月6日