報告概述 近年來,Google 的 Gemini 和 OpenAI 在大型語言模型(LLM)領域的競爭日益激烈。OpenAI 憑藉 GPT 系列模型,特別是 GPT-3 和 GPT-4,在文本生成、程式碼編寫和多語言處理等方面取得了顯著的成就。而 Google 則推出了 Gemini 模型,強調其多模態能力和在多項基準測試中的優異表現。 此次 Gemini 2.5 Pro 的推出,標誌著 Google 在 LLM 領域的又一次重大進展。這份報告旨在比較 Gemini 2.5 Pro 與其他 LLM 在多項基準測試中的表現,評估它們在推理、知識、數學、程式碼生成、事實性和視覺推理等方面的能力,並 …