在 2025 年 7 月 9 日的直播中,xAI 正式推出了最新的聊天機器人 Grok 4,由伊隆·馬斯克親自揭幕。據馬斯克所說,Grok 4 的智慧已超越大多數研究生,能夠處理從程式編碼到跨領域的複雜問題,速度與效率都優於以前的版本。
此時正值馬斯克的公司 X 和 xAI 樹立新管理階層,以及面對內容審核壓力的時刻,但所有焦點仍集中在 Grok 4 上,尤其中它是否能與 GPT-4o、Claude 3 和 Gemini 競爭。
Grok 4 與 Grok 3 差異有多大?
據報,Grok 4 在不使用任何工具的情況下,在「人類最後考試」中取得了 25.4%的成績,超越了 o3 和 Gemini 2.5 Pro。而在使用工具的情況下,成績爬升至 38.6%,更在「Grok 4 Heavy」多重代理下達到了 44.4%。
- Grok 4 擁有「科學家級別的推理能力」。
- 上下文長度從 Grok 3 的 32,000 個 token 提高到 Grok 4 的 130,000 token。
- 速度更快、準確率更高,幻覺現象也減少,GPU 優化更佳。
- 馬斯克表示,Grok 4 可與 GPT-5 和 Claude 4 Opus 相媲美,甚至準備迎戰。
xAI 每月投入約十億美元以追趕 OpenAI、Google 及 Meta,在 3 月正式與 X 合併以集中資源加速 Grok 的開發。這些投資似乎正在產生效果。
Grok 4 對開發者有什麼幫助?
xAI 發布了兩個版本的 Grok 4,其中一個專為開發者設計。通用版本能夠處理寫作、研究、翻譯和數學、語言及程式的複雜推理。
開發者專用版本 Grok 4 Code 則專門為工具如 Cursor 代碼編輯器設計。它有助於程式碼生成、Autocomplete、除錯,甚至能在程式開發過程中協助隨時發現錯誤,是專業程式員與開發愛好者的好幫手,可媲美 GitHub Copilot 和 GPT-4 的代碼解析器。
早期評論指出,Grok 4 Code 比起一般 AI 編碼工具提供更聰明的建議,並且似乎對整體項目有更深入的理解,從而協助架構和結構的優化,並與你的整合開發環境(IDE)整合得更深入,包括即時文件編輯和優化建議。
Grok 4 的新功能有哪些?
- 現在可以處理圖像,並即將提供視頻支援(多模態支援)。
- 語音聊天變得更流暢,但依然不如 Gemini Live 那般自然。
- 保留 DeepSearch 的即時網路存取能力,尤其是從 X 金流市場資訊。
- 在網絡流行文化方面有顯著的提升,例如理解 memes、笑話和網絡俚語。
- 相較於 Google 的 Imagen 3,Grok 4 在圖像生成方面仍稍顯遜色。
Grok 4 相較於其前期版本有很大的升級,特別是在處理各種類型內容方面。不同於僅限於文字的 Grok 3,Grok 4 現在可以理解圖像,視頻支持也即將推出。這讓它有能力與頂級 AI 模型如 GPT-4o 及 Gemini 2.5 Pro 勒比,儘管在圖像生成方面,特別是和 Google 的 Imagen 3 相比仍有待改進。
語音對話方面也在不斷改善。回答感覺更自然,不像以前那般支離破碎,雖然還是不及 Gemini Live 那樣流暢。
Grok 4 保持了一項引人矚目的功能:DeepSearch,讓它可以即時訪問網路內容,尤其是 X 的內容。這意味著它可以調用即時新聞、市場數據或熱門帖子,不需要離開應用程序或打開瀏覽器。大多數競爭對手仍然限制或完全阻止這種訪問。
Grok 4 怎麼用?
想親自試試 Grok 4,可以直接前往 Grok 網站並登錄你的 Super Grok 帳號,選擇使用這個新發布的模型。
若是透過 API 使用 Grok 4,可以前往 x.ai/api 的 API 控制台並創建 API Key。Grok 4 採用的先進架構和功能設置無疑是吸引了不少開發者和技術愛好者的注意。
Grok 4 值得使用嗎?
根據發布會和公開資訊,Grok 4 在推理、現實模擬及處理即時數據等方面有了顯著改進。這些改進使得 Grok 4 在參數分析、錯誤檢測等具體任務上,有著良好的表現。
xAI 還展示了以人工智能助手「伊芙」為代表的現實化語音輸出,並演示了 Grok 在程式編寫中,如何通過除錯整個源代碼文件來協助開發者。不過,某些高級任務在高峰時段可能需要較長的處理時間,雖然 xAI 宣稱最快 24 小時內便能完成。
Grok 4 的費用如何?
xAI 上市了超高級計劃 SuperGrok Heavy,月費為 300 美元或年費 3,000 美元,這使它成為主要供應商中價格最高的 AI 訂閱方案之一。
該計劃給予用戶 Grok 4 Heavy 和即將推出工具的早期訪問權限,包括將於八月推出的程式碼模型、九月推出的多模態代理,以及十月推出的視頻生成果模型。這項計劃特別針對開發者群體而設計,不過價格不菲。
Grok 4 的限制有哪些?
Grok 4 雖具速度與智慧,但重要功能上仍有缺陷。
它無法記憶過往對話,這意味著用戶每次啟動會話後都要重新解釋內容——這方便性不及能夠追蹤長期討論主題的 ChatGPT。
談到整合性,Grok 基本上獨立存在,並沒有類似於 ChatGPT 的外掛支持或內建的工具鏈接,這對於需要跨平台管理複雜工作流的用戶來說,是一大遺憾。
Grok 4 的爭議性
Grok 為了實現所謂的「言論自由 AI」,吸引了那些認為主流聊天機器人太受限制的用戶,但也引發了不少問題。在 Grok 4 發布之前,xAI 被迫迅速推出應急的內容審核工具,因為機器人產生了有害或冒犯性的回應。
針對惡劣言論與生成問題,xAI 正在努力改進 moderation 工具,然而仍需時間考驗改進效果。
Grok 4 在 AI 競爭中的意義
伴隨著 GPT-5 的推出和 Google 在 Gemini 上的投資,Grok 4 加入了科技巨頭之間競爭迅猛的賽道。然而,在其他公司注重安全性和可靠性時,xAI 強調速度、個性化,以及為開發者提供更大自由度。
如果 Grok 4 能如願實現功能承諾,在智慧編碼幫助、即時答案、和更少的限制方面,或許能讓經驗豐富的用戶感到滿意,但它是否能避免之前限制使用的問題,還需後續觀察。