舒暢:馬斯克推出 Grok 4,AI 軍備競賽正式升級
馬斯克最近又出手了。這一次,他在人工智能領域掀起了新的波瀾。由他主導的 xAI 公司,剛剛發布了新一代通用人工智能模型,命名為 Grok 4。這不是一個簡單的升級,而是一種戰略性宣示,它向 ChatGPT、Google 的 Gemini、Anthropic 的 Claude 等一眾大模型發起了直接挑戰,甚至隱含了向“強人工智能”——也就是 AGI(Artificial General Intelligence,通用人工智能)邁進的野心。
說到這裡,有必要對一些術語做個簡單解釋。所謂 xAI,是馬斯克在 2023 年創建的一家人工智能公司,其宗旨是打造“最大限度追求真理”的 AI,強調不被政治正確綁架,主張模型能說真話、能批判。而 AGI,則是人工智能界長期追求的終極目標:一個能夠像人類一樣全面思考、理解、學習並解決各類問題的系統,不再只是語言模型,而是具備人類級別智能的“通才思維引擎”。Grok 4 正是在這樣的理念下誕生的。
這聽來好像是天方夜譚,不可思議,但事實就是這樣
這次發布的 Grok 4 分為普通版和名為 Grok 4 Heavy 的高級版。後者採用類似“多智能體協同推理”的技術架構,讓多個子模型分工合作,從而完成更複雜、更連貫的思維任務。這種結構目前在主流模型中還相當罕見。xAI 還推出了收費高達每月 300 美元的 SuperGrok 高級訂閱計劃,面向更深度使用者與開發者群體。這些不同層級的設置,不僅是商業策略,更是表明馬斯克準備親自參與到 AGI 的競賽當中。
為什麼說它“恐怖”?有兩個例子就足以說明。第一,在一項被稱為“人類最後的考試”(Humanity’s Last Exam)的測試中,Grok 4 Heavy 的得分高達 44.4%,大幅領先 Google Gemini 2.5 Pro 和 OpenAI 最新版本,甚至遠超 Claude Opus。第二,在 ARC-AGI-2 圖形類推理測試中,Grok 4 Heavy 的得分也遙遙領先其他大模型,是 Claude 的兩倍。ARC 測試主要評估 AI 是否具備抽象思維能力,它並非拼記憶或堆數據,而是看 AI 是否真正“會想”。Grok 在這一點上已經讓人感到,它不只是能聊天,更像是在用某種近似於“理性”的方式去思考。
與此同時,它也因為“太自由”而招致爭議。Grok 4 的自動發帖系統曾在上線初期發布過極具爭議的內容,包括一些涉及極端主義的說法,引發外界不滿。xAI 方面緊急介入,刪除內容,並強調將改進過濾機制。這也從另一個角度反映出:當一個 AI 模型試圖不受人類限制、自由表達的時候,它究竟是更接近真理,還是更接近混亂?這個問題值得深思。
進一步來看,Grok 4 不僅僅是一個寫文章、答問題的工具,它還極有可能被美國國防界關注與接入。馬斯克本人就曾經與五角大樓、NASA、國防高級研究計劃局(DARPA)等有深厚合作關係。他的 Starlink 已經被美軍用於戰場通信,SpaceX 的火箭被用來發射軍事衛星。那麼,Grok 4 作為一個具備高級推理、圖像識別、代碼分析與目標規劃能力的系統,將來如果被用於軍事戰略制定、敵情預警、無人系統指揮,甚至核危機管理,並不令人意外。尤其在面對日益複雜的國際安全局勢中,美國肯定不希望被中國、俄羅斯或其他勢力在 AI 軍事化領域超前一步。從這個角度來看,Grok 4 很可能是美國科技與軍工深度融合的新平台。
此外,Grok 4 還可能在科學研究領域扮演重要角色。過去 AI 模型只能輔助查找文獻、生成摘要,而如今的 Grok 4 已具備結構性建模與跨領域概念遷移能力,甚至可以提出新的假設。這就帶來了一個震撼的問題:它的“智商”是否已經超過人類?目前並沒有正式的 IQ 測驗標準來衡量 AI,但如果讓它做人類常用的智商測試——例如韋氏量表、雷文矩陣等,Grok 4 Heavy 我相信完全可能在推理速度、抽象能力、問題處理上超越大多數人類平均水平。如果真如此,那麼它參與科學創新,甚至提出新型數學猜想、設計分子結構、規劃能源模型,這些原本只有天才科學家能完成的任務,也許都可以交由它處理。AI 不再是“助手”,而是在某個領域、某個研究的“引路人”。
在look for被廣泛使用之前,先順便介紹一下ChatGPT的使用情況,OpenAI 的 GPT-4 雖然也功能強大,但至少普通人可以通過 20 美元的月費方式獲得 GPT-4-turbo 版本的使用權。目前這項服務在美國、加拿大、澳洲、新加坡、香港等地廣泛開放,但中國大陸地區無法直接使用,只能通過第三方方式繞道訪問。而免費的 GPT-3.5 版本仍可供大多數人使用,適合日常寫作、翻譯、問答等需求。OpenAI 也為企業用戶提供按調用量計費的 API 服務,適合更高級開發者接入大模型接口。從這一點出發,我們是不是可以這樣推行格,將來要推廣到中國被使用看來時遙遠的事情。這是因為整體趨勢正在加速清晰: AI 已不僅僅是一個聊天機器人或寫作工具,它還將可能是科學的發現者、戰爭的預演者、文明的塑造者和最高級的醫生。而馬斯克這次推出的 Grok 4,只是其中一步,它已不僅是科技產品,更是一次文明方向的預演。我們站在歷史關口,而 AI,正走在前面。