設萬維讀者為首頁 廣告服務 聯繫我們 關於萬維
簡體 繁體 手機版
分類廣告
版主:紅樹林
萬維讀者網 > 五 味 齋 > 帖子
為什麼 DeepSeek 的新 AI 模型認為自己是 ChatGPT
送交者: 老字號 2025年01月04日06:39:56 於 [五 味 齋] 發送悄悄話

為什麼 DeepSeek 的新 AI 模型認為自己是 ChatGPT

Kyle Wiggers

2024 12 27

本周早些時候,資金雄厚的中國 AI 實驗室 DeepSeek 發布了一款“開放”AI 模型,在熱門基準測試中擊敗了許多競爭對手。該模型 DeepSeek V3 規模龐大但效率高,可以輕鬆處理基於文本的任務,例如編碼和撰寫論文。

它似乎也認為自己是 ChatGPT

X 上的帖子——以及 TechCrunch 自己的測試——表明 DeepSeek V3 將自己標識為 ChatGPT,這是 OpenAI AI 聊天機器人平台。當被要求詳細說明時,DeepSeek V3 堅稱它是 OpenAI 2023 年發布的 GPT-4 模型的一個版本。

 image.png

這種妄想根深蒂固。如果您向 DeepSeek V3 詢問有關 DeepSeek API 的問題,它會為您提供有關如何使用 OpenAI API 的說明。 DeepSeek V3 甚至講了一些與 GPT-4 相同的笑話——甚至包括笑點。

那麼發生了什麼?

ChatGPT DeepSeek V3 等模型是統計系統。經過數十億個示例的訓練,它們會從這些示例中學習模式以進行預測——例如,電子郵件中的“致誰”通常位於“可能相關”之前。

DeepSeek 並未透露太多有關 DeepSeek V3 訓練數據來源的信息。但包含由 GPT-4 通過 ChatGPT 生成的文本的公共數據集並不缺乏。如果 DeepSeek V3 在這些數據集上進行訓練,該模型可能會記住 GPT-4 的一些輸出,現在正在逐字逐句地複述它們。

倫敦國王學院專門研究人工智能的研究員 Mike Cook 告訴 TechCrunch:“顯然,該模型在某個時候看到了來自 ChatGPT 的原始回復,但不清楚那是在哪裡。” “這可能是‘偶然’……但不幸的是,我們已經看到有人直接用其他模型的輸出來訓練他們的模型,試圖利用他們的知識。”

庫克指出,用競爭對手的人工智能系統的輸出來訓練模型的做法對模型質量“非常不利”,因為它會導致幻覺和誤導性答案,如上文所述。“就像複印一份複印件一樣,我們會失去越來越多的信息和與現實的聯繫,”庫克說。

這也可能違反這些系統的服務條款。

OpenAI 的條款禁止其產品的用戶(包括 ChatGPT 客戶)使用輸出來開發與 OpenAI 自己的模型競爭的模型。

OpenAI DeepSeek 沒有立即回應置評請求。然而,OpenAI 首席執行官 Sam Altman X Friday 發布了一篇似乎是在挖苦 DeepSeek 和其他競爭對手的文章。

“複製你知道有效的東西(相對)容易,”Altman 寫道。 “當你不知道某件新事物是否可行時,做它就極其困難。”

誠然,DeepSeek V3 遠非第一個自我識別錯誤的模型。谷歌的 Gemini 和其他模型有時聲稱自己是競爭對手。例如,在普通話提示下,Gemini 說它是中國公司百度的 Wenxinyiyan 聊天機器人。

這是因為網絡(AI 公司從中獲取大量訓練數據的地方)正充斥着 AI 垃圾。內容農場正在使用 AI 來創建點擊誘餌。機器人充斥着 Reddit X。據估計,到 2026 年,90% 的網絡可能都是 AI 生成的。

這種“污染”,如果你願意的話,已經使得從訓練數據集中徹底過濾 AI 輸出變得相當困難。

DeepSeek 直接在 ChatGPT 生成的文本上訓練 DeepSeek V3 是完全有可能的。畢竟,谷歌曾經被指控做過同樣的事情。

非營利組織 AI Now Institute 的首席 AI 科學家 Heidy Khlaaf 表示,無論風險如何,“提煉”現有模型知識所帶來的成本節省對開發人員來說都是有吸引力的。

“即使現在互聯網數據充斥着 AI 輸出,其他意外地在 ChatGPT GPT-4 輸出上進行訓練的模型也不一定能展示出讓人聯想到 OpenAI 定製消息的輸出,”Khlaaf 說。“如果 DeepSeek 部分使用 OpenAI 模型進行提煉,那就不足為奇了。”

然而,更有可能的是,大量 ChatGPT/GPT-4 數據進入了 DeepSeek V3 訓練集。這意味着該模型不能被信任進行自我識別。但更令人擔憂的是,DeepSeek V3 可能會通過不加批判地吸收和迭代 GPT-4 的輸出,加劇該模型的一些偏見和缺陷。

TechCrunch 有一份以 AI 為重點的新聞通訊!在此處註冊,每周三在您的收件箱中收到它。

本文最初發表於 TechCrunch,網址為 https://techcrunch.com/2024/12/27/why-deepseeks-new-ai-model-thinks-its-chatgpt/


0%(0)
0%(0)
  讓它談談六四是怎麼回事? 嘿嘿。  /無內容 - 衣冠禽獸 01/04/25 (21)
標 題 (必選項):
內 容 (選填項):
實用資訊
回國機票$360起 | 商務艙省$200 | 全球最佳航空公司出爐:海航獲五星
海外華人福利!在線看陳建斌《三叉戟》熱血歸回 豪情築夢 高清免費看 無地區限制