| 為什麼 DeepSeek 的新 AI 模型認為自己是 ChatGPT |
| 送交者: 老字號 2025年01月04日06:39:56 於 [五 味 齋] 發送悄悄話 |
|
為什麼 DeepSeek 的新 AI 模型認為自己是 ChatGPT Kyle Wiggers 2024 年 12 月 27 日 本周早些時候,資金雄厚的中國 AI 實驗室 DeepSeek 發布了一款“開放”AI 模型,在熱門基準測試中擊敗了許多競爭對手。該模型 DeepSeek V3 規模龐大但效率高,可以輕鬆處理基於文本的任務,例如編碼和撰寫論文。 它似乎也認為自己是 ChatGPT。 X 上的帖子——以及 TechCrunch 自己的測試——表明 DeepSeek V3 將自己標識為 ChatGPT,這是 OpenAI 的 AI 聊天機器人平台。當被要求詳細說明時,DeepSeek V3 堅稱它是 OpenAI 於 2023 年發布的 GPT-4 模型的一個版本。 這種妄想根深蒂固。如果您向 DeepSeek V3 詢問有關 DeepSeek API 的問題,它會為您提供有關如何使用 OpenAI API 的說明。 DeepSeek V3 甚至講了一些與 GPT-4 相同的笑話——甚至包括笑點。 那麼發生了什麼? ChatGPT 和 DeepSeek V3 等模型是統計系統。經過數十億個示例的訓練,它們會從這些示例中學習模式以進行預測——例如,電子郵件中的“致誰”通常位於“可能相關”之前。 DeepSeek 並未透露太多有關 DeepSeek V3 訓練數據來源的信息。但包含由 GPT-4 通過 ChatGPT 生成的文本的公共數據集並不缺乏。如果 DeepSeek V3 在這些數據集上進行訓練,該模型可能會記住 GPT-4 的一些輸出,現在正在逐字逐句地複述它們。 倫敦國王學院專門研究人工智能的研究員 Mike Cook 告訴 TechCrunch:“顯然,該模型在某個時候看到了來自 ChatGPT 的原始回復,但不清楚那是在哪裡。” “這可能是‘偶然’……但不幸的是,我們已經看到有人直接用其他模型的輸出來訓練他們的模型,試圖利用他們的知識。” 庫克指出,用競爭對手的人工智能系統的輸出來訓練模型的做法對模型質量“非常不利”,因為它會導致幻覺和誤導性答案,如上文所述。“就像複印一份複印件一樣,我們會失去越來越多的信息和與現實的聯繫,”庫克說。 這也可能違反這些系統的服務條款。 OpenAI 的條款禁止其產品的用戶(包括 ChatGPT 客戶)使用輸出來開發與 OpenAI 自己的模型競爭的模型。 OpenAI 和 DeepSeek 沒有立即回應置評請求。然而,OpenAI 首席執行官 Sam Altman 在 X Friday 發布了一篇似乎是在挖苦 DeepSeek 和其他競爭對手的文章。 “複製你知道有效的東西(相對)容易,”Altman 寫道。 “當你不知道某件新事物是否可行時,做它就極其困難。” 誠然,DeepSeek V3 遠非第一個自我識別錯誤的模型。谷歌的 Gemini 和其他模型有時聲稱自己是競爭對手。例如,在普通話提示下,Gemini 說它是中國公司百度的 Wenxinyiyan 聊天機器人。 這是因為網絡(AI 公司從中獲取大量訓練數據的地方)正充斥着 AI 垃圾。內容農場正在使用 AI 來創建點擊誘餌。機器人充斥着 Reddit 和 X。據估計,到 2026 年,90% 的網絡可能都是 AI 生成的。 這種“污染”,如果你願意的話,已經使得從訓練數據集中徹底過濾 AI 輸出變得相當困難。 DeepSeek 直接在 ChatGPT 生成的文本上訓練 DeepSeek V3 是完全有可能的。畢竟,谷歌曾經被指控做過同樣的事情。 非營利組織 AI Now Institute 的首席 AI 科學家 Heidy Khlaaf 表示,無論風險如何,“提煉”現有模型知識所帶來的成本節省對開發人員來說都是有吸引力的。 “即使現在互聯網數據充斥着 AI 輸出,其他意外地在 ChatGPT 或 GPT-4 輸出上進行訓練的模型也不一定能展示出讓人聯想到 OpenAI 定製消息的輸出,”Khlaaf 說。“如果 DeepSeek 部分使用 OpenAI 模型進行提煉,那就不足為奇了。” 然而,更有可能的是,大量 ChatGPT/GPT-4 數據進入了 DeepSeek V3 訓練集。這意味着該模型不能被信任進行自我識別。但更令人擔憂的是,DeepSeek V3 可能會通過不加批判地吸收和迭代 GPT-4 的輸出,加劇該模型的一些偏見和缺陷。 TechCrunch 有一份以 AI 為重點的新聞通訊!在此處註冊,每周三在您的收件箱中收到它。 本文最初發表於 TechCrunch,網址為 https://techcrunch.com/2024/12/27/why-deepseeks-new-ai-model-thinks-its-chatgpt/ |
|
|
![]() | ||
|
![]() |
| 實用資訊 | |
|
|
| 一周點擊熱帖 | 更多>> |
| 一周回復熱帖 |
| 歷史上的今天:回復熱帖 |
| 2024: | 演藝界、左煤和豬黨政客聯手打壓川普, | |
| 2024: | 天文物理學家霍金也是愛逼斯坦小島的常 | |
| 2023: | 川普給龜頭“老婆” 起個外號: Coco C | |
| 2023: | 美國共和黨內鬥,如同當年文革的前夕 | |
| 2022: | 台灣間諜 | |
| 2022: | 須菩提,於意云何,如來昔在燃燈佛所 | |
| 2021: | 人和物一樣,不喜歡的離遠點 | |
| 2021: | 版主應給我證明 | |
| 2020: | 一場人性危機正在蔓延,99%的人還不知道 | |
| 2020: | 艾未斥美恐怖襲擊劉中堂待籤條款太丟人 | |






