12月30日|據每經,“DeepSeek-V3超越了迄今為止所有開源模型。”這是國外獨立評測機構Artificial Analysis測試了DeepSeek-V3後得出的結論。更重要的是,該模型使用英偉達H800 GPU在短短兩個月內就訓練出了DeepSeek-V3,僅花費了約558萬美元。然而,在使用過程中,記者發現,DeepSeek-V3竟然聲稱自己是ChatGPT。一時間,“DeepSeek-V3是否在使用ChatGPT輸出內容進行訓練”的質疑聲四起。TechCrunch猜測稱,深度求索可能用了包含GPT-4通過ChatGPT生成的文本的公共數據集。“如果DeepSeek-V3是用這些數據進行訓練的,那麼該模型可能已經記住了GPT-4的一些輸出,現在正在逐字反芻它們。”不過,DeepSeek-V3也並非是第一個錯誤識別自己的模型,谷歌的Gemini等有時也會聲稱是競爭模型。例如,Gemini在普通話提示下稱自己是百度的文心一言聊天機器人。造成這種情況的原因可能在於,AI公司在互聯網上獲取大量訓練數據,但是,現如今的互聯網本就充斥着各種各樣用AI生產出來的數據。
新聞來源 (不包括新聞圖片): 格隆匯