百度回應文心一言文生圖質疑：能力來自跨模態(tài)大模型，數(shù)據(jù)使用符合行業(yè)慣例

澎湃新聞記者吳雨欣

2023-03-23 11:13

來源：澎湃新聞

? 10%公司 >

聽全文

百度回應外界對文心一言生圖功能的質疑。

3月23日，百度方面向澎湃新聞記者表示，文心一言完全是百度自研的大語言模型，文生圖能力來自文心跨模態(tài)大模型ERNIE-ViLG，“在大模型訓練中，我們使用的是互聯(lián)網(wǎng)公開數(shù)據(jù)，符合行業(yè)慣例。大家也會從接下來文生圖能力的快速調優(yōu)迭代，看到百度的自研實力?！?/p>

百度表示：“文心一言正在大家的使用過程中不斷學習和成長，請大家給自研技術和產(chǎn)品一點信心和時間，不傳謠信謠，也希望文心一言能夠給大家?guī)砀鄽g樂?！?/p>

據(jù)悉，近日有網(wǎng)友通過對文心一言的測試，對文心一言提出質疑。有博主在微博發(fā)文稱，百度的人工智能，是將中文句子機翻成英語單詞，用國外開源的人工智能Stable Diffusion生成圖片，然后將其返給用戶。

從該博主的測試來看，讓文心一言畫鼠標和總線，其會畫出“老鼠和公共汽車”，因為鼠標和總線的英文單詞分別是mouse和bus；讓其畫起重機，文心一言會畫出一只鶴的頭，因為起重機的英文是crane，這個單詞也有鶴的意思。

3月23日，澎湃記者讓文心一言畫“起重機”，文心一言輸出一幅帶有鶴的圖畫

什么是Stable Diffusion？它是AI文生圖模型，背后的公司是Stability AI，這家倫敦的初創(chuàng)公司在2022年8月向大眾發(fā)布了一個文本生成圖片工具Stable Diffusion，該工具被迅速傳播，通過用戶的反饋不斷進化，有人稱，這個生成式潘多拉盒子被打開了，而OpenAI迅速效仿，放開了Dall-E 2（OpenAI文本生成圖像系統(tǒng)）的限制。

對于文心一言的作畫功能是否“套皮”，亞洲視覺科技研發(fā)總監(jiān)、微博新知博主@風云學會陳經(jīng)表示，百度是自己訓練的，但是拿英文標注的開源圖片做素材，中翻英當prompt（顯示提示對話框），百度正在快速改進，套皮是不好改的。

該人士指出，現(xiàn)在全球AI研發(fā)有開源傳統(tǒng)，特別是訓練數(shù)據(jù)庫，不然大家自己收集圖片效率太低，“也有中文標準的訓練數(shù)據(jù)，但是很少，對于研究問題意義不大，英文標準和中文標注只是一個工程問題，不影響算法進步的實質。百度能訓練出畫圖AI，但是中文輸入詞還沒搞定，估計是沒時間，因為發(fā)布會時間已經(jīng)定了，所以弄個簡單的中翻英來應對?！?/p>

一位不愿具名的AI人士也向澎湃新聞記者表示：“百度不至于套殼，大概率是用了公開素材用于模型訓練，為求快把英文直接機器翻譯成中文，遇到成語就翻車，比如，車水馬龍拆成車/水/馬/龍，此前百度推出的文心一格是單純的文生圖，不大會出現(xiàn)這個問題，而文心一言是對話+圖片生成，問題就出來了?！?/p>從百度目前發(fā)布的信息來看，其還將在下周一舉行新品發(fā)布會，發(fā)布系列文心一言云服務和應用產(chǎn)品，百度稱，不同類型的企業(yè)可以依據(jù)自己需求，選取相應的云服務和產(chǎn)品，方便、快捷、低成本地構建自己的模型和應用。