- +1
百度回應文心一言文生圖質疑:能力來自跨模態(tài)大模型,數(shù)據(jù)使用符合行業(yè)慣例
百度回應外界對文心一言生圖功能的質疑。
3月23日,百度方面向澎湃新聞記者表示,文心一言完全是百度自研的大語言模型,文生圖能力來自文心跨模態(tài)大模型ERNIE-ViLG,“在大模型訓練中,我們使用的是互聯(lián)網(wǎng)公開數(shù)據(jù),符合行業(yè)慣例。大家也會從接下來文生圖能力的快速調優(yōu)迭代,看到百度的自研實力?!?/p>
百度表示:“文心一言正在大家的使用過程中不斷學習和成長,請大家給自研技術和產(chǎn)品一點信心和時間,不傳謠信謠,也希望文心一言能夠給大家?guī)砀鄽g樂?!?/p>
據(jù)悉,近日有網(wǎng)友通過對文心一言的測試,對文心一言提出質疑。有博主在微博發(fā)文稱,百度的人工智能,是將中文句子機翻成英語單詞,用國外開源的人工智能Stable Diffusion生成圖片,然后將其返給用戶。
從該博主的測試來看,讓文心一言畫鼠標和總線,其會畫出“老鼠和公共汽車”,因為鼠標和總線的英文單詞分別是mouse和bus;讓其畫起重機,文心一言會畫出一只鶴的頭,因為起重機的英文是crane,這個單詞也有鶴的意思。

3月23日,澎湃記者讓文心一言畫“起重機”,文心一言輸出一幅帶有鶴的圖畫
什么是Stable Diffusion?它是AI文生圖模型,背后的公司是Stability AI,這家倫敦的初創(chuàng)公司在2022年8月向大眾發(fā)布了一個文本生成圖片工具Stable Diffusion,該工具被迅速傳播,通過用戶的反饋不斷進化,有人稱,這個生成式潘多拉盒子被打開了,而OpenAI迅速效仿,放開了Dall-E 2(OpenAI文本生成圖像系統(tǒng))的限制。
對于文心一言的作畫功能是否“套皮”,亞洲視覺科技研發(fā)總監(jiān)、微博新知博主@風云學會陳經(jīng)表示,百度是自己訓練的,但是拿英文標注的開源圖片做素材,中翻英當prompt(顯示提示對話框),百度正在快速改進,套皮是不好改的。
該人士指出,現(xiàn)在全球AI研發(fā)有開源傳統(tǒng),特別是訓練數(shù)據(jù)庫,不然大家自己收集圖片效率太低,“也有中文標準的訓練數(shù)據(jù),但是很少,對于研究問題意義不大,英文標準和中文標注只是一個工程問題,不影響算法進步的實質。百度能訓練出畫圖AI,但是中文輸入詞還沒搞定,估計是沒時間,因為發(fā)布會時間已經(jīng)定了,所以弄個簡單的中翻英來應對?!?/p>
一位不愿具名的AI人士也向澎湃新聞記者表示:“百度不至于套殼,大概率是用了公開素材用于模型訓練,為求快把英文直接機器翻譯成中文,遇到成語就翻車,比如,車水馬龍拆成車/水/馬/龍,此前百度推出的文心一格是單純的文生圖,不大會出現(xiàn)這個問題,而文心一言是對話+圖片生成,問題就出來了?!?/p>
從百度目前發(fā)布的信息來看,其還將在下周一舉行新品發(fā)布會,發(fā)布系列文心一言云服務和應用產(chǎn)品,百度稱,不同類型的企業(yè)可以依據(jù)自己需求,選取相應的云服務和產(chǎn)品,方便、快捷、低成本地構建自己的模型和應用。
百度CEO李彥宏表示:“文心一言是否會顛覆百度搜索,這離我們的真實想法差得真是太遠太遠了。我從來不覺得商業(yè)模式會是個問題,總有辦法解決。我真正興奮的是,對百度來說,更大的故事在云計算。文心一言帶來的優(yōu)勢,讓百度智能云有可能成為市場第一?!?/p>





- 報料熱線: 021-962866
- 報料郵箱: news@thepaper.cn
互聯(lián)網(wǎng)新聞信息服務許可證:31120170006
增值電信業(yè)務經(jīng)營許可證:滬B2-2017116
? 2014-2026 上海東方報業(yè)有限公司




