123,123

4月，國內(nèi)大模型遍地開花

2023-04-17 14:53

作者 | 元鵝 Julie張

ChatGPT的火熱掀起了國內(nèi)外對大模型的探索熱情，即便是一邊呼吁暫停AI研究以防“失控的人工智能”的馬斯克，近期也被曝正在推特內(nèi)部啟動(dòng)人工智能項(xiàng)目。

不管是差GPT“2個(gè)月”還是“3年”，國內(nèi)大模型一夜之間已經(jīng)遍地開花。繼百度打響國內(nèi)大模型第一槍后，目前阿里、京東、華為等互聯(lián)網(wǎng)大廠，商湯、昆侖萬維等科技公司也紛紛推出了自家的大模型，包括內(nèi)容平臺(tái)知乎也在4月13日推出了中文大模型“知海圖AI”。

另一邊，王小川、王慧文等互聯(lián)網(wǎng)大佬的大模型也有了新進(jìn)展。在獲得5000萬美元啟動(dòng)資金后，4月10日，王小川官宣AI大模型公司“百川智能”；王慧文的 “光年之外”在A 輪融資后估值已達(dá)到10億美元。

接下來大模型的熱潮將繼續(xù)。雖然沒有直接推出大模型產(chǎn)品，但騰訊已經(jīng)發(fā)布“國內(nèi)性能最強(qiáng)的大模型算力集群”，同花順、科大訊飛等正在跑步入場。

與此同時(shí)，有關(guān)大模型的討論也在繼續(xù)，我們需要這么多大模型嗎？在這場大模型的同臺(tái)競技中，誰能最終脫穎而出，打造出中國的OpenAI？

百度“文心一言”大語言模型

被稱為中國版ChatGPT的百度“文心一言”于3月16日14：00在百度北京總部大樓正式發(fā)布。百度在會(huì)上用PPT展示了文心一言在文學(xué)創(chuàng)作、商業(yè)文案創(chuàng)作、數(shù)理推算、中文理解、多模態(tài)生成五個(gè)使用場景中的綜合能力。

百度同時(shí)公布了文心一言的邀請測試方案。發(fā)布會(huì)后一小時(shí)內(nèi)，排隊(duì)申請文心一言企業(yè)版API調(diào)用服務(wù)測試的企業(yè)用戶已達(dá)3萬多家，申請產(chǎn)品測試網(wǎng)頁多次被擠爆。截至3月27日，百度文心一言已收到12萬家企業(yè)申請測試。

從港股市場表現(xiàn)來看，發(fā)布會(huì)當(dāng)天，百度港股一度跳水跌超10%，百度當(dāng)日股價(jià)最終跌近8%。但第二天，百度港股又大漲13.67%。

不過，作為國內(nèi)第一款官宣的大模型，文心一言被追捧，也被質(zhì)疑。

在發(fā)布會(huì)結(jié)束大約一周后，文心一言深陷套皮質(zhì)疑。

微博博主“劉大可先生”發(fā)文質(zhì)疑文心一言文生圖功能抄襲“StableDiffusion”，同時(shí)在中文語義理解方面存在局限。他稱，找到了對文心一言更多的不利證據(jù)，恐怕是和漢芯、鴻蒙一樣的東西：套殼、畫皮、造假。

3月23日，百度官博發(fā)文稱，注意到對文心一言文生圖功能的相關(guān)反饋，并針對質(zhì)疑做出澄清。百度稱，文心一言完全是百度自研的大語言模型，在大模型訓(xùn)練中，其使用的是互聯(lián)網(wǎng)公開數(shù)據(jù)，符合行業(yè)慣例。

3月27日，百度正式推出“文心千帆”大模型平臺(tái)。文心千帆大模型平臺(tái)，整合了百度全套文心大模型、相應(yīng)的開發(fā)工具鏈，未來還會(huì)支持第三方的開源大模型。在現(xiàn)場實(shí)時(shí)演示中，文心千帆可實(shí)現(xiàn)三分鐘做ppt、數(shù)字人直播帶貨、訂機(jī)票和酒店等操作。

4月3日，百度地圖V18版本發(fā)布。該版本由文心交通大模型和生成式AI提供底層支撐，可面向?qū)崟r(shí)交通實(shí)現(xiàn)刻畫、感知、預(yù)測、調(diào)度的端到端優(yōu)化。一同發(fā)布的還有領(lǐng)航數(shù)字人葉悠悠。介紹稱，葉悠悠可與車主實(shí)現(xiàn)擬人級語音交互。

阿里云“通義千問” 大語言模型

4月7日，在阿里云峰會(huì)上，阿里云大語言模型“通義千問”正式推出。

據(jù)介紹，通義千問是一個(gè)超大規(guī)模的語言模型，功能包括多輪對話、文案創(chuàng)作、邏輯推理、多模態(tài)理解、多語言支持，能夠幫助用戶續(xù)寫小說，編寫郵件等�，F(xiàn)階段該模型主要定向邀請企業(yè)用戶進(jìn)行體驗(yàn)測試。

另外，阿里巴巴決定未來將所有產(chǎn)品接入通義千問，進(jìn)行全面改造。據(jù)悉，釘釘、天貓精靈將率先接入通義千問測試，評估認(rèn)證后正式發(fā)布新功能。阿里巴巴集團(tuán)董事會(huì)主席兼CEO、阿里云智能集團(tuán)CEO張勇表示，面向AI時(shí)代，所有產(chǎn)品都值得用大模型重做一次。

目前，通義千問僅支持自然語言處理，尚不支持文生圖等跨模態(tài)功能，不過有知情人士稱，后續(xù)通義千問也會(huì)盡快推出相關(guān)大模型，能夠支持更多功能。

早在去年9月，阿里巴巴就已經(jīng)發(fā)布了通義大模型系列，包括通義M6、Alice mine以及視覺模型。單一模型可同時(shí)處理圖像描述、視覺定位、文生圖、視覺蘊(yùn)含、文檔摘要等10余項(xiàng)單模態(tài)和跨模態(tài)任務(wù)。資源消耗也不高，以當(dāng)時(shí)通義系列中的M6大模型為例，相同參數(shù)規(guī)模下訓(xùn)練能耗僅是GPT-3的1%。

華為“盤古系列AI大模型”

4月8日至9日，由中國人工智能學(xué)會(huì)主辦的人工智能大模型技術(shù)高峰論壇將在杭州蕭山舉辦。有媒體從華為云官網(wǎng)推測，華為即將上線的“盤古系列AI大模型”分別為NLP大模型、CV大模型、科學(xué)計(jì)算大模型（氣象大模型）。

其中NLP大模型是被認(rèn)為最接近人類中文理解能力的AI大模型，而CV大模型首次兼顧了圖像判別與生成能力。盤古CV大模型覆蓋了工業(yè)質(zhì)檢、物流倉庫監(jiān)控、時(shí)尚輔助設(shè)計(jì)等行業(yè)；盤古NLP大模型覆蓋了智能文檔檢索、智能ERP、小語種大模型等領(lǐng)域。

4月10日消息，針對上述情況，華為云方面暫未回應(yīng)。

與此同時(shí)，有媒體經(jīng)從華為云官方微信、微博等官方渠道查證，華為云從未明確表示4月將發(fā)布新的大模型，也從未透露過有關(guān)盤古大模型的產(chǎn)品計(jì)劃。華為云人工智能領(lǐng)域首席科學(xué)家田奇也并未在本次論壇中透露盤古大模型的產(chǎn)品上市計(jì)劃。知情人士透露，華為云即將上線盤古系列AI大模型疑似資本炒作。

商湯日日新大模型

4月10日，商湯科技董事長兼首席執(zhí)行官徐立宣布推出大模型體系商湯日日新大模型體系。據(jù)悉，日日新大模型體系主要包括自然語言生成、文生圖、感知模型標(biāo)注、以及模型研發(fā)功能，即“商量（中文語言模型）”、“秒畫（文生圖）”、“如影（數(shù)字人視頻生成）”、“瓊宇（場景生成）”，“格物（物體生成）”。

商量：使用大量數(shù)據(jù)訓(xùn)練，并充分考慮了中文語境，能夠更好地理解和處理中文文本。

秒畫：可幫助用戶輕松地創(chuàng)作高質(zhì)量的藝術(shù)作品，自動(dòng)生成元素和細(xì)節(jié)。

如影：可以幫助用戶輕松創(chuàng)作視頻，支持AI數(shù)字人動(dòng)作表情、AI文案生成、AI跨語言文稿、AI素材生成的全棧式智能創(chuàng)作，卡通/真實(shí)多風(fēng)格變換自如。

瓊宇、格物：它們是商湯科技基于神經(jīng)輻射場技術(shù)（NeRF）的3D內(nèi)容生成平臺(tái)，可基于3D內(nèi)容生成技術(shù)實(shí)現(xiàn)對空間和物體的復(fù)刻與交互，大到城市數(shù)字孿生，小到桌面手辦，都能逼真復(fù)刻。

商湯方面表示，該技術(shù)主要面向B端，商湯日日新大模型體系目前僅面向政企客戶開放API接口，客戶可登錄商湯官網(wǎng)申請。

不過，商湯在現(xiàn)場展示秒畫時(shí)，有眼尖的網(wǎng)友發(fā)現(xiàn)商湯所演示的精選模型中出現(xiàn)AI模型站civitai的圖片，該模型底部有顯示civitai的文字水印，引發(fā)了網(wǎng)絡(luò)質(zhì)疑。

對此，商湯方面表示：秒畫SenseMirage包含商湯自研AIGC大模型，也提供第三方社區(qū)開源模型，支持導(dǎo)入多個(gè)平臺(tái)的開源模型或上傳用戶本地模型。用戶可免除本地化部署流程，并基于開源模型自訓(xùn)練模型，高效地生成更多樣的內(nèi)容。”在現(xiàn)場演示中，該模型底部有顯示civitai的文字注釋。

科大訊飛 “1+N認(rèn)知智能大模型”

在今年3月舉行的滬港創(chuàng)新發(fā)展論壇上，科大訊飛集團(tuán)總裁吳曉如表示，以ChatGPT為代表的技術(shù)表明機(jī)器在自然語言的處理能力上已實(shí)現(xiàn)質(zhì)的飛躍，應(yīng)該看到和Open AI的差距并迎頭追上�？拼笥嶏w已儲(chǔ)備了一段時(shí)間，很快會(huì)發(fā)布自己的大模型技術(shù)。

4月11日，科大訊飛在互動(dòng)平臺(tái)表示，訊飛依托認(rèn)知智能全國重點(diǎn)實(shí)驗(yàn)室的長期積累，于2022年12月份啟動(dòng)生成式預(yù)訓(xùn)練大模型“1+N”任務(wù)攻關(guān)，其中“1”是通用認(rèn)知智能大模型算法研發(fā)及高效訓(xùn)練底座平臺(tái)，“N”是應(yīng)用于教育、醫(yī)療、人機(jī)交互、辦公、翻譯、工業(yè)等多個(gè)行業(yè)領(lǐng)域的專用大模型版本。

關(guān)于訊飛預(yù)訓(xùn)練大模型的詳細(xì)信息將于2023年5月6日產(chǎn)品發(fā)布會(huì)上進(jìn)行發(fā)布。

受此消息影響，科大訊飛和人工智能板塊大漲。

昆侖萬維 “天工”3.5大語言模型

4月10日，昆侖萬維宣布，其和奇點(diǎn)智源合作自研、中國第一個(gè)真正實(shí)現(xiàn)智能涌現(xiàn)的國產(chǎn)大語言模型 ——“天工”3.5 發(fā)布在即，并將于 4 月 17 日啟動(dòng)邀請測試。未來，“天工”4 和“天工”5 也將與大家見面。

“天工”大模型已經(jīng)非常接近OpenAI ChatGPT的智能水平。ChatGPT是基于GPT3.5大模型，因此昆侖萬維把此版本命名為“天工”3.5。“天工”作為一款大型語言模型，擁有強(qiáng)大的自然語言處理和智能交互能力，能夠?qū)崿F(xiàn)智能問答、聊天互動(dòng)、文本生成等多種應(yīng)用場景。

4月11日，昆侖萬維在前一天暴跌之后，當(dāng)天強(qiáng)勢反彈大漲9.5%，其中盤中最高上漲近16%。

與此同時(shí)，昆侖萬維4月11日收深交所關(guān)注函，要求說明“天工”3.5可能面臨的風(fēng)險(xiǎn)。

4月13日，昆侖萬維回復(fù)深交所關(guān)注函時(shí)表示，“天工”3.5可能面臨的風(fēng)險(xiǎn)包括：技術(shù)研發(fā)進(jìn)展不及預(yù)期的風(fēng)險(xiǎn)；應(yīng)用實(shí)踐商業(yè)化不及預(yù)期風(fēng)險(xiǎn)等。昆侖萬維表示，目前公司AIGC、人工智能等業(yè)務(wù)產(chǎn)品尚未產(chǎn)生實(shí)際收入，預(yù)計(jì)對公司2023年財(cái)務(wù)狀況不會(huì)產(chǎn)生較大貢獻(xiàn)。

知乎“知海圖AI”中文大模型

4月13日，知乎創(chuàng)始人、董事長兼CEO周源在“2023知乎發(fā)現(xiàn)大會(huì)”上宣布，知乎聯(lián)合面壁智能發(fā)布中文大模型“知海圖AI”，邀請AI加入知乎“討論場”。

知乎方面表示，在特定場景中，把“知海圖AI”大模型的效果與GPT-4進(jìn)行了比較，兩個(gè)模型幾乎是持平的。

“知海圖AI”中文大模型已經(jīng)運(yùn)用進(jìn)了知乎熱榜，知乎首個(gè)大模型功能“熱榜摘要”上線并開啟內(nèi)測，利用超強(qiáng)的語言理解能力對知乎熱榜上的問題回答進(jìn)行抓取、整理和聚合，并把回答梗概展現(xiàn)給用戶。

受此消息影響，知乎美股盤前一度暴漲15%。

據(jù)悉，“知海圖AI”是基于面壁智能自主研發(fā)的CPM企業(yè)級大模型與ModelForce大模型系統(tǒng)。

面壁智能團(tuán)隊(duì)早在2020年底就發(fā)布了首個(gè)中文大語言模型CPM-1，三年時(shí)間內(nèi)又陸續(xù)發(fā)布了CPM-2、CPM-3和CPM-Ant、CPM-Bee等開源模型。

毫末智行“雪湖·海若”自動(dòng)駕駛算法模型

4月11日，毫末智行正式官宣首個(gè)應(yīng)用GPT模型和技術(shù)邏輯的自動(dòng)駕駛算法模型，中文名“雪湖·海若”。

該自動(dòng)駕駛生成式大模型“雪湖·海若”通過引入駕駛數(shù)據(jù)建立RLHF（人類反饋強(qiáng)化學(xué)習(xí)）技術(shù)，對自動(dòng)駕駛認(rèn)知決策模型進(jìn)行持續(xù)優(yōu)化，最終實(shí)現(xiàn)端到端自動(dòng)駕駛。

據(jù)介紹，“雪湖·海若”通過引入駕駛數(shù)據(jù)建立RLHF技術(shù)，對自動(dòng)駕駛認(rèn)知決策模型進(jìn)行持續(xù)優(yōu)化，最終目標(biāo)是實(shí)現(xiàn)端到端自動(dòng)駕駛，現(xiàn)階段主要用于解決自動(dòng)駕駛的認(rèn)知決策問題。

目前，“雪湖·海若”實(shí)現(xiàn)了模型架構(gòu)與參數(shù)規(guī)模的升級，參數(shù)規(guī)模達(dá)到1200億，預(yù)訓(xùn)練階段引入4000萬公里量產(chǎn)車駕駛數(shù)據(jù)。

據(jù)了解，2021年，毫末智行在推出數(shù)據(jù)智能體系MANA的同時(shí)，也宣布要借助大模型提升數(shù)據(jù)處理能力，從而加速HPilot智能輔助駕駛產(chǎn)品的進(jìn)化。

王小川成立“百川智能”

4月10日，搜狗創(chuàng)始人王小川正式宣布入局中國大模型創(chuàng)業(yè)，和前搜狗COO茹立云聯(lián)合創(chuàng)立人工智能公司，旨在打造中國版的OpenAI基礎(chǔ)大模型及顛覆性上層應(yīng)用。

王小川在公開信中表示，新公司名為“百川智能”，目前已初步組建了50人的團(tuán)隊(duì)，獲5000萬美元啟動(dòng)資金，爭取年內(nèi)發(fā)布國內(nèi)最好的大模型和顛覆性的產(chǎn)品。

據(jù)悉，百川智能以前搜狗團(tuán)隊(duì)為基礎(chǔ)，快速融合了來自百度、華為、微軟、字節(jié)、騰訊等知名科技公司以及其他創(chuàng)業(yè)公司核心成員在內(nèi)的數(shù)十位頂尖AI人才。

值得一提的是，近日，王小川與百度副總裁肖陽就國內(nèi)大模型發(fā)展與OpenAI之間的差距問題，隔空打起了嘴仗。

這場嘴仗源于王小川對李彥宏談及“百度的文心一言和OpenAI差距可能在兩個(gè)月左右”的觀點(diǎn)不認(rèn)同。王小川表示：“怎么可能只差兩個(gè)月？那一定是（在）另一個(gè)宇宙。”如果用時(shí)間衡量的話，王小川認(rèn)為OpenAI比國內(nèi)領(lǐng)先三年時(shí)間。

針對上述觀點(diǎn)，百度副總裁肖陽回應(yīng)稱：“百度做AI，始終相信長期主義的價(jià)值。我們向來不回避與國外的差距，但是這個(gè)差距到底在什么位置，一線的都懂。天上一天，人間一年，王小川脫離一線太久，確實(shí)跟我們不在一個(gè)宇宙。”

今日凌晨，王小川回懟了百度副總裁肖陽的言論。王小川稱，“什么樣的平行宇宙里，才能做到讓一個(gè)脫離一線15年的人，去懟一個(gè)脫離一線1.5年的人。”

馬斯克被曝入局大模型

據(jù)外媒援引知情人士稱，特斯拉CEO埃隆·馬斯克近日在推特內(nèi)部啟動(dòng)了一項(xiàng)人工智能項(xiàng)目，用于公司的兩個(gè)數(shù)據(jù)中心之一。

知情人士透露，盡管馬斯克簽署了呼吁暫停人工智能開發(fā)6個(gè)月的公開信，但其卻暗中在推特推進(jìn)新的生成式人工智能（AIGC）項(xiàng)目，并為此購買了上萬個(gè)GPU（圖形處理器），還從谷歌的人工智能部門DeepMind招募了人才。

該項(xiàng)目涉及創(chuàng)建一個(gè)生成式人工智能，推特將根據(jù)自己的海量數(shù)據(jù)進(jìn)行訓(xùn)練。一位消息人士稱，如果推特不打算將它們用于AI工作，幾乎沒有理由在數(shù)據(jù)中心級GPU上花費(fèi)這么多錢。

知情人士稱，馬斯克的人工智能項(xiàng)目還處于早期階段，盡管其購買如此多的額外計(jì)算能力表明他對這個(gè)項(xiàng)目給予了很大期望。

此外，今年2月，馬斯克與人工智能研究人員接洽，商討成立一個(gè)新的研究實(shí)驗(yàn)室，以開發(fā)ChatGPT的競爭對手。

值得一提的是，他不止一次在公開場合稱人工智能是一項(xiàng)危險(xiǎn)的技術(shù)。就在幾周前，他還和人工智能研究界和產(chǎn)業(yè)界的大佬們一起簽署了一篇公開信，呼吁全球所有實(shí)驗(yàn)室暫停比GPT-4更強(qiáng)的AI模型研發(fā)，暫停時(shí)間至少為6個(gè)月。

（鞭牛士整理自澎湃、36kr、第一財(cái)經(jīng)、每日經(jīng)濟(jì)新聞等）

原文標(biāo)題 : 4月，國內(nèi)大模型遍地開花