4月,國內(nèi)大模型遍地開花
作者 | 元鵝 Julie張
ChatGPT的火熱掀起了國內(nèi)外對大模型的探索熱情,即便是一邊呼吁暫停AI研究以防“失控的人工智能”的馬斯克,近期也被曝正在推特內(nèi)部啟動人工智能項目。
不管是差GPT“2個月”還是“3年”,國內(nèi)大模型一夜之間已經(jīng)遍地開花。繼百度打響國內(nèi)大模型第一槍后,目前阿里、京東、華為等互聯(lián)網(wǎng)大廠,商湯、昆侖萬維等科技公司也紛紛推出了自家的大模型,包括內(nèi)容平臺知乎也在4月13日推出了中文大模型“知海圖AI”。
另一邊,王小川、王慧文等互聯(lián)網(wǎng)大佬的大模型也有了新進(jìn)展。在獲得5000萬美元啟動資金后,4月10日,王小川官宣AI大模型公司“百川智能”;王慧文的 “光年之外”在A 輪融資后估值已達(dá)到10億美元。
接下來大模型的熱潮將繼續(xù)。雖然沒有直接推出大模型產(chǎn)品,但騰訊已經(jīng)發(fā)布“國內(nèi)性能最強的大模型算力集群”,同花順、科大訊飛等正在跑步入場。
與此同時,有關(guān)大模型的討論也在繼續(xù),我們需要這么多大模型嗎?在這場大模型的同臺競技中,誰能最終脫穎而出,打造出中國的OpenAI?
百度“文心一言”大語言模型
被稱為中國版ChatGPT的百度“文心一言”于3月16日14:00在百度北京總部大樓正式發(fā)布。百度在會上用PPT展示了文心一言在文學(xué)創(chuàng)作、商業(yè)文案創(chuàng)作、數(shù)理推算、中文理解、多模態(tài)生成五個使用場景中的綜合能力。
百度同時公布了文心一言的邀請測試方案。發(fā)布會后一小時內(nèi),排隊申請文心一言企業(yè)版API調(diào)用服務(wù)測試的企業(yè)用戶已達(dá)3萬多家,申請產(chǎn)品測試網(wǎng)頁多次被擠爆。截至3月27日,百度文心一言已收到12萬家企業(yè)申請測試。
從港股市場表現(xiàn)來看,發(fā)布會當(dāng)天,百度港股一度跳水跌超10%,百度當(dāng)日股價最終跌近8%。但第二天,百度港股又大漲13.67%。
不過,作為國內(nèi)第一款官宣的大模型,文心一言被追捧,也被質(zhì)疑。
在發(fā)布會結(jié)束大約一周后,文心一言深陷套皮質(zhì)疑。
微博博主“劉大可先生”發(fā)文質(zhì)疑文心一言文生圖功能抄襲“StableDiffusion”,同時在中文語義理解方面存在局限。他稱,找到了對文心一言更多的不利證據(jù),恐怕是和漢芯、鴻蒙一樣的東西:套殼、畫皮、造假。
3月23日,百度官博發(fā)文稱,注意到對文心一言文生圖功能的相關(guān)反饋,并針對質(zhì)疑做出澄清。百度稱,文心一言完全是百度自研的大語言模型,在大模型訓(xùn)練中,其使用的是互聯(lián)網(wǎng)公開數(shù)據(jù),符合行業(yè)慣例。
3月27日,百度正式推出“文心千帆”大模型平臺。文心千帆大模型平臺,整合了百度全套文心大模型、相應(yīng)的開發(fā)工具鏈,未來還會支持第三方的開源大模型。在現(xiàn)場實時演示中,文心千帆可實現(xiàn)三分鐘做ppt、數(shù)字人直播帶貨、訂機票和酒店等操作。
4月3日,百度地圖V18版本發(fā)布。該版本由文心交通大模型和生成式AI提供底層支撐,可面向?qū)崟r交通實現(xiàn)刻畫、感知、預(yù)測、調(diào)度的端到端優(yōu)化。一同發(fā)布的還有領(lǐng)航數(shù)字人葉悠悠。介紹稱,葉悠悠可與車主實現(xiàn)擬人級語音交互。
阿里云“通義千問” 大語言模型
4月7日,在阿里云峰會上,阿里云大語言模型“通義千問”正式推出。
據(jù)介紹,通義千問是一個超大規(guī)模的語言模型,功能包括多輪對話、文案創(chuàng)作、邏輯推理、多模態(tài)理解、多語言支持,能夠幫助用戶續(xù)寫小說,編寫郵件等,F(xiàn)階段該模型主要定向邀請企業(yè)用戶進(jìn)行體驗測試。
另外,阿里巴巴決定未來將所有產(chǎn)品接入通義千問,進(jìn)行全面改造。據(jù)悉,釘釘、天貓精靈將率先接入通義千問測試,評估認(rèn)證后正式發(fā)布新功能。阿里巴巴集團董事會主席兼CEO、阿里云智能集團CEO張勇表示,面向AI時代,所有產(chǎn)品都值得用大模型重做一次。
目前,通義千問僅支持自然語言處理,尚不支持文生圖等跨模態(tài)功能,不過有知情人士稱,后續(xù)通義千問也會盡快推出相關(guān)大模型,能夠支持更多功能。
早在去年9月,阿里巴巴就已經(jīng)發(fā)布了通義大模型系列,包括通義M6、Alice mine以及視覺模型。單一模型可同時處理圖像描述、視覺定位、文生圖、視覺蘊含、文檔摘要等10余項單模態(tài)和跨模態(tài)任務(wù)。資源消耗也不高,以當(dāng)時通義系列中的M6大模型為例,相同參數(shù)規(guī)模下訓(xùn)練能耗僅是GPT-3的1%。
華為“盤古系列AI大模型”
4月8日至9日,由中國人工智能學(xué)會主辦的人工智能大模型技術(shù)高峰論壇將在杭州蕭山舉辦。有媒體從華為云官網(wǎng)推測,華為即將上線的“盤古系列AI大模型”分別為NLP大模型、CV大模型、科學(xué)計算大模型(氣象大模型)。
其中NLP大模型是被認(rèn)為最接近人類中文理解能力的AI大模型,而CV大模型首次兼顧了圖像判別與生成能力。盤古CV大模型覆蓋了工業(yè)質(zhì)檢、物流倉庫監(jiān)控、時尚輔助設(shè)計等行業(yè);盤古NLP大模型覆蓋了智能文檔檢索、智能ERP、小語種大模型等領(lǐng)域。
4月10日消息,針對上述情況,華為云方面暫未回應(yīng)。
與此同時,有媒體經(jīng)從華為云官方微信、微博等官方渠道查證,華為云從未明確表示4月將發(fā)布新的大模型,也從未透露過有關(guān)盤古大模型的產(chǎn)品計劃。華為云人工智能領(lǐng)域首席科學(xué)家田奇也并未在本次論壇中透露盤古大模型的產(chǎn)品上市計劃。知情人士透露,華為云即將上線盤古系列AI大模型疑似資本炒作。
商湯日日新大模型
4月10日,商湯科技董事長兼首席執(zhí)行官徐立宣布推出大模型體系商湯日日新大模型體系。據(jù)悉,日日新大模型體系主要包括自然語言生成、文生圖、感知模型標(biāo)注、以及模型研發(fā)功能,即“商量(中文語言模型)”、“秒畫(文生圖)”、“如影(數(shù)字人視頻生成)”、“瓊宇(場景生成)”,“格物(物體生成)”。
商量:使用大量數(shù)據(jù)訓(xùn)練,并充分考慮了中文語境,能夠更好地理解和處理中文文本。
秒畫:可幫助用戶輕松地創(chuàng)作高質(zhì)量的藝術(shù)作品,自動生成元素和細(xì)節(jié)。
如影:可以幫助用戶輕松創(chuàng)作視頻,支持AI數(shù)字人動作表情、AI文案生成、AI跨語言文稿、AI素材生成的全棧式智能創(chuàng)作,卡通/真實多風(fēng)格變換自如。
瓊宇、格物:它們是商湯科技基于神經(jīng)輻射場技術(shù)(NeRF)的3D內(nèi)容生成平臺,可基于3D內(nèi)容生成技術(shù)實現(xiàn)對空間和物體的復(fù)刻與交互,大到城市數(shù)字孿生,小到桌面手辦,都能逼真復(fù)刻。
商湯方面表示,該技術(shù)主要面向B端,商湯日日新大模型體系目前僅面向政企客戶開放API接口,客戶可登錄商湯官網(wǎng)申請。
不過,商湯在現(xiàn)場展示秒畫時,有眼尖的網(wǎng)友發(fā)現(xiàn)商湯所演示的精選模型中出現(xiàn)AI模型站civitai的圖片,該模型底部有顯示civitai的文字水印,引發(fā)了網(wǎng)絡(luò)質(zhì)疑。
對此,商湯方面表示:秒畫SenseMirage包含商湯自研AIGC大模型,也提供第三方社區(qū)開源模型,支持導(dǎo)入多個平臺的開源模型或上傳用戶本地模型。用戶可免除本地化部署流程,并基于開源模型自訓(xùn)練模型,高效地生成更多樣的內(nèi)容。”在現(xiàn)場演示中,該模型底部有顯示civitai的文字注釋。
科大訊飛 “1+N認(rèn)知智能大模型”
在今年3月舉行的滬港創(chuàng)新發(fā)展論壇上,科大訊飛集團總裁吳曉如表示,以ChatGPT為代表的技術(shù)表明機器在自然語言的處理能力上已實現(xiàn)質(zhì)的飛躍,應(yīng)該看到和Open AI的差距并迎頭追上?拼笥嶏w已儲備了一段時間,很快會發(fā)布自己的大模型技術(shù)。
4月11日,科大訊飛在互動平臺表示,訊飛依托認(rèn)知智能全國重點實驗室的長期積累,于2022年12月份啟動生成式預(yù)訓(xùn)練大模型“1+N”任務(wù)攻關(guān),其中“1”是通用認(rèn)知智能大模型算法研發(fā)及高效訓(xùn)練底座平臺,“N”是應(yīng)用于教育、醫(yī)療、人機交互、辦公、翻譯、工業(yè)等多個行業(yè)領(lǐng)域的專用大模型版本。
關(guān)于訊飛預(yù)訓(xùn)練大模型的詳細(xì)信息將于2023年5月6日產(chǎn)品發(fā)布會上進(jìn)行發(fā)布。
受此消息影響,科大訊飛和人工智能板塊大漲。
昆侖萬維 “天工”3.5大語言模型
4月10日,昆侖萬維宣布,其和奇點智源合作自研、中國第一個真正實現(xiàn)智能涌現(xiàn)的國產(chǎn)大語言模型 ——“天工”3.5 發(fā)布在即,并將于 4 月 17 日啟動邀請測試。未來,“天工”4 和“天工”5 也將與大家見面。
“天工”大模型已經(jīng)非常接近OpenAI ChatGPT的智能水平。ChatGPT是基于GPT3.5大模型,因此昆侖萬維把此版本命名為“天工”3.5。“天工”作為一款大型語言模型,擁有強大的自然語言處理和智能交互能力,能夠?qū)崿F(xiàn)智能問答、聊天互動、文本生成等多種應(yīng)用場景。
4月11日,昆侖萬維在前一天暴跌之后,當(dāng)天強勢反彈大漲9.5%,其中盤中最高上漲近16%。
與此同時,昆侖萬維4月11日收深交所關(guān)注函,要求說明“天工”3.5可能面臨的風(fēng)險。
4月13日,昆侖萬維回復(fù)深交所關(guān)注函時表示,“天工”3.5可能面臨的風(fēng)險包括:技術(shù)研發(fā)進(jìn)展不及預(yù)期的風(fēng)險;應(yīng)用實踐商業(yè)化不及預(yù)期風(fēng)險等。昆侖萬維表示,目前公司AIGC、人工智能等業(yè)務(wù)產(chǎn)品尚未產(chǎn)生實際收入,預(yù)計對公司2023年財務(wù)狀況不會產(chǎn)生較大貢獻(xiàn)。
知乎“知海圖AI”中文大模型
4月13日,知乎創(chuàng)始人、董事長兼CEO周源在“2023知乎發(fā)現(xiàn)大會”上宣布,知乎聯(lián)合面壁智能發(fā)布中文大模型“知海圖AI”,邀請AI加入知乎“討論場”。
知乎方面表示,在特定場景中,把“知海圖AI”大模型的效果與GPT-4進(jìn)行了比較,兩個模型幾乎是持平的。
“知海圖AI”中文大模型已經(jīng)運用進(jìn)了知乎熱榜,知乎首個大模型功能“熱榜摘要”上線并開啟內(nèi)測,利用超強的語言理解能力對知乎熱榜上的問題回答進(jìn)行抓取、整理和聚合,并把回答梗概展現(xiàn)給用戶。
受此消息影響,知乎美股盤前一度暴漲15%。
據(jù)悉,“知海圖AI”是基于面壁智能自主研發(fā)的CPM企業(yè)級大模型與ModelForce大模型系統(tǒng)。
面壁智能團隊早在2020年底就發(fā)布了首個中文大語言模型CPM-1,三年時間內(nèi)又陸續(xù)發(fā)布了CPM-2、CPM-3和CPM-Ant、CPM-Bee等開源模型。
毫末智行“雪湖·海若”自動駕駛算法模型
4月11日,毫末智行正式官宣首個應(yīng)用GPT模型和技術(shù)邏輯的自動駕駛算法模型,中文名“雪湖·海若”。
該自動駕駛生成式大模型“雪湖·海若”通過引入駕駛數(shù)據(jù)建立RLHF(人類反饋強化學(xué)習(xí))技術(shù),對自動駕駛認(rèn)知決策模型進(jìn)行持續(xù)優(yōu)化,最終實現(xiàn)端到端自動駕駛。
據(jù)介紹,“雪湖·海若”通過引入駕駛數(shù)據(jù)建立RLHF技術(shù),對自動駕駛認(rèn)知決策模型進(jìn)行持續(xù)優(yōu)化,最終目標(biāo)是實現(xiàn)端到端自動駕駛,現(xiàn)階段主要用于解決自動駕駛的認(rèn)知決策問題。
目前,“雪湖·海若”實現(xiàn)了模型架構(gòu)與參數(shù)規(guī)模的升級,參數(shù)規(guī)模達(dá)到1200億,預(yù)訓(xùn)練階段引入4000萬公里量產(chǎn)車駕駛數(shù)據(jù)。
據(jù)了解,2021年,毫末智行在推出數(shù)據(jù)智能體系MANA的同時,也宣布要借助大模型提升數(shù)據(jù)處理能力,從而加速HPilot智能輔助駕駛產(chǎn)品的進(jìn)化。
王小川成立“百川智能”
4月10日,搜狗創(chuàng)始人王小川正式宣布入局中國大模型創(chuàng)業(yè),和前搜狗COO茹立云聯(lián)合創(chuàng)立人工智能公司,旨在打造中國版的OpenAI基礎(chǔ)大模型及顛覆性上層應(yīng)用。
王小川在公開信中表示,新公司名為“百川智能”,目前已初步組建了50人的團隊,獲5000萬美元啟動資金,爭取年內(nèi)發(fā)布國內(nèi)最好的大模型和顛覆性的產(chǎn)品。
據(jù)悉,百川智能以前搜狗團隊為基礎(chǔ),快速融合了來自百度、華為、微軟、字節(jié)、騰訊等知名科技公司以及其他創(chuàng)業(yè)公司核心成員在內(nèi)的數(shù)十位頂尖AI人才。
值得一提的是,近日,王小川與百度副總裁肖陽就國內(nèi)大模型發(fā)展與OpenAI之間的差距問題,隔空打起了嘴仗。
這場嘴仗源于王小川對李彥宏談及“百度的文心一言和OpenAI差距可能在兩個月左右”的觀點不認(rèn)同。王小川表示:“怎么可能只差兩個月?那一定是(在)另一個宇宙。”如果用時間衡量的話,王小川認(rèn)為OpenAI比國內(nèi)領(lǐng)先三年時間。
針對上述觀點,百度副總裁肖陽回應(yīng)稱:“百度做AI,始終相信長期主義的價值。我們向來不回避與國外的差距,但是這個差距到底在什么位置,一線的都懂。天上一天,人間一年,王小川脫離一線太久,確實跟我們不在一個宇宙。”
今日凌晨,王小川回懟了百度副總裁肖陽的言論。王小川稱,“什么樣的平行宇宙里,才能做到讓一個脫離一線15年的人,去懟一個脫離一線1.5年的人。”
馬斯克被曝入局大模型
據(jù)外媒援引知情人士稱,特斯拉CEO埃隆·馬斯克近日在推特內(nèi)部啟動了一項人工智能項目,用于公司的兩個數(shù)據(jù)中心之一。
知情人士透露,盡管馬斯克簽署了呼吁暫停人工智能開發(fā)6個月的公開信,但其卻暗中在推特推進(jìn)新的生成式人工智能(AIGC)項目,并為此購買了上萬個GPU(圖形處理器),還從谷歌的人工智能部門DeepMind招募了人才。
該項目涉及創(chuàng)建一個生成式人工智能,推特將根據(jù)自己的海量數(shù)據(jù)進(jìn)行訓(xùn)練。一位消息人士稱,如果推特不打算將它們用于AI工作,幾乎沒有理由在數(shù)據(jù)中心級GPU上花費這么多錢。
知情人士稱,馬斯克的人工智能項目還處于早期階段,盡管其購買如此多的額外計算能力表明他對這個項目給予了很大期望。
此外,今年2月,馬斯克與人工智能研究人員接洽,商討成立一個新的研究實驗室,以開發(fā)ChatGPT的競爭對手。
值得一提的是,他不止一次在公開場合稱人工智能是一項危險的技術(shù)。就在幾周前,他還和人工智能研究界和產(chǎn)業(yè)界的大佬們一起簽署了一篇公開信,呼吁全球所有實驗室暫停比GPT-4更強的AI模型研發(fā),暫停時間至少為6個月。
(鞭牛士整理自澎湃、36kr、第一財經(jīng)、每日經(jīng)濟新聞等)
原文標(biāo)題 : 4月,國內(nèi)大模型遍地開花

請輸入評論內(nèi)容...
請輸入評論/評論長度6~500個字
最新活動更多
推薦專題
- 1 UALink規(guī)范發(fā)布:挑戰(zhàn)英偉達(dá)AI統(tǒng)治的開始
- 2 “AI寒武紀(jì)”爆發(fā)至今,五類新物種登上歷史舞臺
- 3 降薪、加班、裁員三重暴擊,“AI四小龍”已折戟兩家
- 4 光計算迎來商業(yè)化突破,但落地仍需時間
- 5 大模型下半場:Agent時代為何更需要開源模型
- 6 中國“智造”背后的「關(guān)鍵力量」
- 7 優(yōu)必選:營收大增主靠小件,虧損繼續(xù)又逢關(guān)稅,能否乘機器人東風(fēng)翻身?
- 8 營收猛增46%,昆侖萬維成為AI“爆品工廠”
- 9 全球無人駕駛技術(shù)排名:誰才是細(xì)分賽道的扛把子?
- 10 地平線自動駕駛方案解讀