當(dāng)前位置:

OFweek 人工智能網(wǎng)

評(píng)測(cè)

一步直接封神!單步擴(kuò)散媲美250步教師模型!中科大&字節(jié)發(fā)布圖像生成“分層蒸餾術(shù)”

作者:Hanbo Cheng等 解讀:AI生成未來(lái) 亮點(diǎn)直擊 系統(tǒng)性分析與統(tǒng)一視角:對(duì)軌跡蒸餾(TD)進(jìn)行了系統(tǒng)性分析,揭示了其本質(zhì)是一種有損壓縮過(guò)程。這一視角解釋了為何TD方法雖然能有效保留全局結(jié)構(gòu)

2025-11-14 16:24 評(píng)論

視頻模型在真推理還是“演”推理?港中文等提出新基準(zhǔn)拷問(wèn):Chain-of-Frame到底是真是假?

作者:Ziyu Guo等 解讀:AI生成未來(lái) 引言 近年來(lái),以 Veo、Sora 等為代表的視頻生成模型展現(xiàn)出驚人的生成能力,能夠合成高度逼真、時(shí)間連續(xù)的動(dòng)態(tài)畫(huà)面。這些進(jìn)展暗示,模型在視覺(jué)內(nèi)容生成之外

2025-11-13 16:00 評(píng)論

直播革命來(lái)了!StreamDiffusionV2:140億參數(shù)實(shí)時(shí)視頻飆上58FPS!伯克利&韓松團(tuán)隊(duì)等

作者:Tianrui Feng等 解讀:AI生成未來(lái) 亮點(diǎn)直擊 StreamDiffusionV2,這是一個(gè)免訓(xùn)練的流式系統(tǒng),專為視頻擴(kuò)散模型設(shè)計(jì),用于實(shí)現(xiàn)動(dòng)態(tài)交互式的視頻生成。 巧妙整合了SLO-a

2025-11-12 14:18 評(píng)論

一文講透自動(dòng)駕駛中的“點(diǎn)云”

在談及自動(dòng)駕駛感知系統(tǒng)時(shí),經(jīng)常會(huì)看到一個(gè)專業(yè)詞匯,那便是“點(diǎn)云”。作為連接物理現(xiàn)實(shí)與數(shù)字世界的橋梁,它賦予機(jī)器一種超越人類(lèi)視覺(jué)的深度感知能力,讓車(chē)輛得以精確地“理解”自身在環(huán)境中的位置與周遭物體的真實(shí)

2025-11-11 14:18 評(píng)論

主題一致超越所有開(kāi)源與商業(yè)模型!中科大&字節(jié)開(kāi)源統(tǒng)一創(chuàng)新框架BindWeave

作者:Zhaoyang Li等 解讀:AI生成未來(lái) 亮點(diǎn)直擊 BindWeave:針對(duì)現(xiàn)有視頻生成技術(shù)在主題一致性方面的瓶頸,提出了一個(gè)專為主題一致性視頻生成設(shè)計(jì)的新型框架。 引入多模態(tài)大語(yǔ)言模型作為

2025-11-11 13:50 評(píng)論

頂刊TPAMI 2025!一個(gè)模型搞定所有!多模態(tài)跟蹤“全能王”UM-ODTrack橫空出世

作者:Yaozong Zheng等 解讀:AI生成未來(lái) 亮點(diǎn)直擊 1.為視覺(jué)跟蹤領(lǐng)域提供了首個(gè)通用的視頻級(jí)模態(tài)感知跟蹤模型。UM-ODTrack?僅需訓(xùn)練一次,即可使用相同的架構(gòu)和參數(shù)實(shí)現(xiàn)多任務(wù)推理,

2025-11-10 16:40 評(píng)論

好聽(tīng)、好用、好安全,?低暣蛟烊拙W(wǎng)絡(luò)音頻系統(tǒng)

你能想象嗎?在數(shù)字化技術(shù)、網(wǎng)絡(luò)技術(shù)席卷全球的今天,會(huì)議音頻與擴(kuò)聲系統(tǒng)竟然還大量采用模擬信號(hào)技術(shù)。然而這種誕生于上世紀(jì)的音頻技術(shù),正面臨“三重困境”: 首先,信號(hào)裸奔。模擬系統(tǒng)通過(guò)模擬信號(hào)傳輸,像天線一

2025-11-07 16:11 評(píng)論

首個(gè)基于LLM的開(kāi)源音頻大模型!階躍星辰重磅開(kāi)源Step-Audio-EditX:P聲音如此簡(jiǎn)單!

作者:Chao Yan等 解讀:AI生成未來(lái) 亮點(diǎn)直擊 首個(gè)開(kāi)源的 LLM 音頻編輯模型:Step-Audio-EditX,首個(gè)基于大語(yǔ)言模型(LLM)的開(kāi)源音頻模型,不僅擅長(zhǎng)表現(xiàn)力豐富和可迭代的音頻

2025-11-07 14:54 評(píng)論

SLAM在自動(dòng)駕駛中起到什么作用?

在談及自動(dòng)駕駛時(shí),經(jīng)常會(huì)聽(tīng)SLAM這項(xiàng)技術(shù)。SLAM,即“Simultaneous Localization And Mapping”的縮寫(xiě),中文稱為“同時(shí)定位與建圖”。SLAM可以解決一個(gè)非常關(guān)鍵的

2025-11-07 10:22 評(píng)論

旅行Agent評(píng)測(cè):通義千問(wèn)VS攜程AIVS豆包

今時(shí)不同往日,剛剛過(guò)去的2025年十一假期,可以稱得上是AI時(shí)代的第一個(gè)十一假期。 一個(gè)全新的概念已經(jīng)浮出水面:旅行Agent(AI旅行助手)。 各大平臺(tái)紛紛開(kāi)始把AI應(yīng)用于旅行上,無(wú)論是規(guī)劃行程、提

小鵬Robotaxi和IRON發(fā)布:物理AI“安全大考”才剛剛開(kāi)始

“當(dāng) AI 從屏幕里的算法,變成能幫你開(kāi)門(mén)、載你通勤的‘物理伙伴’,安全和智能哪個(gè)該優(yōu)先?”11 月 5 日小鵬科技日的開(kāi)場(chǎng)提問(wèn),把這場(chǎng)技術(shù)發(fā)布會(huì)從 “參數(shù)秀” 拉回了普通人的生活場(chǎng)景 —— 當(dāng)天拋出

2025-11-06 10:26 評(píng)論

追覓萬(wàn)元掃拖機(jī)器人怎么樣?實(shí)測(cè)太能打,換拖布不是噱頭

萬(wàn)元掃拖機(jī)器人竟能如此全面? 你有想象過(guò),一萬(wàn)塊的掃拖洗一體機(jī)器人應(yīng)該是什么樣的嗎? 要雷科技說(shuō),如果掃拖洗一體機(jī)器人要賣(mài)到這個(gè)價(jià)位,它一定是集各種尖端科技于一身的,擁有其它掃拖洗一體機(jī)器人所沒(méi)有的功

DeepSeek、千問(wèn)、混元、文心、Kimi與智譜,六大國(guó)產(chǎn)大模型,誰(shuí)是最強(qiáng)“金融分析師”?|錦緞評(píng)測(cè)

本文系基于公開(kāi)資料撰寫(xiě),僅作為信息交流之用,不構(gòu)成任何投資建議。 每當(dāng)我們翻閱財(cái)報(bào)時(shí),可能只想或許關(guān)鍵的財(cái)務(wù)信息,但總是受到財(cái)報(bào)中紛繁復(fù)雜的業(yè)務(wù)表述、冗長(zhǎng)的管理層發(fā)言的干擾,需要耗費(fèi)大量精力去甄別有用

國(guó)產(chǎn)視頻大模型大橫評(píng):可靈、即夢(mèng)不分仲伯,表現(xiàn)最差的竟是它?

視頻大模型能圓我們的導(dǎo)演夢(mèng)? 視頻生成大模型,能幫助我們成為視頻創(chuàng)作者嗎? 前段時(shí)間,AI歌手Yuri火爆全網(wǎng),不少網(wǎng)友驚嘆AI大模型生成的視頻居然真假難辨,口型和聲音近乎完美同步。完全由AI創(chuàng)作

上線秒空、股價(jià)大漲!小米AI眼鏡正面對(duì)剛Ray-Ban Meta 供應(yīng)鏈+性能+生態(tài)全拆解

6月26日晚,小米人車(chē)家全生態(tài)發(fā)布會(huì)上,雷軍親自發(fā)布了自家的全新智能產(chǎn)品——小米AI眼鏡。該產(chǎn)品售價(jià)1999元起,共包含標(biāo)準(zhǔn)版在內(nèi)的三個(gè)版本。其中,電子變色版為2699元,彩色電子變色版為2999元,款式包含黑色,玳瑁棕和鸚鵡綠三款,目前均已開(kāi)售

核心硬件 | 2025-06-30 17:12 評(píng)論

DeepSeek搜索大橫評(píng):百度、微博、微信們靠?jī)?nèi)容決勝負(fù)

25年,DeepSeek大有重構(gòu)一切產(chǎn)業(yè)的勢(shì)頭,而最受沖擊的應(yīng)用當(dāng)屬搜索。 微信將AI搜索作為接入DeepSeek的第一步,有自媒體宣稱此舉將“重構(gòu)AI搜索”; 百度AI搜

2025-03-05 09:09 評(píng)論

為AI大模型提供強(qiáng)有力的存儲(chǔ)保證:致態(tài)TiPro 9000 4TB版本評(píng)測(cè)

目前AI大模型已經(jīng)成為了科技行業(yè)最受關(guān)注的領(lǐng)域,尤其是今年初興起的DeepSeek,更是將大語(yǔ)言模型達(dá)到了新的高度,特別是DeepSeek R1的發(fā)布讓眾多企業(yè)都開(kāi)始了自主模型的部署,完整的671b對(duì)于電腦的算力提出了極其嚴(yán)苛的要求,不過(guò)對(duì)于普通消費(fèi)者來(lái)說(shuō),32b的模型還是可以嘗試嘗試

2025-03-03 09:11 評(píng)論

DeepSeek-R1大戰(zhàn)豆包、Kimi,國(guó)產(chǎn)AI大模型第一花落誰(shuí)家?

盛名之下無(wú)虛士。 日活用戶突破2000萬(wàn),與中國(guó)移動(dòng)、華為、金山辦公、吉利汽車(chē)等企業(yè)相繼達(dá)成合作,DeepSeek迎來(lái)了高光時(shí)刻。 在互聯(lián)網(wǎng)巨頭爭(zhēng)相進(jìn)入AI行業(yè)的今天,企業(yè)為實(shí)現(xiàn)技術(shù)領(lǐng)先,紛紛斥巨資買(mǎi)數(shù)據(jù)和算力芯片,打造萬(wàn)卡集群

2025-02-07 15:32 評(píng)論

體驗(yàn)了羅永浩的AI應(yīng)用,我發(fā)現(xiàn)這就是一個(gè)大鍋亂燉的AI助理?

待辦清單+錘子便簽+AI聊天+子彈短信+發(fā)牌手? 傳聞中的羅永浩的「AI 軟件項(xiàng)目」終于上線了。就在剛剛過(guò)去的周末,羅永浩「最后一次創(chuàng)業(yè)」從 AR 轉(zhuǎn)型 AI 后推出了第一款產(chǎn)品—&md

2025-01-07 09:45 評(píng)論

算力荒緩解,自主化智算還有必要嗎?

2023年大煉模型興起,全球范圍內(nèi)都出現(xiàn)了算力供不應(yīng)求、一卡難求的情況。各地紛紛興建數(shù)據(jù)中心、智算中心,來(lái)解決國(guó)產(chǎn)大模型的算力短缺問(wèn)題。今年算力市場(chǎng)又倒向了另一個(gè)方向,算力開(kāi)始過(guò)剩和大量閑置了。主要體

2024-12-31 13:59 評(píng)論
上一頁(yè)  1  2  3 4 5 6 7  下一頁(yè)

資訊訂閱

粵公網(wǎng)安備 44030502002758號(hào)