0已點(diǎn)贊

今日焦點(diǎn)更多+

往期回顧

推薦展會(huì)更多+

2026第四屆中國智電汽車科技與供應(yīng)鏈展覽會(huì)

MTM2026金屬世界博覽會(huì)?上海
2026-01-05
2026第二十二屆上海國際鑄造展覽會(huì)
2025-12-22
2026中國(寧波)五金機(jī)電進(jìn)出口博覽會(huì)
2026-01-15
CMES華機(jī)展|2026東莞國際機(jī)床展
2025-12-12

沈陽自動(dòng)化所機(jī)器視覺研究多篇論文獲AAAI2026錄用

機(jī)床上下游 2025年11月18日 09:29:20來源：中國科學(xué)院沈陽自動(dòng)化研究所 1292

摘要在多模態(tài)大模型視覺生成方面，研究團(tuán)隊(duì)提出了一種專家表征對(duì)齊的多模態(tài)大模型訓(xùn)練框架ARRA，可有效促進(jìn)大模型學(xué)習(xí)跨模態(tài)表征，實(shí)現(xiàn)多任務(wù)通用多模態(tài)生成。

　　【機(jī)床商務(wù)網(wǎng)欄目機(jī)床上下游】近日，國際人工智能頂級(jí)會(huì)議AAAI 2026論文接收結(jié)果公布，中國科學(xué)院沈陽自動(dòng)化研究所在機(jī)器視覺研究方面的多篇研究論文獲錄用。

　　在多模態(tài)大模型視覺生成方面，研究團(tuán)隊(duì)提出了一種專家表征對(duì)齊的多模態(tài)大模型訓(xùn)練框架ARRA，可有效促進(jìn)大模型學(xué)習(xí)跨模態(tài)表征，實(shí)現(xiàn)多任務(wù)通用多模態(tài)生成。相關(guān)研究成果Unleashing the Potential of Large Language Models for Text-to-Image Generation through Autoregressive Representation Alignment被大會(huì)選為口頭匯報(bào)(Oral)論文，論文第一作者為博士生謝興，通訊作者為范慧杰研究員與屈靚瓊助理教授。

　　在多模態(tài)大模型方面，研究團(tuán)隊(duì)提出了創(chuàng)新的物體分詞框架ObjecTok，顯著提升了模型以物體為中心的感知與推理能力。相關(guān)成果論文為ObjecTok: Learning Holistic and Robust Object Tokens for MLLMs，第一作者為博士生王思翰，通訊作者為劉西瑤副研究員。

　　在具身智能操作方面，研究團(tuán)隊(duì)提出了一種仿人知識(shí)總結(jié)與繼承的終身學(xué)習(xí)框架，賦予智能操作機(jī)器人持續(xù)演進(jìn)、不斷適應(yīng)新技能的終身學(xué)習(xí)能力。相關(guān)研究成果論文為Lifelong Language-Conditioned Robotic Manipulation Learning，第一作者為博士生王旭東與沈陽自動(dòng)化所實(shí)習(xí)生韓澤斌，通訊作者為韓志研究員。

　　在具身智能導(dǎo)航方面，研究團(tuán)隊(duì)提出了一種基于分層規(guī)劃策略的導(dǎo)航智能體，可提升智能機(jī)器人在復(fù)雜大場(chǎng)景中具身導(dǎo)航的魯棒性。相關(guān)研究成果論文為SeqWalker: Sequential-Horizon Vision-and-Language Navigation with Hierarchical Planning，第一作者為沈陽自動(dòng)化所實(shí)習(xí)生、中北大學(xué)本科生韓澤斌，通訊作者為博士生王旭東。

　　在視頻定制化生成方面，研究團(tuán)隊(duì)提出了一種連續(xù)定制化視頻擴(kuò)散模型，可在連續(xù)動(dòng)態(tài)空間中實(shí)現(xiàn)任意概念的個(gè)性化視頻生成。相關(guān)研究成果論文為Bring Your Dreams to Life: Continual Text-to-Video Customization，第一作者為沈陽自動(dòng)化所博士畢業(yè)生、穆罕默德·本·扎耶德人工智能大學(xué)博士后董家華和沈陽自動(dòng)化所博士生王旭東，通訊作者為韓志研究員。

　　在生成式世界模型方面，研究團(tuán)隊(duì)提出了首個(gè)可用自然語言控制的 4D LiDAR 生成模型，實(shí)現(xiàn)了高逼真、可編輯的動(dòng)態(tài)點(diǎn)云場(chǎng)景生成，可用于多種下游感知模型的安全驗(yàn)證和閉環(huán)仿真。該研究成果LiDARCrafter: Dynamic 4D World Modeling from LiDAR Sequences被大會(huì)選為口頭匯報(bào)(Oral)論文，第一作者為博士生梁奧，通訊作者為趙懷慈研究員。

　　上述研究成果得到了國家自然科學(xué)基金、國家重點(diǎn)研發(fā)計(jì)劃、機(jī)器人與智能系統(tǒng)全國重點(diǎn)實(shí)驗(yàn)室自主項(xiàng)目、沈陽自動(dòng)化所基礎(chǔ)研究項(xiàng)目等支持。(機(jī)器人學(xué)研究室光電信息技術(shù)研究室)

我要評(píng)論

昵稱

匿名

文明上網(wǎng)，理性發(fā)言。（您還可以輸入200個(gè)字符)

表情

所有評(píng)論僅代表網(wǎng)友意見，與本站立場(chǎng)無關(guān)。

機(jī)床商務(wù)網(wǎng)首頁資訊首頁

延伸閱讀

版權(quán)與免責(zé)聲明

凡本網(wǎng)注明“來源：機(jī)床商務(wù)網(wǎng)”的所有作品，均為浙江興旺寶明通網(wǎng)絡(luò)有限公司-機(jī)床商務(wù)網(wǎng)合法擁有版權(quán)或有權(quán)使用的作品。刊用本網(wǎng)站稿件，需經(jīng)書面授權(quán)。未經(jīng)本網(wǎng)授權(quán)不得轉(zhuǎn)載、摘編或利用其它方式使用上述作品。已經(jīng)本網(wǎng)授權(quán)使用作品的，應(yīng)在授權(quán)范圍內(nèi)使用，并注明“來源：機(jī)床商務(wù)網(wǎng)”。違反上述聲明者，本網(wǎng)將追究其相關(guān)法律責(zé)任。
本網(wǎng)轉(zhuǎn)載并注明自其它來源（非機(jī)床商務(wù)網(wǎng)）的作品，目的在于傳遞更多信息，并不代表本網(wǎng)贊同其觀點(diǎn)或?qū)ζ湔鎸?shí)性負(fù)責(zé)，不承擔(dān)此類作品侵權(quán)行為的直接責(zé)任及連帶責(zé)任。其他媒體、網(wǎng)站或個(gè)人從本網(wǎng)轉(zhuǎn)載時(shí)，必須保留本網(wǎng)注明的作品第一來源，并自負(fù)版權(quán)等法律責(zé)任。
如涉及作品內(nèi)容、版權(quán)等問題，請(qǐng)?jiān)谧髌钒l(fā)表之日起30日內(nèi)與本網(wǎng)聯(lián)系，并提供真實(shí)、有效的書面證明。我們將在核實(shí)后做出妥善處理。

沈陽自動(dòng)化所機(jī)器視覺研究多篇論文獲AAAI2026錄用

熱門評(píng)論

全部評(píng)論