0已點(diǎn)贊

今日焦點(diǎn)更多+

首單告捷！現(xiàn)場(chǎng)成功簽約MGK28160立式磨床，實(shí)力見證！

往期回顧

推薦展會(huì)更多+

2026第四屆中國智電汽車科技與供應(yīng)鏈展覽會(huì)

2027第十五屆常州工博會(huì)
2026-04-20
2027第三屆中國（江西）國際鑄造壓鑄、鍛造、熱處理工業(yè)爐展覽會(huì)
2026-04-15
2027第19屆長春先進(jìn)裝備制造業(yè)博覽會(huì)
2026-04-23
2027第48屆無錫太湖國際機(jī)床及智能工業(yè)裝備產(chǎn)業(yè)博覽會(huì)
2026-04-15

中國科學(xué)院西安光機(jī)所在零樣本異常檢測(cè)領(lǐng)域取得新進(jìn)展

科技動(dòng)態(tài) 2026年04月08日 09:41:06來源：中國科學(xué)院西安光機(jī)所 896

摘要隨著工業(yè)質(zhì)檢、醫(yī)學(xué)影像分析等應(yīng)用需求不斷增長，異常檢測(cè)技術(shù)日益受到關(guān)注。然而，實(shí)際場(chǎng)景中異常樣本往往稀缺甚至難以獲取，傳統(tǒng)依賴標(biāo)注數(shù)據(jù)的監(jiān)督學(xué)習(xí)方法面臨瓶頸。

　　近日，中國科學(xué)院西安光機(jī)所光譜成像技術(shù)研究室王荃研究員團(tuán)隊(duì)在計(jì)算機(jī)視覺領(lǐng)域的零樣本異常檢測(cè)與定位方向取得新進(jìn)展，相關(guān)成果被計(jì)算機(jī)視覺與模式識(shí)別大會(huì)(The IEEE/CVF Conference on Computer Vision and Pattern Recognition, CVPR 2026)接收。論文第一作者為西安光機(jī)所2024級(jí)碩士研究生胡明，通訊作者為武漢大學(xué)中南醫(yī)院胡聰博士、西安光機(jī)所胡炳樑研究員以及王荃研究員，西安光機(jī)所為第一通訊單位。

　　隨著工業(yè)質(zhì)檢、醫(yī)學(xué)影像分析等應(yīng)用需求不斷增長，異常檢測(cè)技術(shù)日益受到關(guān)注。然而，實(shí)際場(chǎng)景中異常樣本往往稀缺甚至難以獲取，傳統(tǒng)依賴標(biāo)注數(shù)據(jù)的監(jiān)督學(xué)習(xí)方法面臨瓶頸。

　　基于視覺-語言模型的零樣本異常檢測(cè)方法，憑借大規(guī)模預(yù)訓(xùn)練知識(shí)，無需異常標(biāo)注即可實(shí)現(xiàn)檢測(cè)，但在細(xì)粒度異常檢測(cè)任務(wù)中，該方法仍面臨三大挑戰(zhàn)：一是模型難以區(qū)分前景目標(biāo)與復(fù)雜背景，異常特征易與背景混雜，影響檢測(cè)精度；二是依賴單一文本表示，語義表達(dá)能力有限，難以為異常判別提供精細(xì)依據(jù)；三是跨模態(tài)對(duì)齊過程中，圖像與文本的語義匹配存在不確定性，制約了模型性能提升。

　　針對(duì)上述問題，研究團(tuán)隊(duì)提出了新型框架——FB-CLIP(Foreground-Background Disentangled CLIP)。該框架從三個(gè)層面進(jìn)行創(chuàng)新：

　　在文本建模上，提出多策略文本特征融合方法，通過結(jié)合句子級(jí)表示、全局上下文信息及注意力加權(quán)特征，構(gòu)建更豐富的任務(wù)感知語義表示，提升模型對(duì)異常語義的理解能力；

　　在視覺建模上，設(shè)計(jì)多視角前景-背景分離機(jī)制，從語義、空間、結(jié)構(gòu)等維度解耦圖像特征，并借助背景抑制策略減少復(fù)雜場(chǎng)景中的干擾信息，使模型更精準(zhǔn)地聚焦異常區(qū)域；

　　在跨模態(tài)對(duì)齊上，引入語義一致性正則化約束，通過提升預(yù)測(cè)置信度并拉大正常與異常樣本的語義間隔，增強(qiáng)模型對(duì)異常的判別能力。

　　實(shí)驗(yàn)結(jié)果表明，F(xiàn)B-CLIP在多個(gè)工業(yè)檢測(cè)和醫(yī)學(xué)影像數(shù)據(jù)集上均取得了優(yōu)異性能，尤其在細(xì)粒度異常定位任務(wù)中表現(xiàn)突出，整體性能達(dá)到國際領(lǐng)先水平。該方法無需異常樣本標(biāo)注，即可實(shí)現(xiàn)對(duì)復(fù)雜場(chǎng)景中微小異常的精準(zhǔn)檢測(cè)與定位，具有良好的實(shí)際應(yīng)用前景。

　　該成果有望應(yīng)用于醫(yī)學(xué)影像輔助診斷、工業(yè)缺陷檢測(cè)等領(lǐng)域。

　　西安光機(jī)所王荃研究員團(tuán)隊(duì)長期深耕于計(jì)算機(jī)視覺與生物醫(yī)學(xué)成像、腦機(jī)智能等交叉方向研究，近年來在相關(guān)領(lǐng)域持續(xù)取得一系列重要進(jìn)展，相關(guān)成果發(fā)表于CVPR 2025、Pattern Recognition等。

　　IEEE/CVF計(jì)算機(jī)視覺與模式識(shí)別會(huì)議是計(jì)算機(jī)視覺領(lǐng)域最具影響力的國際學(xué)術(shù)會(huì)議之一，被中國計(jì)算機(jī)學(xué)會(huì)(CCF)評(píng)為A類會(huì)議。

我要評(píng)論

昵稱

匿名

文明上網(wǎng)，理性發(fā)言。（您還可以輸入200個(gè)字符)

表情

所有評(píng)論僅代表網(wǎng)友意見，與本站立場(chǎng)無關(guān)。

機(jī)床商務(wù)網(wǎng)首頁資訊首頁

延伸閱讀

版權(quán)與免責(zé)聲明

凡本網(wǎng)注明“來源：機(jī)床商務(wù)網(wǎng)”的所有作品，均為浙江興旺寶明通網(wǎng)絡(luò)有限公司-機(jī)床商務(wù)網(wǎng)合法擁有版權(quán)或有權(quán)使用的作品。刊用本網(wǎng)站稿件，需經(jīng)書面授權(quán)。未經(jīng)本網(wǎng)授權(quán)不得轉(zhuǎn)載、摘編或利用其它方式使用上述作品。已經(jīng)本網(wǎng)授權(quán)使用作品的，應(yīng)在授權(quán)范圍內(nèi)使用，并注明“來源：機(jī)床商務(wù)網(wǎng)”。違反上述聲明者，本網(wǎng)將追究其相關(guān)法律責(zé)任。
本網(wǎng)轉(zhuǎn)載并注明自其它來源（非機(jī)床商務(wù)網(wǎng)）的作品，目的在于傳遞更多信息，并不代表本網(wǎng)贊同其觀點(diǎn)或?qū)ζ湔鎸?shí)性負(fù)責(zé)，不承擔(dān)此類作品侵權(quán)行為的直接責(zé)任及連帶責(zé)任。其他媒體、網(wǎng)站或個(gè)人從本網(wǎng)轉(zhuǎn)載時(shí)，必須保留本網(wǎng)注明的作品第一來源，并自負(fù)版權(quán)等法律責(zé)任。
如涉及作品內(nèi)容、版權(quán)等問題，請(qǐng)?jiān)谧髌钒l(fā)表之日起30日內(nèi)與本網(wǎng)聯(lián)系，并提供真實(shí)、有效的書面證明。我們將在核實(shí)后做出妥善處理。

中國科學(xué)院西安光機(jī)所在零樣本異常檢測(cè)領(lǐng)域取得新進(jìn)展

熱門評(píng)論

全部評(píng)論