CVPR 2024：中科視語領(lǐng)跑工業(yè)大模型，工業(yè)混合專家模型再奪桂冠: 2024-07-05 10:49 來源：中國企業(yè)網(wǎng) 次閱讀; 分享：

CVPR 2024：中科視語領(lǐng)跑工業(yè)大模型，工業(yè)混合專家模型再奪桂冠

近日，在全球權(quán)威的CVPR?2024視覺異常檢測和創(chuàng)新性檢測挑戰(zhàn)賽中，中科視語AI團(tuán)隊(duì)提交的“少量樣本異常檢測使用專家混合模型”以0.818的出色成績，從全球17個(gè)國家和地區(qū)，百余支頂尖AI團(tuán)隊(duì)中脫穎而出，摘下桂冠。這再次展現(xiàn)了中科視語在工業(yè)大模型領(lǐng)域的雄厚實(shí)力。

隨著大模型技術(shù)的發(fā)展，技術(shù)先進(jìn)性和性能卓越性的要求更加苛刻，中科視語持續(xù)堅(jiān)定、專注投入大模型研發(fā)，深入磨煉“內(nèi)功”，建立技術(shù)壁壘，夯實(shí)技術(shù)優(yōu)勢(shì)，正是憑借中科視語深厚的技術(shù)積淀和長期積累的市場經(jīng)驗(yàn)，視語坤川工業(yè)大模型核心技術(shù)連續(xù)多次取得國際領(lǐng)先的成果。本次獲獎(jiǎng)，是繼登頂2019 VideoNet視頻內(nèi)容識(shí)別挑戰(zhàn)賽、2022道路損壞檢測世界競賽桂冠后的又一里程碑，這標(biāo)志著中科視語在少樣本邏輯/結(jié)構(gòu)異常檢測技術(shù)上取得了新的突破。也正是憑借持續(xù)的技術(shù)革新，中科視語在工業(yè)大模型領(lǐng)域積累了顯著的競爭優(yōu)勢(shì)。

2024計(jì)算機(jī)視覺領(lǐng)域的頂級(jí)學(xué)術(shù)會(huì)議CVPR，是由IEEE計(jì)算機(jī)協(xié)會(huì)和計(jì)算機(jī)視覺基金會(huì)(Computer Vision Foundation，CVF)共同主辦，是一年一度的全球計(jì)算機(jī)視覺領(lǐng)域與模式識(shí)別領(lǐng)域最頂尖的學(xué)術(shù)會(huì)議。其與ECCV(European Conference on Computer Vision)、ICCV(IEEE/CVF International Conference on Computer Vision)一起并稱為計(jì)算機(jī)視覺領(lǐng)域的三大最高級(jí)別的頂級(jí)會(huì)議。

面對(duì)日益激烈的市場競爭和不斷變化的技術(shù)環(huán)境，中科視語始終保持前瞻性思維和創(chuàng)新精神。為了高效節(jié)約成本并提高效率，我們持續(xù)更新迭代，在xx的基礎(chǔ)上，采用了前沿的Mixture of Experts（MoE）架構(gòu)。MoE架構(gòu)的核心優(yōu)勢(shì)是旨在通過模塊化的方式降低更多的成本，實(shí)現(xiàn)更大的推理規(guī)模和更快的推理速度。這一創(chuàng)新架構(gòu)使我們?cè)谑袌龌偁幹懈邇?yōu)勢(shì)。

MoE架構(gòu)將復(fù)雜任務(wù)分解為多個(gè)子任務(wù)，由不同的“專家”模塊并行處理。這種分工合作的方式不僅提高了處理效率，還實(shí)現(xiàn)了更精準(zhǔn)的模型預(yù)測。通過降低冗余計(jì)算和資源消耗，我們能夠以更低的成本實(shí)現(xiàn)更高的性能，從而在市場上形成更有優(yōu)勢(shì)的競爭地位。

圖 1 中科視語AI團(tuán)隊(duì)斬獲少樣本邏輯/結(jié)構(gòu)異常檢測賽道(VAND 2.0）賽道第一名

少樣本工業(yè)異常檢測比賽VAND2.0

從飛機(jī)火車到螺絲螺母，工業(yè)產(chǎn)品在我們的生活中無處不在。為了保證這些產(chǎn)品能夠正常發(fā)揮其功能，避免安全事故，在生產(chǎn)過程中進(jìn)行異常檢測是極為必要的。近年來，隨著計(jì)算機(jī)視覺技術(shù)的飛速發(fā)展，基于深度學(xué)習(xí)的工業(yè)異常檢測方法層出不窮，成為學(xué)術(shù)和工業(yè)界的研究熱點(diǎn)。因此，CVPR會(huì)議連續(xù)兩年舉辦VAND挑戰(zhàn)賽，鼓勵(lì)研究者進(jìn)一步探索工業(yè)異常檢測的有效方法。

本次VAND比賽分為兩個(gè)賽道：

1.Adapt & Detect: Robust Anomaly Detection in Real-World Applications

2. VLM Anomaly Challenge: Few-Shot Learning for Logical and Structural Detection

研究團(tuán)隊(duì)參加的是第二個(gè)賽道，重點(diǎn)研究基于多模態(tài)模型的少樣本邏輯和結(jié)構(gòu)異常檢測方法。比賽使用的數(shù)據(jù)集將常見的異常分為結(jié)構(gòu)異常和邏輯異常兩類。結(jié)構(gòu)異常指的是諸如破損、劃痕這種在正常樣本上不會(huì)出現(xiàn)的異常情況；邏輯異常則指正常物品的錯(cuò)誤組合。例如，每個(gè)塑料袋中應(yīng)該包含一長一短兩個(gè)螺絲釘、兩個(gè)螺母、兩個(gè)墊片。然而，在邏輯異常樣本中，可能包含三個(gè)螺母，這類異常難以通過簡單比對(duì)來判斷，需要使用新的異常檢測方式。

此外，賽道二在少樣本設(shè)置下進(jìn)行異常檢測，即要求模型在訓(xùn)練期間從未見過來自測試數(shù)據(jù)集中的任何正常樣本，只在推理期間提供少量正常樣本以供參考，這要求方法具有較高的遷移能力。

圖 2 正常樣本、結(jié)構(gòu)異常和邏輯異常示意圖

圖 3 研究團(tuán)隊(duì)在 CVPR 2024 的演講匯報(bào)

圖 4 研究團(tuán)隊(duì)在 CVPR 2024 的展示海報(bào)

基于混合專家模型的少樣本異常檢測方法AnomalyMoE

為了高效檢測出不同類別的異常，研究團(tuán)隊(duì)提出了混合專家模型AnomalyMoE，充分發(fā)揮不同類型的異常檢測方法的優(yōu)勢(shì)，使用 4 個(gè)不同的異常檢測專家模型：圖文異常檢測專家模型，全局異常檢測專家模型，子部分異常檢測專家模型，圖像塊異常檢測專家模型，并結(jié)合這四個(gè)專家模型的打分結(jié)果以得到最后的異常分?jǐn)?shù)。

圖 5 AnomalyMoE 結(jié)構(gòu)圖

圖文異常檢測專家模型FiLo

圖文異常檢測專家模型方面，研究團(tuán)隊(duì)主要使用了自己之前的工作FiLo [1]，FiLo 創(chuàng)新性地使用大語言模型來為每一類物品生成其可能出現(xiàn)的異常種類，并使用可學(xué)習(xí)的文本向量來取代人工編寫的文本模板，減少了工作量，提高了異常檢測性能，并能夠通過與圖像特征最相似的文本描述內(nèi)容來判斷樣品上的具體異常類型，提高了模型決策的可解釋性。

全局異常檢測專家模型

全局異常檢測方面，研究團(tuán)隊(duì)使用視覺-文本多模態(tài)大模型CLIP提取圖像全局特征，將測試樣本的全局特征與少量正常樣本的全局特征進(jìn)行比較，根據(jù)與正常樣本的相似度來判斷圖像中是否有異常。圖文異常檢測專家模型和全局異常檢測專家模型在檢測全局邏輯異常方面具有明顯優(yōu)勢(shì)。

子部分異常檢測專家模型

通過將圖像分為多個(gè)子部分，異常檢測方法能夠方便統(tǒng)計(jì)每個(gè)子部分中的面積、數(shù)量、顏色，從而方便判斷樣本中的每個(gè)部分是否為異常。研究團(tuán)隊(duì)使用子部分異常檢測專家模型，通過 DINO提取特征再聚類的方式得到每一個(gè)子部分的掩碼，然后進(jìn)行檢測。子部分異常檢測專家模型對(duì)于局部邏輯異常，如上文提到的螺母的新增、缺失等，具有良好的檢測效果。

圖像塊異常檢測專家模型AnomalyGPT

圖像塊異常檢測專家模型通過比較測試圖像的每個(gè)圖像塊和正常圖像的每個(gè)圖像塊的內(nèi)容，判斷每個(gè)圖像塊是否為異常。在圖像塊異常檢測專家模型的實(shí)現(xiàn)上，研究團(tuán)隊(duì)主要使用了他們?cè)?AAAI 2024上發(fā)表的方法 AnomalyGPT [2]，使用大語言模型實(shí)現(xiàn)工業(yè)異常檢測，在少樣本異常檢測方面具有顯著效果。

MoE架構(gòu)的引入是中科視語技術(shù)創(chuàng)新之路上的又一重要里程碑。它不僅體現(xiàn)了我們對(duì)技術(shù)進(jìn)步的不懈追求，也展示了我們?cè)趯?shí)現(xiàn)技術(shù)可持續(xù)發(fā)展和落地方面的堅(jiān)定決心。未來，我們將繼續(xù)探索和利用前沿技術(shù)，為客戶提供更優(yōu)質(zhì)的服務(wù)，為社會(huì)創(chuàng)造更多的價(jià)值。

參考文獻(xiàn)：

[1]Gu, Z., Zhu, B., Zhu, G., Chen, Y., Li, H., Tang, M., & Wang, J. (2024). FiLo: Zero-Shot Anomaly Detection by Fine-Grained Description and High-Quality Localization. arXiv preprint arXiv:2404.13671.

[2]Gu, Z., Zhu, B., Zhu, G., Chen, Y., Tang, M., & Wang, J. (2024, March). Anomalygpt: Detecting industrial anomalies using large vision-language models. In Proceedings of the AAAI Conference on Artificial Intelligence (Vol. 38, No. 3, pp.1932-1940).

點(diǎn)贊()

上一條：中力發(fā)布電動(dòng)智能叉車新品京東五金城成線上線下獨(dú)家首發(fā)渠道2024-07-03

下一條：我國推進(jìn)新型工業(yè)化取得新成效2024-07-07

相關(guān)稿件: 實(shí)力再證丨中科視語榮獲2024數(shù)字中國創(chuàng)新大賽交通大模型典型應(yīng)用場景獎(jiǎng) 2024-05-24; 工業(yè)產(chǎn)業(yè)大模型應(yīng)用持續(xù)落地發(fā)揮技術(shù)價(jià)值的關(guān)鍵在于產(chǎn)業(yè)厚度 2024-01-09; 宇視2024合作伙伴大會(huì) | 業(yè)內(nèi)首次提出“裝備大模型化” 2024-04-17; 中科視語亮相2024中關(guān)村論壇，共論大模型驅(qū)動(dòng)行業(yè)創(chuàng)新與發(fā)展 2024-04-29; 領(lǐng)邦智能：發(fā)布工業(yè)質(zhì)檢實(shí)時(shí)大模型，護(hù)航“質(zhì)量強(qiáng)國”之基 2024-04-03

国产裸体裸拍在线观看,欧美色色一级有声色色色,美日韩国产av一级片,在线观看黄片www,一级做a爱片久久毛片,国产91影院,亚洲福利免费精品视频

CVPR 2024：中科視語領(lǐng)跑工業(yè)大模型，工業(yè)混合專家模型再奪桂冠