中文題目:基于高質(zhì)量和高相關(guān)性潛在特征的高效對(duì)比學(xué)習(xí)的長(zhǎng)尾分類(lèi)
論文題目:Long-Tailed Classification by Efficient Contrast Learning with High Quality and High Relevance Latent Features
錄用期刊:Applied Intelligence(中科院大類(lèi)二區(qū))
錄用時(shí)間:2025.01.04
作者列表:
1)袁鴻力 中國(guó)石油大學(xué)(北京)人工智能學(xué)院 控制科學(xué)與工程 碩22級(jí)
2)劉建偉 中國(guó)石油大學(xué)(北京)人工智能學(xué)院 自動(dòng)化系 教師
摘要:
本文提出了一種更加高效的對(duì)比學(xué)習(xí)方法,并結(jié)合特征之間的關(guān)系圖,使得模型能夠提取更加魯棒的表示。對(duì)于表示學(xué)習(xí)任務(wù),我們采用類(lèi)原型來(lái)構(gòu)建長(zhǎng)尾場(chǎng)景下的高斯混合模型,以減少計(jì)算和內(nèi)存上的開(kāi)銷(xiāo)。并且我們利用高質(zhì)量的特征關(guān)系圖建模特征之間的關(guān)系,使得提取的特征能夠考慮到相似的語(yǔ)義特征。
背景與動(dòng)機(jī):
長(zhǎng)尾分布存在數(shù)據(jù)稀缺性和顯著的類(lèi)不平衡問(wèn)題,導(dǎo)致模型對(duì)頭部類(lèi)的預(yù)測(cè)傾向增加,對(duì)尾部類(lèi)的預(yù)測(cè)性能降低。傳統(tǒng)的長(zhǎng)尾對(duì)比學(xué)習(xí)方法可以緩解尾部類(lèi)的信息缺失問(wèn)題。然而,這存在兩個(gè)問(wèn)題:(1)利用更加準(zhǔn)確的高斯混合模型建模長(zhǎng)尾分布需要利用非常大的記憶池,這增加了計(jì)算和存儲(chǔ)的開(kāi)銷(xiāo).(2)傳統(tǒng)方法通常只考慮了樣例層面和類(lèi)層面的對(duì)比,忽視了樣本關(guān)系層面的信息。
針對(duì)問(wèn)題(1),我們提出了基于類(lèi)原型和批次特征來(lái)構(gòu)建長(zhǎng)尾高斯混合模型的方法。能夠更加高效的進(jìn)行特征學(xué)習(xí)。針對(duì)問(wèn)題(2),我們利用圖結(jié)構(gòu)來(lái)建模特征之間的語(yǔ)義關(guān)系,使得特征空間中,語(yǔ)義相似的特征也能相互靠近。在三個(gè)基準(zhǔn)數(shù)據(jù)集的大量實(shí)驗(yàn)證實(shí)了我們提出的模型的有效性。
主要內(nèi)容:
1.基于批次特征和類(lèi)原型的長(zhǎng)尾高斯混合模型建模
表示高斯混合模型下特征通過(guò)分類(lèi)器輸出后的似然函數(shù)。
2.基于高質(zhì)量和高相關(guān)KNN圖的對(duì)比學(xué)習(xí)方法
圖1:基于高質(zhì)量和高相關(guān)KNN圖的圖卷積映射頭
圖1能夠準(zhǔn)確地表示多個(gè)相關(guān)對(duì)象之間的關(guān)系。KNN圖相比一般的全連接圖可以更好的過(guò)濾噪聲信息,并且針對(duì)高維數(shù)據(jù)和大批次數(shù)據(jù)有很好的可擴(kuò)展性。因此,利用KNN圖結(jié)很好的建模長(zhǎng)尾批樣例之間的關(guān)系。
首先根據(jù)分類(lèi)正確樣例的集合。
然后通過(guò)設(shè)定閾值確定KNN的topK值:
然后構(gòu)建鄰接矩陣:
利用圖卷積映射頭提取包含語(yǔ)義關(guān)系的特征表示:
最后進(jìn)行對(duì)比學(xué)習(xí):
實(shí)驗(yàn)結(jié)果與分析:
我們?cè)谌齻€(gè)廣泛使用的長(zhǎng)尾數(shù)據(jù)集上評(píng)估了我們提出模型的性能:CIFAR10-LT, CIFAR100-LT和ImageNet-LT。
部分實(shí)驗(yàn)結(jié)果如表所示,我們?cè)诟鱾€(gè)數(shù)據(jù)集上,展現(xiàn)了出色的競(jìng)爭(zhēng)力:
表1 對(duì)不同不平衡因素下CIFAR10/100-LTtop-1測(cè)試精度(%)進(jìn)行基準(zhǔn)測(cè)試
表2 對(duì)ImageNet-LT數(shù)據(jù)集進(jìn)行基準(zhǔn)測(cè)試
結(jié)論:
本文提出了一種基于批特征表示和類(lèi)原型(CGM-BF-CP)的條件高斯混合模型對(duì)比學(xué)習(xí)算法。該方法對(duì)數(shù)據(jù)分布進(jìn)行了更精確的建模,并引入了特征空間補(bǔ)償,緩解了批量長(zhǎng)尾分布的問(wèn)題。此外,我們還從理論上推導(dǎo)了CGM-BF-CP的誤差界。此外,我們還提出了一個(gè)特征融合模塊,該模塊使用logits向量構(gòu)造KNN圖,并使用圖卷積提取融合特征。該模塊可以將頭部類(lèi)的信息傳遞到尾部類(lèi)的信息,有利于學(xué)習(xí)尾部類(lèi)的表示。最后,我們?cè)谌齻€(gè)常用的長(zhǎng)尾數(shù)據(jù)集上做了很多實(shí)驗(yàn)。
作者簡(jiǎn)介:
劉建偉,教師,學(xué)者。發(fā)表學(xué)術(shù)研究論文280多篇。研究領(lǐng)域涉及在線(xiàn)學(xué)習(xí)(包括強(qiáng)化學(xué)習(xí),賭博機(jī)算法,持續(xù)學(xué)習(xí),長(zhǎng)尾學(xué)習(xí));圖像視頻顯著性目標(biāo)檢測(cè),解糾纏表示學(xué)習(xí),光場(chǎng)和神經(jīng)場(chǎng)模型,以及圖像視頻少樣本變化檢測(cè);自然語(yǔ)言理解中的知識(shí)補(bǔ)全,圖神經(jīng)網(wǎng)絡(luò);不平衡數(shù)據(jù)處理;霍克斯點(diǎn)過(guò)程故障預(yù)測(cè)與診斷;非線(xiàn)性預(yù)測(cè)與控制。 是兵器裝備工程學(xué)報(bào)第三屆編輯委員會(huì)委員。歷屆中國(guó)控制會(huì)議(CCC)和中國(guó)控制與決策會(huì)議(CCDC)的程序委員會(huì)委員。擔(dān)任過(guò)80多個(gè)國(guó)際會(huì)議的TPC。