大发888游戏平台下载-博客市网站-亚洲太阳开户送98元-正规皇冠投注网

科研動(dòng)態(tài)

基于Dirichlet過(guò)程混合模型噪聲標(biāo)簽抑制

中文題目:基于Dirichlet過(guò)程混合模型噪聲標(biāo)簽抑制

論文題目:Attacking Noisy Labels via Dirichlet Process Mixture Models

錄用期刊/會(huì)議:CCC2025 (CAA A類(lèi)會(huì)議)

錄用時(shí)間:2025.4.2

作者列表

1)宋   宇 中國(guó)石油大學(xué)(北京)人工智能學(xué)院 自動(dòng)化系 教師

2)任正平 中國(guó)石油大學(xué)(北京)人工智能學(xué)院 控制科學(xué)與工程 研18級(jí)

3)代思怡 中國(guó)石油大學(xué)(北京)人工智能學(xué)院 控制科學(xué)與工程 研23級(jí)

4)劉建偉 中國(guó)石油大學(xué)(北京)人工智能學(xué)院 自動(dòng)化系 教師

摘要:

1)針對(duì)高斯混合判別分析需要預(yù)先確定混合成分個(gè)數(shù)的缺點(diǎn),提出了基于Dirichlet混合模型的魯棒分類(lèi)模型。 

2)在Dirichlet混合模型中引入翻轉(zhuǎn)概率機(jī)制?;谪惾~斯先驗(yàn)-后驗(yàn)理論,我們給出了后驗(yàn)分布的嚴(yán)格理論約簡(jiǎn)。通過(guò)metropolis Hastings采樣算法,我們利用采樣得到的有限均值來(lái)計(jì)算重積分。 

3)在人工合成數(shù)據(jù)集和真實(shí)數(shù)據(jù)集上進(jìn)行了各種實(shí)驗(yàn),并與多基準(zhǔn)算法進(jìn)行了比較和分析。 

背景與動(dòng)機(jī):

高斯混合判別分析(GMDA)方法在帶有噪聲標(biāo)簽的合成數(shù)據(jù)集和真實(shí)數(shù)據(jù)集上都顯示出有希望的結(jié)果。然而,GMDA需要手動(dòng)調(diào)整混合物成分的數(shù)量,這是一個(gè)關(guān)鍵參數(shù),如果設(shè)置不當(dāng),會(huì)導(dǎo)致計(jì)算復(fù)雜性增加或預(yù)測(cè)有效性降低。 

主要內(nèi)容:

Dirichlet混合模型為:

4912ae5c32a80a47f494e1bf8fa3b0b.png

93aff1faf302418b9cfb2c2dba9a16f.png

3ab97b90b3b7151a5c59e393294d0b1.png

e6f58cf71813f9b056c0afa1faf1968.png

圖1 Dirichlet混合模型

結(jié)論:

針對(duì)基于高斯混合模型的穩(wěn)健判別分析需要預(yù)先指定混合分量,且混合分量不再隨訓(xùn)練樣本而變化的問(wèn)題,提出了一種基于Dirichlet過(guò)程的穩(wěn)健分類(lèi)算法,自適應(yīng)地確定聚類(lèi)數(shù)目,然后推導(dǎo)出類(lèi)別標(biāo)簽、聚類(lèi)和各種參數(shù)的后驗(yàn)分布,并利用metropolis Hastings采樣算法推導(dǎo)出聚類(lèi)采樣,將多重積分替換為有限均值采樣。實(shí)驗(yàn)結(jié)果表明,基于Dirichlet過(guò)程的魯棒分類(lèi)算法能夠自適應(yīng)地調(diào)整聚類(lèi)數(shù)目,對(duì)帶有標(biāo)簽噪聲的數(shù)據(jù)具有良好的性能。

作者簡(jiǎn)介:

劉建偉,教師。