中文題目:RAY-Net:一種融合了輔助修正的摩托車(chē)頭盔檢測(cè)方法
論文題目:RAY-Net: A Motorcycle Helmet Detection Method Integrated Auxiliary Correction
錄用會(huì)議:The 2024 Twentieth International Conference on Intelligent Computing (CCF C)
作者列表:
1) 劉志強(qiáng) 中國(guó)石油大學(xué)(北京)人工智能學(xué)院 碩23
2) 王智廣 中國(guó)石油大學(xué)(北京)人工智能學(xué)院 計(jì)算機(jī)科學(xué)與技術(shù)系 教師
3) 李曉雪 中國(guó)石油大學(xué)(北京)人工智能學(xué)院 碩23
4) 祝留宇 中國(guó)石油大學(xué)(北京)人工智能學(xué)院 碩23
5) 胡思潁 中國(guó)石油大學(xué)(北京)人工智能學(xué)院 碩22
6) 魯 強(qiáng) 中國(guó)石油大學(xué)(北京)人工智能學(xué)院 智能科學(xué)與技術(shù)系 教師
經(jīng)過(guò)六個(gè)月的工作,本文收集了多個(gè)城市道路中包括白天、夜間、多云和雨天等場(chǎng)景的數(shù)據(jù)。本文通過(guò)在北京市和山東省濟(jì)南市合理地設(shè)置了多個(gè)采樣點(diǎn),利用攝像機(jī)拍攝收集有關(guān)摩托車(chē)的交通數(shù)據(jù)。通過(guò)對(duì)實(shí)際情況的分析以及對(duì)模型訓(xùn)練效果的考慮,本文在完成數(shù)據(jù)采集工作后,進(jìn)一步完成了以下三種數(shù)據(jù)的清洗工作:
本文通過(guò)對(duì)所有數(shù)據(jù)的檢查和清洗工作后,獲得了265個(gè)有效視頻片段,共計(jì)440分鐘。我們從這265個(gè)視頻片段中以每秒2幀的速率提取出52800張圖像。如表1所示,白天、夜間、雨天和陰天這四種主要場(chǎng)景分別占整個(gè)數(shù)據(jù)集的17.05%、59.09%、9.09%和14.77%。圖1展示了該數(shù)據(jù)集中不同場(chǎng)景的圖像。


圖1:EMHDD中各種場(chǎng)景數(shù)據(jù)的展示。(a)白天;(b)夜間;(c)雨天;(d)陰天。
本文提出的摩托車(chē)頭盔檢測(cè)算法RAY-Net由檢測(cè)器和識(shí)別器組成。如圖2所示,上部分表示檢測(cè)器,下部分表示識(shí)別器。我們分別訓(xùn)練這兩個(gè)獨(dú)立的網(wǎng)絡(luò)模塊,利用檢測(cè)器檢測(cè)出行駛中的摩托車(chē)并利用識(shí)別器識(shí)別摩托車(chē)駕駛員的頭盔佩戴情況。
本文在檢測(cè)階段增加了一個(gè)輔助校正模塊。對(duì)于檢測(cè)任務(wù),檢測(cè)器首先檢測(cè)輸入圖像中三種類(lèi)別的對(duì)象:運(yùn)動(dòng)中的摩托車(chē)(Driving)、人(Person)和摩托車(chē)(Motorcycle)。輔助校正模塊使用人(Person)和摩托車(chē)(Motorcycle)兩個(gè)類(lèi)別校正檢測(cè)結(jié)果,該模塊通過(guò)人和摩托車(chē)的邊界框之間的交并比(IoU)評(píng)估它們的相關(guān)性,保留具有高相關(guān)性的組合以校正檢測(cè)結(jié)果。識(shí)別器對(duì)校正后的檢測(cè)結(jié)果進(jìn)行識(shí)別,并判斷摩托車(chē)駕駛員是否佩戴頭盔。

圖2 RAY-Net模型的結(jié)構(gòu)
該輔助校正算法的流程在A(yíng)lgorithm 1中給出。

實(shí)驗(yàn)結(jié)果及分析:
我們?cè)贖ELMET和EMHDD數(shù)據(jù)集上進(jìn)行了充分的實(shí)驗(yàn),將本文使用的檢測(cè)器和識(shí)別器與其他現(xiàn)有的最先進(jìn)的方法進(jìn)行比較。如表2和表3所示,本文提出的集成了輔助校正模塊的檢測(cè)器與其他方法相比具有更高的精度,這證明本文所提出的檢測(cè)器能夠有效地防止行人和路邊停放的摩托車(chē)被誤識(shí)別為目標(biāo)物體。同時(shí)我們使用的識(shí)別器也同樣具有優(yōu)勢(shì)。

值得注意的是,兩個(gè)階段的所有模型在EMHDD上的準(zhǔn)確性與HELMET上的準(zhǔn)確性相比,都有明顯的下降趨勢(shì)。這是因?yàn)楸疚淖越ǖ腅MHDD數(shù)據(jù)集包括了極具挑戰(zhàn)性的場(chǎng)景,如夜間和雨天,如果不進(jìn)行數(shù)據(jù)預(yù)處理,模型的準(zhǔn)確性將受到嚴(yán)重影響。這進(jìn)一步說(shuō)明了未來(lái)研究需要關(guān)注更復(fù)雜的場(chǎng)景,同時(shí)也證明了本文自建的EMHDD數(shù)據(jù)集的全面性。
2.消融實(shí)驗(yàn):
本文對(duì)檢測(cè)器的輔助校正模塊進(jìn)行了消融分析,在HELMET、HD、UMD和自建的EMHDD數(shù)據(jù)集上進(jìn)行了全面的實(shí)驗(yàn),以展示本文所提出的輔助校正模塊的有效性。
如表4所示,集成了輔助校正模塊后,檢測(cè)器的精度有明顯提升。改進(jìn)后的模型在開(kāi)源數(shù)據(jù)集HELMET和UMD以及我們自建的EMHDD數(shù)據(jù)集上表現(xiàn)更好,僅在HD上的性能幾乎相同,這表明我們提出的輔助校正模塊是有效的。這是因?yàn)檩o助校正模塊能夠篩除被錯(cuò)誤檢測(cè)為目標(biāo)對(duì)象的數(shù)據(jù),從而提高檢測(cè)階段的準(zhǔn)確性。

結(jié)論:
由于目前的開(kāi)源數(shù)據(jù)集都存在不足,本文收集了兩個(gè)城市中不同街道的數(shù)據(jù),并構(gòu)建了一個(gè)更復(fù)雜、更全面的數(shù)據(jù)集EMHDD。本文提出的RAY-Net是一個(gè)由檢測(cè)器和識(shí)別器組成的兩階段模型,它們協(xié)同工作以提高系統(tǒng)的整體效率。在檢測(cè)階段,本文使用RetinaNet作為基礎(chǔ)模型,并添加輔助校正模塊。檢測(cè)器在檢測(cè)行駛中的摩托車(chē)的同時(shí),還要檢測(cè)人和摩托車(chē)這兩種類(lèi)別的物體作為輔助校正依據(jù)以校正檢測(cè)結(jié)果。實(shí)驗(yàn)結(jié)果表明,該方法可以有效地篩除行人和路邊停放的摩托車(chē),從而更準(zhǔn)確地檢測(cè)出行駛中的摩托車(chē)。輔助校正模塊能夠提高系統(tǒng)的整體精度,并減少識(shí)別器的工作負(fù)載。在識(shí)別階段,本文使用YOLOv8作為基礎(chǔ)模型。實(shí)驗(yàn)結(jié)果表明本文在識(shí)別階段使用的方法優(yōu)于其他方法。在未來(lái)的研究中,我們將進(jìn)一步考慮如何預(yù)處理不同場(chǎng)景的數(shù)據(jù),以提高系統(tǒng)整體的準(zhǔn)確性。
王智廣,教授,博士生導(dǎo)師,北京市教學(xué)名師。中國(guó)計(jì)算機(jī)學(xué)會(huì)(CCF)高級(jí)會(huì)員,全國(guó)高校實(shí)驗(yàn)室工作研究會(huì)信息技術(shù)專(zhuān)家指導(dǎo)委員會(huì)委員,全國(guó)高校計(jì)算機(jī)專(zhuān)業(yè)(本科)實(shí)驗(yàn)教材與實(shí)驗(yàn)室環(huán)境開(kāi)發(fā)專(zhuān)家委員會(huì)委員,北京市計(jì)算機(jī)教育研究會(huì)常務(wù)理事。長(zhǎng)期從事分布式并行計(jì)算、三維可視化、計(jì)算機(jī)視覺(jué)、知識(shí)圖譜方面的研究工作,主持或承擔(dān)國(guó)家重大科技專(zhuān)項(xiàng)子任務(wù)、國(guó)家重點(diǎn)研發(fā)計(jì)劃子課題、國(guó)家自然科學(xué)基金、北京市教委科研課題、北京市重點(diǎn)實(shí)驗(yàn)室課題、地方政府委托課題以及企業(yè)委托課題20余項(xiàng),在國(guó)內(nèi)外重要學(xué)術(shù)會(huì)議和期刊上合作發(fā)表學(xué)術(shù)論文70余篇,培養(yǎng)了100余名碩士博士研究生。