大发888游戏平台下载-博客市网站-亚洲太阳开户送98元-正规皇冠投注网

科研動(dòng)態(tài)

RAY-Net:一種融合了輔助修正的摩托車(chē)頭盔檢測(cè)方法

中文題目:RAY-Net:一種融合了輔助修正的摩托車(chē)頭盔檢測(cè)方法

論文題目RAY-Net: A Motorcycle Helmet Detection Method Integrated Auxiliary Correction

錄用會(huì)議The 2024 Twentieth International Conference on Intelligent Computing (CCF C)

作者列表

1) 劉志強(qiáng) 中國(guó)石油大學(xué)(北京)人工智能學(xué)院 碩23

2) 王智廣 中國(guó)石油大學(xué)(北京)人工智能學(xué)院 計(jì)算機(jī)科學(xué)與技術(shù)系 教師

3) 李曉雪 中國(guó)石油大學(xué)(北京)人工智能學(xué)院 碩23

4) 祝留宇 中國(guó)石油大學(xué)(北京)人工智能學(xué)院 碩23

5) 胡思潁 中國(guó)石油大學(xué)(北京)人工智能學(xué)院 碩22

6) 魯 強(qiáng) 中國(guó)石油大學(xué)(北京)人工智能學(xué)院 智能科學(xué)與技術(shù)系 教師

摘要:

在城市交通安全監(jiān)測(cè)領(lǐng)域,檢測(cè)行駛中的摩托車(chē)的駕駛員是否佩戴頭盔是一項(xiàng)至關(guān)重要且具有實(shí)際意義的任務(wù),然而這一任務(wù)目前面臨兩大挑戰(zhàn)。首先,該領(lǐng)域缺乏涵蓋夜間和雨天等挑戰(zhàn)性場(chǎng)景的開(kāi)源數(shù)據(jù)集。其次,行人和路邊停放的摩托車(chē)通常會(huì)干擾行駛中的摩托車(chē)的檢測(cè)任務(wù),從而影響檢測(cè)結(jié)果的準(zhǔn)確性。為了解決上述兩個(gè)問(wèn)題,本文收集并注釋了夜間等具有挑戰(zhàn)性的場(chǎng)景的圖像,得到了52800張注釋圖像,構(gòu)建了一個(gè)更為全面的數(shù)據(jù)集,并將其命名為增強(qiáng)型摩托車(chē)頭盔檢測(cè)數(shù)據(jù)集(EMHDD)。此外,本文還提出了一種集成了輔助校正功能的兩階段檢測(cè)模型RAY-Net。該模型包括檢測(cè)階段和識(shí)別階段。在檢測(cè)階段,該模型通過(guò)輔助校正解決了路邊行人和停放的摩托車(chē)造成的檢測(cè)結(jié)果不理想的問(wèn)題。隨后,識(shí)別階段對(duì)檢測(cè)階段的結(jié)果進(jìn)行識(shí)別,并確定駕駛員是否佩戴頭盔。

設(shè)計(jì)與實(shí)現(xiàn):

EMHDD

經(jīng)過(guò)六個(gè)月的工作,本文收集了多個(gè)城市道路中包括白天、夜間、多云和雨天等場(chǎng)景的數(shù)據(jù)。本文通過(guò)在北京市和山東省濟(jì)南市合理地設(shè)置了多個(gè)采樣點(diǎn),利用攝像機(jī)拍攝收集有關(guān)摩托車(chē)的交通數(shù)據(jù)。通過(guò)對(duì)實(shí)際情況的分析以及對(duì)模型訓(xùn)練效果的考慮,本文在完成數(shù)據(jù)采集工作后,進(jìn)一步完成了以下三種數(shù)據(jù)的清洗工作:

  1. 長(zhǎng)時(shí)間沒(méi)有摩托車(chē)出現(xiàn)的視頻片段。
  2. 摩托車(chē)未完全出現(xiàn)于圖像中的視頻片段。
  3. 摩托車(chē)距離攝像機(jī)很遠(yuǎn)的視頻片段。

本文通過(guò)對(duì)所有數(shù)據(jù)的檢查和清洗工作后,獲得了265個(gè)有效視頻片段,共計(jì)440分鐘。我們從這265個(gè)視頻片段中以每秒2幀的速率提取出52800張圖像。如表1所示,白天、夜間、雨天和陰天這四種主要場(chǎng)景分別占整個(gè)數(shù)據(jù)集的17.05%、59.09%、9.09%和14.77%。圖1展示了該數(shù)據(jù)集中不同場(chǎng)景的圖像。





圖1:EMHDD中各種場(chǎng)景數(shù)據(jù)的展示。(a)白天;(b)夜間;(c)雨天;(d)陰天。


本文提出的摩托車(chē)頭盔檢測(cè)算法RAY-Net由檢測(cè)器和識(shí)別器組成。如圖2所示,上部分表示檢測(cè)器,下部分表示識(shí)別器。我們分別訓(xùn)練這兩個(gè)獨(dú)立的網(wǎng)絡(luò)模塊,利用檢測(cè)器檢測(cè)出行駛中的摩托車(chē)并利用識(shí)別器識(shí)別摩托車(chē)駕駛員的頭盔佩戴情況。

本文在檢測(cè)階段增加了一個(gè)輔助校正模塊。對(duì)于檢測(cè)任務(wù),檢測(cè)器首先檢測(cè)輸入圖像中三種類(lèi)別的對(duì)象:運(yùn)動(dòng)中的摩托車(chē)(Driving)、人(Person)和摩托車(chē)(Motorcycle)。輔助校正模塊使用人(Person)和摩托車(chē)(Motorcycle)兩個(gè)類(lèi)別校正檢測(cè)結(jié)果,該模塊通過(guò)人和摩托車(chē)的邊界框之間的交并比(IoU)評(píng)估它們的相關(guān)性,保留具有高相關(guān)性的組合以校正檢測(cè)結(jié)果。識(shí)別器對(duì)校正后的檢測(cè)結(jié)果進(jìn)行識(shí)別,并判斷摩托車(chē)駕駛員是否佩戴頭盔。



圖2 RAY-Net模型的結(jié)構(gòu)


該輔助校正算法的流程在A(yíng)lgorithm 1中給出。



實(shí)驗(yàn)結(jié)果及分析:

1.對(duì)比實(shí)驗(yàn):

我們?cè)贖ELMET和EMHDD數(shù)據(jù)集上進(jìn)行了充分的實(shí)驗(yàn),將本文使用的檢測(cè)器和識(shí)別器與其他現(xiàn)有的最先進(jìn)的方法進(jìn)行比較。如表2和表3所示,本文提出的集成了輔助校正模塊的檢測(cè)器與其他方法相比具有更高的精度,這證明本文所提出的檢測(cè)器能夠有效地防止行人和路邊停放的摩托車(chē)被誤識(shí)別為目標(biāo)物體。同時(shí)我們使用的識(shí)別器也同樣具有優(yōu)勢(shì)。



值得注意的是,兩個(gè)階段的所有模型在EMHDD上的準(zhǔn)確性與HELMET上的準(zhǔn)確性相比,都有明顯的下降趨勢(shì)。這是因?yàn)楸疚淖越ǖ腅MHDD數(shù)據(jù)集包括了極具挑戰(zhàn)性的場(chǎng)景,如夜間和雨天,如果不進(jìn)行數(shù)據(jù)預(yù)處理,模型的準(zhǔn)確性將受到嚴(yán)重影響。這進(jìn)一步說(shuō)明了未來(lái)研究需要關(guān)注更復(fù)雜的場(chǎng)景,同時(shí)也證明了本文自建的EMHDD數(shù)據(jù)集的全面性。


2.消融實(shí)驗(yàn):

本文對(duì)檢測(cè)器的輔助校正模塊進(jìn)行了消融分析,在HELMET、HD、UMD和自建的EMHDD數(shù)據(jù)集上進(jìn)行了全面的實(shí)驗(yàn),以展示本文所提出的輔助校正模塊的有效性。

如表4所示,集成了輔助校正模塊后,檢測(cè)器的精度有明顯提升。改進(jìn)后的模型在開(kāi)源數(shù)據(jù)集HELMET和UMD以及我們自建的EMHDD數(shù)據(jù)集上表現(xiàn)更好,僅在HD上的性能幾乎相同,這表明我們提出的輔助校正模塊是有效的。這是因?yàn)檩o助校正模塊能夠篩除被錯(cuò)誤檢測(cè)為目標(biāo)對(duì)象的數(shù)據(jù),從而提高檢測(cè)階段的準(zhǔn)確性。



結(jié)論:

由于目前的開(kāi)源數(shù)據(jù)集都存在不足,本文收集了兩個(gè)城市中不同街道的數(shù)據(jù),并構(gòu)建了一個(gè)更復(fù)雜、更全面的數(shù)據(jù)集EMHDD。本文提出的RAY-Net是一個(gè)由檢測(cè)器和識(shí)別器組成的兩階段模型,它們協(xié)同工作以提高系統(tǒng)的整體效率。在檢測(cè)階段,本文使用RetinaNet作為基礎(chǔ)模型,并添加輔助校正模塊。檢測(cè)器在檢測(cè)行駛中的摩托車(chē)的同時(shí),還要檢測(cè)人和摩托車(chē)這兩種類(lèi)別的物體作為輔助校正依據(jù)以校正檢測(cè)結(jié)果。實(shí)驗(yàn)結(jié)果表明,該方法可以有效地篩除行人和路邊停放的摩托車(chē),從而更準(zhǔn)確地檢測(cè)出行駛中的摩托車(chē)。輔助校正模塊能夠提高系統(tǒng)的整體精度,并減少識(shí)別器的工作負(fù)載。在識(shí)別階段,本文使用YOLOv8作為基礎(chǔ)模型。實(shí)驗(yàn)結(jié)果表明本文在識(shí)別階段使用的方法優(yōu)于其他方法。在未來(lái)的研究中,我們將進(jìn)一步考慮如何預(yù)處理不同場(chǎng)景的數(shù)據(jù),以提高系統(tǒng)整體的準(zhǔn)確性。

作者簡(jiǎn)介:

王智廣,教授,博士生導(dǎo)師,北京市教學(xué)名師。中國(guó)計(jì)算機(jī)學(xué)會(huì)(CCF)高級(jí)會(huì)員,全國(guó)高校實(shí)驗(yàn)室工作研究會(huì)信息技術(shù)專(zhuān)家指導(dǎo)委員會(huì)委員,全國(guó)高校計(jì)算機(jī)專(zhuān)業(yè)(本科)實(shí)驗(yàn)教材與實(shí)驗(yàn)室環(huán)境開(kāi)發(fā)專(zhuān)家委員會(huì)委員,北京市計(jì)算機(jī)教育研究會(huì)常務(wù)理事。長(zhǎng)期從事分布式并行計(jì)算、三維可視化、計(jì)算機(jī)視覺(jué)、知識(shí)圖譜方面的研究工作,主持或承擔(dān)國(guó)家重大科技專(zhuān)項(xiàng)子任務(wù)、國(guó)家重點(diǎn)研發(fā)計(jì)劃子課題、國(guó)家自然科學(xué)基金、北京市教委科研課題、北京市重點(diǎn)實(shí)驗(yàn)室課題、地方政府委托課題以及企業(yè)委托課題20余項(xiàng),在國(guó)內(nèi)外重要學(xué)術(shù)會(huì)議和期刊上合作發(fā)表學(xué)術(shù)論文70余篇,培養(yǎng)了100余名碩士博士研究生。