大发888游戏平台下载-博客市网站-亚洲太阳开户送98元-正规皇冠投注网

科研動(dòng)態(tài)

高效的兩輪車(chē)違法駕駛行為檢測(cè)模型

中文題目:高效的兩輪車(chē)違法駕駛行為檢測(cè)模型

論文題目Efficient Detection Model of Illegal Driving Behavior in Two-Wheeled Vehicles

錄用期刊/會(huì)議The 2024 Twentieth International Conference on Intelligent Computing (CCF C類(lèi)會(huì)議)

作者列表

1) 祝留宇 中國(guó)石油大學(xué)(北京)人工智能學(xué)院 計(jì)算機(jī)科學(xué)與技術(shù)專(zhuān)業(yè) 23

2 王智廣 中國(guó)石油大學(xué)(北京)人工智能學(xué)院 計(jì)算機(jī)科學(xué)與技術(shù)系教師

3 劉志強(qiáng) 中國(guó)石油大學(xué)(北京)人工智能學(xué)院 計(jì)算機(jī)科學(xué)與技術(shù)專(zhuān)業(yè) 23

4 李曉雪 中國(guó)石油大學(xué)(北京)人工智能學(xué)院 計(jì)算機(jī)科學(xué)與技術(shù)專(zhuān)業(yè) 23

5) 李   珅 中國(guó)石油大學(xué)(北京)人工智能學(xué)院 計(jì)算機(jī)技術(shù)系 碩23

文章簡(jiǎn)介:

隨著現(xiàn)代智能交通系統(tǒng)的快速發(fā)展,兩輪車(chē)違法駕駛行為的智能化檢測(cè)成為了提升交通管理效率與安全性的關(guān)鍵環(huán)節(jié)。然而,這一領(lǐng)域的研究與實(shí)踐面臨著兩大核心挑戰(zhàn):數(shù)據(jù)集的稀缺性與檢測(cè)模型性能的不盡如人意。針對(duì)這些挑戰(zhàn),本文開(kāi)展了一系列創(chuàng)研究工作。

摘要:

兩輪車(chē)違法駕駛行為的智能化檢測(cè)是構(gòu)建現(xiàn)代智能交通監(jiān)管系統(tǒng)的一個(gè)重要部分。然而,在這個(gè)領(lǐng)域的智能化檢測(cè)面臨著兩個(gè)主要問(wèn)題:第一個(gè)問(wèn)題是缺乏相關(guān)的開(kāi)源數(shù)據(jù)集,第二個(gè)問(wèn)題是當(dāng)前主流的目標(biāo)檢測(cè)模型在兩輪車(chē)違法駕駛行為檢測(cè)任務(wù)上的精度和速度不夠理想。針對(duì)以上問(wèn)題,本文構(gòu)建了一個(gè)兩輪車(chē)違法駕駛行為檢測(cè)數(shù)據(jù)集(TIDBD dataset),并且提出了適用于兩輪車(chē)違法駕駛行為檢測(cè)任務(wù)的高效模型YOLOv8_VanillaBlock。

背景與動(dòng)機(jī):

目前,關(guān)于兩輪車(chē)違法駕駛行為檢測(cè)領(lǐng)域的開(kāi)源數(shù)據(jù)集極為稀缺,僅有的幾個(gè)開(kāi)源數(shù)據(jù)集標(biāo)注類(lèi)別也較為單一,無(wú)法推動(dòng)該領(lǐng)域的研究發(fā)展。此外,主流的目標(biāo)檢測(cè)模型在兩輪車(chē)違法駕駛行為檢測(cè)任務(wù)上表現(xiàn)并不理想,需要做進(jìn)一步的改進(jìn)。

主要內(nèi)容: 

1、TIDBD 數(shù)據(jù)集構(gòu)建

我們構(gòu)建了專(zhuān)門(mén)用于兩輪車(chē)違法駕駛行為檢測(cè)的數(shù)據(jù)集TIDBD(Two-wheeled vehicle Illegal Driving Behavior Detection)。我們采集數(shù)據(jù)的方式有兩種,第一種方式是使用水平相機(jī)在城市內(nèi)部道路固定路口持續(xù)拍攝。然后對(duì)拍攝的視頻進(jìn)行幀提取。第二種方式是在國(guó)道、省道以及城市內(nèi)部道路上,利用高架攝像頭進(jìn)行抓拍。我們主要標(biāo)注了使用手機(jī)、正/逆向行駛、非法加裝改裝、是否佩戴頭盔等10種駕駛行為。最終,我們得到了3637張真實(shí)采集且詳細(xì)標(biāo)注的圖片。TIDBD 數(shù)據(jù)集的數(shù)據(jù)分布如表1所示。

表1 不同采集方式和采集地點(diǎn)在TIDBD數(shù)據(jù)集中所占的比例

image.png

(1) VanillaBlock

我們借鑒Vanillanet的思想設(shè)計(jì)出了VanillaBlock。圖1展示了我們所設(shè)計(jì)的VanillaBlock的結(jié)構(gòu),其由兩個(gè)卷積層和兩個(gè)池化層組成,中間有一個(gè)激活函數(shù)。VanillaBlock模塊的最后一個(gè)組成部分是由n個(gè)激活函數(shù)組成的序列激活函數(shù)。

圖1 VanillaBlock結(jié)構(gòu)圖示意圖

 

為了證明我們所提出的VanillaBlock的計(jì)算復(fù)雜度相對(duì)于C2f模塊有所減少,我們對(duì)C2f模塊和VanillaBlock中各個(gè)組件的計(jì)算復(fù)雜度進(jìn)行了估算,并給出了如下公式。

以YOLOv8l骨干網(wǎng)絡(luò)的最后一個(gè)C2f模塊和YOLOv8_VanillaBlock_l骨干網(wǎng)絡(luò)的最后一個(gè)VanillaBlock為例, 。由于 遠(yuǎn)遠(yuǎn)小于 ,故可以忽略不計(jì),則C2f和VanillaBlock的計(jì)算復(fù)雜度之比 。

(2) YOLOv8_VanillaBlock

為了提升YOLOv8在GPU上的檢測(cè)速度,我們?cè)赩anillaBlock的基礎(chǔ)之上,搭建了一種新的骨干網(wǎng)絡(luò)Yolov8_VanillaBlock,其整體結(jié)構(gòu)圖如圖2所示。

圖2 YOLOv8_VanillaBlock骨干網(wǎng)絡(luò)結(jié)構(gòu)示意圖

實(shí)驗(yàn)結(jié)果及分析:

1、檢測(cè)準(zhǔn)確率和FLOPs對(duì)比分析

我們?cè)赥IDBD數(shù)據(jù)集上使用較大尺寸的YOLOv8l和YOLOv8_VanillaBlock_l模型進(jìn)行實(shí)驗(yàn),以平衡檢測(cè)精度和模型大小。以平均精度(AP50)為評(píng)價(jià)標(biāo)準(zhǔn)對(duì)兩種模型進(jìn)行比較。實(shí)驗(yàn)結(jié)果表明(圖3所示),我們提出的YOLOv8_VanillaBlock_l在“use phone”、“canopy”等檢測(cè)類(lèi)別上顯著優(yōu)于原始的YOLOv8l。

圖3 YOLOv8_VanillaBlock_l與YOLOv8l在TIDBD數(shù)據(jù)集上不同檢測(cè)類(lèi)別AP50的對(duì)比

 

表2 YOLOv8_VanillaBlock與YOLOv8準(zhǔn)確率及計(jì)算量對(duì)比

 

表2顯示,與尺寸為n、s、m、l、x的YOLOv8模型相比,我們提出的具有相應(yīng)尺寸的YOLOv8_VanillaBlock模型的FLOPs分別降低了18.5%、21.8%、30.2%、26.7%和37.5%,mAP50分別提高了1.45%、0.5%、0.18%、1.31%和2.2%。這些結(jié)果表明,我們所提出的YOLOv8_VanillaBlock模型相對(duì)于原來(lái)的YOLOv8模型在FLOPs有所降低的同時(shí)獲得了更高的準(zhǔn)確率。

2、檢測(cè)速度與實(shí)時(shí)性比較

我們測(cè)試了當(dāng)輸入圖片分別縮放到320、640以及1088時(shí)的檢測(cè)時(shí)間和FPS,檢測(cè)時(shí)間測(cè)試結(jié)果見(jiàn)圖4,F(xiàn)PS測(cè)試結(jié)果見(jiàn)表3。

圖4 不同尺寸的YOLOv8_VanillaBlock與YOLOv8在不同大小的圖片上檢測(cè)時(shí)間的對(duì)比


 表3 YOLOv8_VanillaBlock與YOLOv8在不同尺寸的輸入圖片下的FPS

 

從圖4可以看出,在相同的輸入圖像尺寸下,YOLOv8_VanillaBlock模型的檢測(cè)時(shí)間始終低于相應(yīng)尺寸的原始YOLOv8模型。當(dāng)輸入圖像大小為1088時(shí),檢測(cè)速度的提高尤為明顯。從表3可以看出,對(duì)于相同大小的輸入圖像,YOLOv8_VanillaBlock模型每秒處理的幀數(shù)始終高于YOLOv8模型。當(dāng)輸入圖像為1088時(shí),YOLOv8_VanillaBlock的FPS分別比對(duì)應(yīng)尺寸的YOLOv8高14.2%、3.9%、13.7%、16.1%、30.2%。結(jié)果表明,我們提出的方法可以顯著提高YOLOv8的檢測(cè)速度。

結(jié)論:

本文構(gòu)建了專(zhuān)門(mén)用于兩輪車(chē)違法駕駛行為檢測(cè)的數(shù)據(jù)集TIDBD,解決了相關(guān)領(lǐng)域開(kāi)源數(shù)據(jù)集稀缺的問(wèn)題。在此基礎(chǔ)上,提出了YOLOv8_VanillaBlock這一專(zhuān)門(mén)用于兩輪車(chē)違法駕駛行為檢測(cè)的模型。實(shí)驗(yàn)結(jié)果證明,我們所提出的模型在檢測(cè)精度和檢測(cè)速度上都優(yōu)于基線(xiàn)模型。

通訊作者簡(jiǎn)介:

王智廣,教授,博士生導(dǎo)師,北京市教學(xué)名師。中國(guó)計(jì)算機(jī)學(xué)會(huì)(CCF)高級(jí)會(huì)員,全國(guó)高校實(shí)驗(yàn)室工作研究會(huì)信息技術(shù)專(zhuān)家指導(dǎo)委員會(huì)委員,北京市計(jì)算機(jī)教育研究會(huì)常務(wù)理事。長(zhǎng)期從事分布式并行計(jì)算、三維可視化、計(jì)算機(jī)視覺(jué)、知識(shí)圖譜方面的研究工作,主持或承擔(dān)國(guó)家重大科技專(zhuān)項(xiàng)子任務(wù)、國(guó)家重點(diǎn)研發(fā)計(jì)劃子課題、國(guó)家自然科學(xué)基金、北京市教委科研課題、北京市重點(diǎn)實(shí)驗(yàn)室課題、地方政府委托課題以及企業(yè)委托課題20余項(xiàng),在國(guó)內(nèi)外重要學(xué)術(shù)會(huì)議和期刊上合作發(fā)表學(xué)術(shù)論文70余篇,培養(yǎng)了100余名碩士博士研究生。