大发888游戏平台下载-博客市网站-亚洲太阳开户送98元-正规皇冠投注网

科研動(dòng)態(tài)

面向電量分離任務(wù)的同用戶(hù)和跨用戶(hù)數(shù)據(jù)增強(qiáng)方法

中文題目:面向電量分離任務(wù)的同用戶(hù)和跨用戶(hù)數(shù)據(jù)增強(qiáng)方法

論文題目:Intra- and Inter-User Data Augmentation Methods for Energy Disaggregation

錄用期刊/會(huì)議:International Conference on Advanced Data Mining and Applications(EI國(guó)際會(huì)議)

原文DOI:https://doi.org/10.1007/978-981-96-0811-9_6

原文鏈接:https://link.springer.com/chapter/10.1007/978-981-96-0811-9_6

錄用/見(jiàn)刊時(shí)間:2024-12-13

作者列表

1)楊世杰 中國(guó)石油大學(xué)(北京)人工智能學(xué)院學(xué)院人工智能專(zhuān)業(yè) 本科 20

2)姜潔 中國(guó)石油大學(xué)(北京)人工智能學(xué)院學(xué)院 智能科學(xué)與技術(shù)系教師

3)孔秋強(qiáng) 香港中文大學(xué)電子工程學(xué)院 多媒體與信號(hào)處理系教師

背景與動(dòng)機(jī):

電量分離旨在通過(guò)分析用戶(hù)的總用電量來(lái)推斷各用電設(shè)備的能耗,現(xiàn)有的大多數(shù)基于深度學(xué)習(xí)的電量分離方法主要依賴(lài)于成對(duì)采集的標(biāo)簽數(shù)據(jù)和監(jiān)督學(xué)習(xí)策略。這通常需要入戶(hù)安裝傳感器,以同步采集電器級(jí)能耗數(shù)據(jù)和用戶(hù)總能耗數(shù)據(jù),但這種方法成本高昂且難以規(guī)?;?。為了減少對(duì)大規(guī)模標(biāo)簽數(shù)據(jù)采集的依賴(lài),學(xué)者們探索了多種數(shù)據(jù)增強(qiáng)方法用于電量分離,例如通過(guò)隨機(jī)混合和拼接擴(kuò)展現(xiàn)有的標(biāo)簽數(shù)據(jù)集,以及使用多智能體模擬家庭能耗行為生成合成數(shù)據(jù)集等。盡管這些方法已被證明能夠輔助電量分離任務(wù),但尚缺乏系統(tǒng)性的研究來(lái)探討標(biāo)簽數(shù)據(jù)結(jié)合數(shù)據(jù)增強(qiáng)技術(shù)在多大程度上可以提升電量分離模型的性能。為此,本研究從同用戶(hù)(intra-user)和跨用戶(hù)(inter-user)兩個(gè)角度,探索了如何增強(qiáng)訓(xùn)練數(shù)據(jù)的多樣性,以進(jìn)一步降低電量分離模型的分離誤差。

設(shè)計(jì)與實(shí)現(xiàn):

圖1展示了兩種數(shù)據(jù)增強(qiáng)方法的框架,該框架通過(guò)兩個(gè)模塊實(shí)現(xiàn)。第一個(gè)是用電設(shè)備用電周期數(shù)據(jù)提取模塊,該模塊基于用電設(shè)備用電量序列數(shù)據(jù),提取用電設(shè)備開(kāi)啟時(shí)段的用電量子序列,并根據(jù)目標(biāo)設(shè)備和對(duì)比設(shè)備將提取的用電量子序列分為兩類(lèi)。第二個(gè)是數(shù)據(jù)合成模塊,首先通過(guò)用電設(shè)備用電量序列數(shù)據(jù)識(shí)別目標(biāo)設(shè)備未開(kāi)啟的時(shí)間段,隨后將第一個(gè)模塊得到的用電量子序列數(shù)據(jù)與用戶(hù)總電量/用電設(shè)備用電量序列結(jié)合,用于生成新的數(shù)據(jù)樣本。

圖1 同用戶(hù)和跨用戶(hù)數(shù)據(jù)增強(qiáng)方法框架

兩個(gè)模塊的算法實(shí)現(xiàn)如下:

實(shí)驗(yàn)結(jié)果及分析:

表1展示了基于WaveNet和BERT的電量分離模型在原始REFIT數(shù)據(jù)集及采用不同數(shù)據(jù)增強(qiáng)方法生成的數(shù)據(jù)集上所得到的MAE和SAE??傮w而言,使用跨用戶(hù)(inter-user)增強(qiáng)數(shù)據(jù)集訓(xùn)練的WaveNet模型取得了最佳的MAE表現(xiàn),而使用同用戶(hù)(intra-user)增強(qiáng)數(shù)據(jù)集訓(xùn)練的BERT模型則在SAE指標(biāo)上表現(xiàn)最優(yōu)。

表1 不同數(shù)據(jù)增強(qiáng)方法的分離結(jié)果

圖2展示了電量分離模型在原始訓(xùn)練集以及由兩種提出的數(shù)據(jù)增強(qiáng)方法和基線(xiàn)方法生成的三個(gè)增強(qiáng)數(shù)據(jù)集上的分離結(jié)果。模型分別采用WaveNet或BERT,根據(jù)哪種模型在MAE或SAE指標(biāo)上表現(xiàn)最佳而選擇??梢杂^(guān)察到,使用同用戶(hù)和跨用戶(hù)數(shù)據(jù)增強(qiáng)方法獲得的分離結(jié)果在洗碗機(jī)、電熱水壺和洗衣機(jī)的真實(shí)用電量幅值上更接近實(shí)際情況。對(duì)于微波爐,盡管所提出的方法能夠更準(zhǔn)確地定位電器開(kāi)啟時(shí)段,但預(yù)測(cè)的用電量幅值總體上偏低。

圖2 不同數(shù)據(jù)增強(qiáng)方法的分離結(jié)果

結(jié)論:

本文分別從同用戶(hù)和跨用戶(hù)的角度出發(fā),探討了兩種用于電量分離的數(shù)據(jù)增強(qiáng)方法。這兩種方法利用同一用戶(hù)或不同用戶(hù)的用電設(shè)備的用電周期數(shù)據(jù),通過(guò)合成新的訓(xùn)練樣本來(lái)豐富各用戶(hù)的訓(xùn)練數(shù)據(jù)。此外,考慮到具有相似能耗模式的用電設(shè)備的影響,在數(shù)據(jù)增強(qiáng)過(guò)程中引入對(duì)比實(shí)例?;诠_(kāi)數(shù)據(jù)集REFIT的實(shí)驗(yàn)結(jié)果表明,采用本文提出的數(shù)據(jù)增強(qiáng)方法生成的增強(qiáng)數(shù)據(jù),能夠顯著提升基于WaveNet和BERT的電量分離模型的性能。

作者簡(jiǎn)介:

通訊作者簡(jiǎn)介: 姜潔,副研究員,博士,中國(guó)石油大學(xué)(北京)人工智能學(xué)院教師,主要研究領(lǐng)域?yàn)閭鞲衅鲾?shù)據(jù)挖掘、盲源分離、機(jī)器學(xué)習(xí)。