中文題目:基于改進(jìn)高斯聚類(lèi)算法的原油采購(gòu)與調(diào)和集成優(yōu)化加速求解方法
論文題目:An Improved Gaussian Clustering Algorithm to Accelerate the Solving of Integrated Optimization of Crude Oil Procurement and Blending
錄用期刊/會(huì)議: Industrial & Engineering Chemistry Research (中科院大類(lèi)3區(qū),CAA B類(lèi)期刊)
原文DOI:https://doi.org/10.1021/acs.iecr.4c03924
原文鏈接:https://pubs.acs.org/doi/full/10.1021/acs.iecr.4c03924
錄用/見(jiàn)刊時(shí)間:2025年3月18日
作者列表:
1)鄭萬(wàn)鵬 中國(guó)石油大學(xué)(北京)自動(dòng)化系 博19
2)高小永 中國(guó)石油大學(xué)(北京)自動(dòng)化系 教師
3)潘 輝 中國(guó)石油獨(dú)山子石化分公司
4)左 信 中國(guó)石油大學(xué)(北京)自動(dòng)化系 教師
5)黃德先 清華大學(xué)自動(dòng)化系 教師
6)張歆瞳 中國(guó)石油大學(xué)(北京)自動(dòng)化系 博22
7)黃付宇 中國(guó)石油大學(xué)(北京)自動(dòng)化系 碩20
文章簡(jiǎn)介:
本文提出了一種改進(jìn)的高斯混合模型(GMM)算法,用于加速原油采購(gòu)與調(diào)和集成優(yōu)化問(wèn)題的求解。針對(duì)原油采購(gòu)與調(diào)和過(guò)程中原油種類(lèi)過(guò)多導(dǎo)致模型難以求解的問(wèn)題,文章通過(guò)引入改進(jìn)的GMM算法進(jìn)行原油預(yù)篩選,有效縮小了搜索空間,從而顯著提高了求解效率。
摘要:
原油采購(gòu)與調(diào)和工藝是煉油企業(yè)生產(chǎn)運(yùn)營(yíng)的核心環(huán)節(jié),其集成優(yōu)化對(duì)保障調(diào)和油性質(zhì)穩(wěn)定至關(guān)重要。然而,當(dāng)候選原油種類(lèi)過(guò)多時(shí),集成模型將變得難以甚至無(wú)法求解。針對(duì)這一問(wèn)題,本文提出一種改進(jìn)的高斯聚類(lèi)算法,通過(guò)預(yù)先篩選合適的原油參與集成優(yōu)化,從而大幅壓縮求解空間并提升計(jì)算效率。首先,本文詳細(xì)介紹了用于原油聚類(lèi)的改進(jìn)GMM算法,并提出了帶有價(jià)格補(bǔ)償函數(shù)的期望最大化(EM)算法,以減少原油價(jià)格波動(dòng)對(duì)聚類(lèi)結(jié)果的影響。隨后,通過(guò)實(shí)際案例和對(duì)比實(shí)驗(yàn)驗(yàn)證了改進(jìn)GMM算法的有效性。結(jié)果顯示,改進(jìn)后的GMM算法將求解時(shí)間縮短了約90%。改進(jìn)后的GMM算法可以顯著提高求解效率,而帶有價(jià)格補(bǔ)償函數(shù)的EM算法則能有效降低原油價(jià)格波動(dòng)對(duì)聚類(lèi)結(jié)果的影響。最后,本文提出的基于原油預(yù)選的優(yōu)化方法為現(xiàn)場(chǎng)應(yīng)用奠定了基礎(chǔ)并提供了可能性。
背景與動(dòng)機(jī):
煉油企業(yè)的原油采購(gòu)與調(diào)和過(guò)程是生產(chǎn)和運(yùn)營(yíng)的核心環(huán)節(jié),其集成優(yōu)化對(duì)于保證調(diào)和油性質(zhì)的穩(wěn)定具有至關(guān)重要的意義。隨著全球原油市場(chǎng)的日益復(fù)雜和多樣化,煉油企業(yè)面臨著越來(lái)越多的原油選擇。然而,候選原油種類(lèi)的增加給集成優(yōu)化模型的求解帶來(lái)了巨大的挑戰(zhàn)。一方面,原油的性質(zhì)差異顯著,包括硫含量、氮含量、重金屬含量、收率等多個(gè)維度,這些因素都直接影響著原油的調(diào)和效果和煉油過(guò)程的經(jīng)濟(jì)性。另一方面,傳統(tǒng)的優(yōu)化算法在處理大規(guī)模變量和約束時(shí),往往計(jì)算復(fù)雜度高,求解效率低,難以滿(mǎn)足實(shí)際生產(chǎn)的需求。
在此背景下,本文提出了基于改進(jìn)高斯聚類(lèi)算法的原油預(yù)選方法,旨在通過(guò)預(yù)先篩選出合適的原油種類(lèi),大幅度縮小集成優(yōu)化模型的搜索空間,從而提高求解效率。這一方法的提出,不僅解決了傳統(tǒng)優(yōu)化算法在處理大規(guī)模原油數(shù)據(jù)庫(kù)時(shí)的局限性,也為煉油企業(yè)的原油采購(gòu)與調(diào)和集成優(yōu)化提供了新的思路和解決方案。
設(shè)計(jì)與實(shí)現(xiàn):
在對(duì)原油數(shù)據(jù)庫(kù)進(jìn)行聚類(lèi)任務(wù)時(shí),經(jīng)典高斯混合模型得到的聚類(lèi)結(jié)果往往加劇了調(diào)和原油目標(biāo)產(chǎn)率優(yōu)化后的波動(dòng)性。在極端情況下,這種波動(dòng)性可能超過(guò)預(yù)設(shè)的可接受范圍。經(jīng)過(guò)深入分析,已確定該問(wèn)題的根源在于原油價(jià)格數(shù)據(jù)維度與各蒸餾組分產(chǎn)率數(shù)據(jù)維度之間的相關(guān)性干擾。原油價(jià)格與餾分產(chǎn)率之間的相互作用會(huì)導(dǎo)致經(jīng)典GMM算法的下聚類(lèi)效果不佳。為了有效解決上述問(wèn)題,本文提出了一種改進(jìn)的GMM算法,該算法在EM算法的M步中加入了價(jià)格補(bǔ)償函數(shù),以提高GMM的聚類(lèi)性能。這種改進(jìn)方法的核心思想是利用原油價(jià)格數(shù)據(jù)與其他相關(guān)數(shù)據(jù)之間的互信息來(lái)修改原始的對(duì)數(shù)似然函數(shù)。通過(guò)這一改進(jìn)策略,GMM算法可以更好地捕捉數(shù)據(jù)之間的復(fù)雜關(guān)系,從而獲得更準(zhǔn)確和穩(wěn)定的聚類(lèi)結(jié)果。改進(jìn)的GMM算法的相關(guān)公式推導(dǎo)過(guò)程將簡(jiǎn)要概述如下:
1. 高斯混合模型的概率密度函數(shù)
GMM模型假設(shè)所有的n個(gè)數(shù)據(jù)點(diǎn)
都是由k個(gè)高斯分布生成的,每個(gè)高斯分布稱(chēng)為一個(gè)成分。對(duì)于這k個(gè)高斯成分,每個(gè)成分的概率密度函數(shù)如方程(3.1)所示。

2. 潛變量與完整數(shù)據(jù)的對(duì)數(shù)似然函數(shù)
引入潛在變量
,其中
=1表示第i個(gè)數(shù)據(jù)點(diǎn)
屬于第j個(gè)高斯成分,而
=0則表示不屬于。包含潛在變量的完整數(shù)據(jù)的對(duì)數(shù)似然函數(shù)如式(3.2)所示。其中,
表示第j個(gè)成分的權(quán)重,且所有成分的權(quán)重之和為1,即
。

給定
,對(duì)數(shù)似然函數(shù)(3.2)可以進(jìn)一步簡(jiǎn)化為方程(3.3):
![]()
當(dāng)在EM算法中融入價(jià)格補(bǔ)償函數(shù)時(shí),方程(3.3)需要修改為方程(3.4)。其中,ρ為補(bǔ)償因子,當(dāng)原油價(jià)格較高且目標(biāo)餾分產(chǎn)率也較高時(shí),ρ取負(fù)值,且原油價(jià)格越高,ρ值越??;反之,當(dāng)原油價(jià)格較高但目標(biāo)餾分產(chǎn)率較低時(shí),ρ取正值,且原油價(jià)格越高,ρ值越大。
![]()
3. E步:計(jì)算期望值
在E步中,根據(jù)當(dāng)前參數(shù)估計(jì)值
和潛在變量的后驗(yàn)分布,計(jì)算完整數(shù)據(jù)對(duì)數(shù)似然的期望值,如方程(3.5)所示:

設(shè)該后驗(yàn)分布表示為
。然后,按照方程(3.6)所示計(jì)算期望值:
![]()
引入一個(gè)期望公式
,期望的計(jì)算可以簡(jiǎn)化為方程(3.7):
![]()
4. M步:最大化期望
在EM算法中,在M步通過(guò)最大化Q(θ, θ^((t)))來(lái)更新參數(shù)θ,如方程(3.8)所示:
![]()
在M步中可以添加一個(gè)價(jià)格補(bǔ)償函數(shù),以選擇與不完整數(shù)據(jù)密切相關(guān)的缺失數(shù)據(jù),從而降低缺失數(shù)據(jù)的不確定性。假設(shè)X是與原油價(jià)格數(shù)據(jù)相關(guān)的離散隨機(jī)變量,Z是與原油蒸餾餾分產(chǎn)率相關(guān)的離散隨機(jī)變量,p(x,z)是它們的聯(lián)合概率分布,p(x)和p(z)分別是它們的邊緣概率分布。那么,價(jià)格補(bǔ)償函數(shù)由方程(3.9)表示。在這里,條件熵H(X∣Z)用于量化在給定Z的條件下X的平均不確定性;而價(jià)格補(bǔ)償函數(shù)PRC(X;Z)則衡量了Z對(duì)X不確定性的影響程度。如果Z與X之間不存在相關(guān)性,則價(jià)格補(bǔ)償函數(shù)PRC(X;Z)的值為0。

基于修改后的對(duì)數(shù)似然函數(shù),即方程(3.4),方程(3.8)需要修改為方程(3.10):

其中,
的公式由方程(3.11)給出:
![]()
實(shí)驗(yàn)結(jié)果及分析:
為驗(yàn)證改進(jìn)的高斯混合模型(GMM)算法在解決實(shí)際生產(chǎn)案例中的有效性,我們基于一個(gè)以燃料為導(dǎo)向的裝置案例進(jìn)行了仿真。以案例1的仿真結(jié)果為例,表1列出了基于聚類(lèi)結(jié)果優(yōu)化求解得到的調(diào)和原油性質(zhì)。
Table 1. Properties of the blended crude oils in Case 1.

基于表1所示結(jié)果,使用改進(jìn)GMM算法求解得到的調(diào)和原油性質(zhì)與理想狀態(tài)的差距明顯小于使用經(jīng)典GMM算法求解得到的數(shù)據(jù),這表明使用改進(jìn)GMM算法求解所得調(diào)和原油的性質(zhì)更為穩(wěn)定,變化范圍更小。同時(shí),使用改進(jìn)GMM算法求解得到的目標(biāo)餾分中調(diào)和原油的收率相較于初始產(chǎn)品的提升均高于使用經(jīng)典GMM算法求解得到的結(jié)果,這表明使用改進(jìn)GMM算法求解所得調(diào)和原油在目標(biāo)蒸餾餾分中的收率提升更大,展現(xiàn)出更好的加工性能。
此外,為證明所提出的改進(jìn)GMM算法能夠解決原油采購(gòu)與調(diào)和過(guò)程集成優(yōu)化問(wèn)題的挑戰(zhàn),本文分析了案例1-3中集成優(yōu)化模型中的關(guān)鍵指標(biāo),詳見(jiàn)表2。其中,Case1、2和3表示在直接基于初始原油數(shù)據(jù)庫(kù)進(jìn)行優(yōu)化求解時(shí)的統(tǒng)計(jì)結(jié)果,而Case 1*、2*和3*則表示先使用改進(jìn)GMM算法對(duì)原油數(shù)據(jù)庫(kù)進(jìn)行聚類(lèi)再進(jìn)行優(yōu)化求解的結(jié)果?;诒?結(jié)果可知,使用改進(jìn)GMM算法后,變量數(shù)量、約束數(shù)量以及求解時(shí)間均大幅減少。因此,本文提出的改進(jìn)GMM算法解決了在大規(guī)模原油數(shù)據(jù)庫(kù)下集成優(yōu)化求解困難的問(wèn)題。通過(guò)利用聚類(lèi)算法對(duì)原油數(shù)據(jù)庫(kù)進(jìn)行初步篩選,可有效排除明顯不可行的解,從而顯著縮小了求解空間。
Table 2. Number of variables and constraints for Cases 1–3.

結(jié)論:
本文提出了一種改進(jìn)的GMM算法,并將其應(yīng)用于原油采購(gòu)與調(diào)和調(diào)度的集成優(yōu)化問(wèn)題中。首先,通過(guò)在EM算法中添加價(jià)格補(bǔ)償函數(shù),提出了GMM算法的改進(jìn)策略,以解決原油價(jià)格波動(dòng)對(duì)聚類(lèi)結(jié)果的干擾。通過(guò)實(shí)際案例驗(yàn)證了改進(jìn)GMM算法在解決集成優(yōu)化問(wèn)題時(shí)的有效性。仿真結(jié)果表明,改進(jìn)GMM算法能夠有效縮小集成優(yōu)化模型規(guī)模,解決了因原油種類(lèi)過(guò)多而導(dǎo)致的集成優(yōu)化問(wèn)題求解難題。然而,改進(jìn)GMM算法仍需人工設(shè)定K值,不合理的K值在很大程度上會(huì)影響聚類(lèi)結(jié)果。因此,如何對(duì)原油數(shù)據(jù)進(jìn)行有效處理,并通過(guò)結(jié)合深度學(xué)習(xí)的聚類(lèi)算法實(shí)現(xiàn)更高精度的原油聚類(lèi),是未來(lái)工作的研究方向。
通訊作者簡(jiǎn)介:
高小永,人工智能學(xué)院副院長(zhǎng),教授,博士生導(dǎo)師,石大學(xué)者,校青年拔尖人才,自動(dòng)化專(zhuān)業(yè)及控制科學(xué)與工程學(xué)科建設(shè)負(fù)責(zé)人,擔(dān)任北京自動(dòng)化學(xué)會(huì)常務(wù)理事、中國(guó)自動(dòng)化學(xué)會(huì)過(guò)程控制專(zhuān)業(yè)委員會(huì)委員、中國(guó)自動(dòng)化學(xué)會(huì)教育工作委員會(huì)委員、中國(guó)化工學(xué)會(huì)信息技術(shù)應(yīng)用專(zhuān)業(yè)委員會(huì)副秘書(shū)長(zhǎng)、中國(guó)系統(tǒng)工程學(xué)會(huì)過(guò)程系統(tǒng)工程專(zhuān)業(yè)委員會(huì)委員等。研究領(lǐng)域?yàn)閺?fù)雜石油石化工業(yè)過(guò)程智能制造,主要方向有:機(jī)理與數(shù)據(jù)驅(qū)動(dòng)的故障診斷、復(fù)雜工業(yè)過(guò)程建模與優(yōu)化控制、工業(yè)過(guò)程計(jì)劃與調(diào)度優(yōu)化等。主持國(guó)家自然科學(xué)基金項(xiàng)目2項(xiàng)、北京市自然科學(xué)基金面上項(xiàng)目1項(xiàng)、校企聯(lián)合項(xiàng)目30多項(xiàng),發(fā)表SCI/EI等各類(lèi)論文50多篇。
Email:[email protected]