中文題目: 基于測(cè)井成巖相識(shí)別的多維自適應(yīng)深度聚類(lèi)模型
錄用期刊/會(huì)議:SPE Journal (中科院大類(lèi)三區(qū))
原文DOI:https://doi.org/10.2118/224431-PA
見(jiàn)刊時(shí)間:2025.4.9
作者列表:
1) 張麗英 中國(guó)石油大學(xué)(北京)人工智能學(xué)院 公共教學(xué)中心
2) 賀靜宇 中國(guó)石油大學(xué)(北京)人工智能學(xué)院 計(jì)算機(jī)技術(shù) 碩士 22
3) 陳潞夢(mèng) 中國(guó)石油大學(xué)(北京)人工智能學(xué)院 計(jì)算機(jī)技術(shù) 碩士 23
4) 毛治國(guó) 中國(guó)石油勘探開(kāi)發(fā)研究院
5) 石兵波 中國(guó)石油勘探開(kāi)發(fā)研究院
摘要:
測(cè)井成巖相識(shí)別是利用測(cè)井?dāng)?shù)據(jù)來(lái)識(shí)別巖石在成巖作用過(guò)程中形成的不同成巖相,主流的有監(jiān)督深度學(xué)習(xí)方法依賴(lài)大量標(biāo)注數(shù)據(jù),但成巖相的標(biāo)注樣本稀有且昂貴。因此本文面向測(cè)井成巖相識(shí)別的無(wú)監(jiān)督學(xué)習(xí)任務(wù),提出了無(wú)監(jiān)督學(xué)習(xí)的多維自適應(yīng)深度聚類(lèi)模型(Multi-dimensional Adaptive Deep Clustering,MADC),實(shí)現(xiàn)高維數(shù)據(jù)、復(fù)雜地質(zhì)環(huán)境下的測(cè)井成巖相類(lèi)別的自動(dòng)識(shí)別。該模型創(chuàng)新性地結(jié)合卷積注意力模塊(Convolutional AttenTion,CAT)和門(mén)控循環(huán)單元(GRU)混合模型的自編碼器技術(shù),從屬性和時(shí)空多個(gè)維度全面挖掘測(cè)井曲線(xiàn)特征,并引入Metropolis-Hastings算法實(shí)現(xiàn)自適應(yīng)學(xué)習(xí)成巖相類(lèi)別數(shù),為成巖相識(shí)別提供了一種更高效、經(jīng)濟(jì)的解決方案。在鄂爾多斯盆地的6個(gè)真實(shí)場(chǎng)景的測(cè)井?dāng)?shù)據(jù)集上進(jìn)行了大量實(shí)驗(yàn),驗(yàn)證了MADELINE方法的有效性與優(yōu)越性。實(shí)驗(yàn)結(jié)果表明,MADELINE在測(cè)井成巖相識(shí)別任務(wù)中的性能顯著優(yōu)于現(xiàn)有的聚類(lèi)模型。MADELINE模型為石油勘探開(kāi)發(fā)提供了低成本和快速的成巖相識(shí)別方法。該研究對(duì)儲(chǔ)層質(zhì)量評(píng)價(jià)、含油性預(yù)測(cè)及勘探開(kāi)發(fā)決策具有實(shí)際應(yīng)用價(jià)值。
背景與動(dòng)機(jī):
成巖相是表征儲(chǔ)集層性質(zhì)、類(lèi)型和優(yōu)劣的標(biāo)志,成巖相識(shí)別對(duì)高效勘探和開(kāi)發(fā)致密砂巖氣藏至關(guān)重要。目前成巖相識(shí)別的研究集中于使用依賴(lài)標(biāo)簽的監(jiān)督學(xué)習(xí)方法,然而成巖相標(biāo)簽的制作過(guò)程需借助精密儀器且依賴(lài)專(zhuān)家標(biāo)注,成本高昂,這極大限制了監(jiān)督學(xué)習(xí)方法的泛化應(yīng)用。因此,成巖相識(shí)別領(lǐng)域亟需一種高效且具備自適應(yīng)能力的無(wú)監(jiān)督學(xué)習(xí)方法。為了解決這些問(wèn)題,本研究提出了一種基于無(wú)監(jiān)督學(xué)習(xí)的深度聚類(lèi)模型MADELINE。
設(shè)計(jì)與實(shí)現(xiàn):
MADELINE模型由非對(duì)稱(chēng)自編碼器模塊和自適應(yīng)簇?cái)?shù)量學(xué)習(xí)模塊組成。非對(duì)稱(chēng)自編碼器模塊ASIA包括由卷積注意力和門(mén)控循環(huán)單元組成的編碼器以及由卷積注意力模塊組成的解碼器,其中,卷積注意力模塊用于提取關(guān)鍵屬性特征,從而捕捉測(cè)井屬性之間的相互依賴(lài)信息,門(mén)控循環(huán)單元用于處理測(cè)井?dāng)?shù)據(jù)的時(shí)空特征,特別是測(cè)井?dāng)?shù)據(jù)沿深度方向的相關(guān)性。這種設(shè)計(jì)充分結(jié)合測(cè)井?dāng)?shù)據(jù)的特性,有效促進(jìn)了模型提取高質(zhì)量的測(cè)井特征表示。自適應(yīng)簇?cái)?shù)量學(xué)習(xí)模塊ACME由兩個(gè)多層感知機(jī)組成,使用軟聚類(lèi)標(biāo)簽結(jié)合Metropolis-Hastings算法自適應(yīng)學(xué)習(xí)聚類(lèi)簇?cái)?shù)。
模型結(jié)構(gòu)如圖1所示,編碼器從高維測(cè)井?dāng)?shù)據(jù)中提取低維特征,解碼器通過(guò)重構(gòu)損失優(yōu)化特征質(zhì)量,聚類(lèi)模塊則根據(jù)特征分布自適應(yīng)劃分成巖相類(lèi)型。

圖1 MADELINE模型結(jié)構(gòu)圖
實(shí)驗(yàn)結(jié)果與分析:
為了驗(yàn)證所提方法的有效性,將MADELINE與三種經(jīng)典聚類(lèi)方法和四種前沿聚類(lèi)方法進(jìn)行比較。三種標(biāo)準(zhǔn)方法為Kmeans、DBSCAN和DPGMM。四種深度聚類(lèi)方法包括DeepDPM、CAE-KMeans和AE-KMeans。MADELINE分別在輪廓系數(shù)(SC)和方差比準(zhǔn)則(CHI)均取得最優(yōu)性能。對(duì)比模型相比,本文提出的方法在SC指標(biāo)上比性能最好的對(duì)比模型高8.94%。

利用t-SNE將DeepDPM、AE-KMeans、CAE-KMeans、MADC對(duì)Bai257數(shù)據(jù)集的聚類(lèi)結(jié)果可視化,如圖2所示,不同的成巖相類(lèi)型用不同顏色表示,虛線(xiàn)橢圓表示每類(lèi)數(shù)據(jù)在95%置信區(qū)間內(nèi)的分布范圍。圖3.4d為MADELINE方法的聚類(lèi)結(jié)果,相比其它方法的結(jié)果,其類(lèi)別之間的分界更加明確,且離群點(diǎn)更少。這表明MADELINE在處理測(cè)井?dāng)?shù)據(jù)時(shí)具有更好的聚類(lèi)性能,能夠更有效地將不同類(lèi)型成巖相區(qū)分開(kāi)。

圖2 特征可視化
結(jié)論:
MADELINE模型通過(guò)非對(duì)稱(chēng)自編碼器和自適應(yīng)聚類(lèi)模塊,有效解決了測(cè)井?dāng)?shù)據(jù)分布差異和標(biāo)簽稀缺的問(wèn)題,在成巖相識(shí)別任務(wù)中展現(xiàn)出優(yōu)越性能。該方法為油氣勘探提供了低成本、高效率的解決方案,具有顯著的實(shí)際應(yīng)用價(jià)值。未來(lái)可探索端到端特征提取與聚類(lèi)集成,以及半監(jiān)督學(xué)習(xí)優(yōu)化,進(jìn)一步提升模型精度和穩(wěn)健性。
作者簡(jiǎn)介:
張麗英,講師。博士,中國(guó)石油大學(xué)(北京)人工智能學(xué)院碩士生導(dǎo)師。主要研究方向:圖機(jī)器學(xué)習(xí)、時(shí)空數(shù)據(jù)挖掘、油氣人工智能及應(yīng)用。
聯(lián)系方式:[email protected]