">
電子報
電子報

機器學習在石油工程中的機遇與挑戰(zhàn)并存——美國工程院院士張東曉做客第39期 “黃島講壇”




3月23日, 北京大學工學院院長、 研究生院常務副院長、 海洋研究院院長、 國家杰青獲得者, 美國國家工程院院士張東曉做客第 39 期黃島講壇, 為現(xiàn)場300余名師生做題為 “機器學習及其在石油工程中的應用” 的報告。中國石油大學學術委員會主任、 中國工程院院士孫金聲擔任大會主持。

把握機器學習新機遇

張東曉院士結合當下熱門的大數(shù)據(jù)與人工智能的應用, 深刻剖析機器學習在尋找非常規(guī)油氣 “甜點” 、 人工智能數(shù)據(jù)驅(qū)動描述注采關系、 利用機器學習生成地質(zhì)力學測井曲線以及利用集合神經(jīng)網(wǎng)絡預測水驅(qū)問題中的物理場等諸多方面的潛在應用。

隨著新一輪科技革命和產(chǎn)業(yè)變革正在萌發(fā), 大數(shù)據(jù)的形成、 理論算法的革新, 智能化已經(jīng)成為技術和產(chǎn)業(yè)發(fā)展的重要方向。

“機器學習是一種實現(xiàn)人工智能的方法, 深度學習是一種實現(xiàn)機器學習的技術。 ” 張東曉首先引出了人工智能和深度學習兩個概念, 并表示, 作為目前比較火熱的科研方向, 人工智能包括多個研究分支, 其中機器學習就是實現(xiàn)人工智能的方法之一。

“電影里的人工智能多半是在描繪強人工智能, 它有自主學習、 自主進化、 自我提高的功能,可以解決之前沒有遇到過的問題, 而目前我們的科研工作都集中在弱人工智能方面。 ” 張東曉結合淺顯易懂的例子, 為現(xiàn)場師生巧妙地解釋了人工智能和機器學習之間的區(qū)別和聯(lián)系。

張東曉從交叉學科和數(shù)據(jù)研究的角度指出機器學習的本質(zhì): 機器學習就是將概率論、 統(tǒng)計學等領域的知識與計算機技術進行交叉融合, 研究計算機如何模擬或?qū)崿F(xiàn)人類的學習行為以獲取新的知識或技能, 重新組織已有的知識結構, 并使之不斷改善自身的性能。 “機器學習就是在不直接針對問題進行編程的情況下,程序自動提高性能, 提取重要的模式和趨勢的研究領域。 ”

“機器的算法有多種多樣, 關鍵就在于如何選擇合適的算法。 ”張東曉結合目前的科研實例和自身經(jīng)驗講解回歸算法、 聚類算法、分類算法、 降維算法等多種算法的自身規(guī)律及適用范圍, 并以計算的數(shù)據(jù)量, 數(shù)據(jù)是否需要分類、是否需要分析數(shù)據(jù)結構等方面為依據(jù)介紹如何正確選擇算法以及算法的實際應用方法。

通過研究機器學習, 人類在進一步了解映射關系的同時, 還可以不斷增強機器的自我適應能力, 使機器學習能夠更好地運用在實踐操作中。

張東曉針對機器學習所處的現(xiàn)狀, 指出進一步發(fā)展面臨的挑戰(zhàn): 現(xiàn)階段數(shù)據(jù)不足, 難以進行深度學習計算, 算法結合也過于直接, 不能根據(jù)實際情況調(diào)整算法等問題, 成為限制機器學習領域發(fā)展的重要因素。

機器學習在石油開發(fā)中的應用與挑戰(zhàn)

“機器學習在石油工程中已經(jīng)有小部分的應用了, 但是還有更多的潛在應用等待發(fā)掘。 ” 張東曉院士詳細講解利用長短期記憶網(wǎng)絡補全測井曲線與生成人工測井曲線、 利用機器學習挖掘物理問題的控制方程、 頁巖氣開發(fā)主控因素大數(shù)據(jù)分析方法研究等諸多方面的潛在應用, 以及機器學習在數(shù)值模擬、 歷史擬合等方面的優(yōu)化作用, 講解機器學習在石油開發(fā)中的應用。

測井對于儲層描述和油氣資源評價而言非常重要, 但由于現(xiàn)代的技術受多種因素掣肘, 往往存在測井曲線缺失的現(xiàn)象, 而通過實驗獲得地質(zhì)力學測井曲線則會消耗大量精力與財力, 并且對于已經(jīng)進行了固井操作的油井更是難以實現(xiàn)。

面對這一問題, 機器學習在測井中的應用方法應運而生。該應用通過搭建專門為分析長期相關性而設計的長短期記憶神經(jīng)網(wǎng)絡, 構建端到端的機器學習模型, 結合地質(zhì)力學參數(shù)背后的物理機理, 可以基于易于獲得的常規(guī)測井曲線直接預測地質(zhì)力學曲線。

“針對復雜問題直接建立物理控制方程比較困難, 所以我們希望能夠利用觀測數(shù)據(jù)直接挖掘出控制方程。 ” 張東曉表示, 物理問題可能包含一些不同的物理過程, 對某一物理過程的描述可能存在不同的模型和許多待定的參數(shù)。而通過機器學習方法可以判斷發(fā)生的物理過程, 利用數(shù)據(jù)同化方法確定物理方程描述模型中的參數(shù)。

張東曉圍繞頁巖氣開發(fā)主控因素大數(shù)據(jù)分析方法研究, 從數(shù)據(jù)介紹著手展開討論。通過LASSO回歸、 回歸樹、 梯度提升機等方法對油層孔隙度、 含氣量、 壓力系數(shù)、 施工排量等18個影響參數(shù)進行分析。張東曉表示, 基于三種不同方法的結果可得出, 首年日產(chǎn)主要受井口壓力、 高產(chǎn)鉆遇長度和壓裂水平段長等壓裂參數(shù)影響; 由于該數(shù)據(jù)集中生產(chǎn)數(shù)據(jù)為短期數(shù)據(jù), 相比于壓裂參數(shù), 地質(zhì)靜態(tài)參數(shù)的影響難以判斷等結論。

“現(xiàn)階段機器學習在石油工程的潛在應用還比較初級, 大多僅僅為機器學習方法的簡單應用。 ” 但張東曉院士同樣認為, 通過機器學習的進一步研究與滲透, 石油領域在滲流機理、 油藏模擬、 測井分析以及鉆完井等領域或?qū)⒋嬖谥卮笸黄疲?機器學習等新興科技在未來石油勘探開發(fā)中大有可為。

學者簡介

張東曉, 教授, 博士生導師,美國國家工程院院士。北京大學工學院院長、 研究生院常務副院長、 海洋研究院院長、 國家杰青獲得者, “長江學者” 講座教授。美國地質(zhì)學會會士。地下水文學、 非常規(guī)油氣開采 (煤層氣、 頁巖氣) 、 二氧化碳地質(zhì)埋藏領域國際著名學者, 發(fā)表學術論文210余篇, 其中SCI論文170余篇, 其隨機理論建模、 數(shù)值計算、 歷史擬合和機器學習方面的研究成果已被國際同行廣泛采用。