遺傳演算法的文獻
『壹』 非線性解析反演與遺傳演算法的結合反演方法
周輝
(青島海洋大學海洋地球科學學院,青島266003)
何樵登
(長春地質學院地球物理系,長春130026)
摘要各向異性介質參數反演通常為非線性優化問題。非線性反演方法可以分為兩大類:隨機搜索方法,如Monte Carlo法、模擬退火和遺傳演算法及基於非線性最小平方理論的非線性解析反演方法。遺傳演算法能尋找到全局最優解,但它為一種較費時的方法。非線性解析反演方法能給出一個與初始模型有關的局部最優解。然而,這種方法具有較快的收斂速度。遺傳演算法與非線性解析反演方法相結合的反演方法利用這兩種反演方法的優點而克服其缺點。因此,結合反演方法既能快速收斂,又能尋找到全局最優解。如何合理地將遺傳演算法和非線性解析反演方法結合是十分重要的。本文提出一種結合方案,即在連續若干次遺傳演算法迭代後作一次非線性解析反演。理論算例表明結合反演方法具有上述特點。
關鍵詞遺傳演算法非線性解析反演非線性結合反演各向異性介質
1引言
遺傳演算法為隨機搜索類方法之一,它以概率論為理論基礎,用於求解多極值復雜優化問題[9]。遺傳演算法不要求已知模型空間中後驗概率密度的形狀並能廣泛搜索模型空間。遺傳演算法模擬自然選擇和遺傳規律,並遵循適者生存的原則。
遺傳演算法由Holland在1975年提出[4]。Berg首先將遺傳演算法應用於地球物理優化問題[1]。Stoffa等系統地研究了種群大小、交叉概率、選擇概率和變異概率對多參數優化問題收斂性和收斂速度的影響[11]。Sen等討論了在選擇概率中引入溫度參數的作用並提出一些退火方案[10]。周輝等則研究了目標函數與收斂速度和解的精度的關系[16]。
基於最小平方優化理論的非線性反演方法是兩大類反演方法之一。當給定的初始模型位於目標函數全局最優解所在的峰谷附近時,這種下降類方法能給出正確解而與初始模型位置無關。下降類演算法研究得較深入,應用較廣。
Tarantola提出一種基於廣義最小二乘法的多維多偏移距聲波地震波形解釋的一般性非線性地震波形反演方法[12]。隨後,Tarantola將該理論推廣於各向同性介質的彈性波反演[13]。Gauthier等用理論數據驗證了Tarantola提出的方法的正確性[2]。稍後,Tarantola研究非線性解析法反射波彈性反演的策略,指出以縱橫波的波阻抗和密度作為反演參數,才盡可能使反演參數之間相互獨立[14]。Pan用τ—P變換研究層狀聲學介質中平面波地震記錄非線性解析反演的理論和可行性[6]。為了更多地利用地震數據中的信息,包括VSP資料中反射和轉換信息,Mora作了一些工作[5]。當僅用反射數據時反演主要解決引起反射的P波和S波的波阻抗突變。當利用轉換數據時,則能分辨大尺度的P波和S波速度變化。Sambridge等改進了修改模型的方法[8]。在子空間中,可同時得到P波、S波波阻抗和密度。周輝等將非線性梯度反演方法推廣於多維、多道、多分量任意彈性各向異性介質參數的反演[17]。
非線性解析反演方法和遺傳演算法結合的反演方法利用非線性解析反演和遺傳演算法的優點,克服它們的缺點。因此,結合反演方法不僅能搜索到全局最優解,而且能較快地收斂。Porsani等在遺傳演算法和廣義線性反演方法相結合方面作了一些研究[7]。
本文討論各向異性介質的非線性解析反演方法和遺傳演算法與非線性解析反演方法相結合的結合反演方法[17]。對於遺傳演算法讀者可參考遺傳演算法的相關文獻[3,9~11]。
2各向異性介質參數非線性解析反演方法
2.1共軛梯度法
反演的目的是利用地面或井中測得的位移場ui(xr,t)求取地下介質密度分布ρ(x)和彈性參數分布Cijkl(x)。ρ(x)、Cijkl(x)稱為模型參數。x為研究介質中或邊界上任一點,x=(x1,x2,x3),xr為接收點。反演的目標是使目標函數
岩石圈構造和深部作用
取極小值。其中Cd、Cm分別為數據(波場)和模型參數的協方差運算元。m0為先驗模型參數,m為反演過程中求得的模型參數。由於模型參數有多個,故用向量表示。ucal為給定m的波動方程正演記錄,uobs為觀測波場,上角標t表示轉置。地震記錄u和模型參數m之間的函數關系為
岩石圈構造和深部作用
g為非線性運算元,(2)式為波動方程的運算元形式。記第n次迭代時的模型參數為mn,則有
岩石圈構造和深部作用
及共軛梯度法的迭代公式[15]
岩石圈構造和深部作用
其中Gn為g對mn的Frechet導數,ηn為一常數,可由多種方法計算[5,8]。
梯度
式(4)為梯度反演方法的基本公式。當該公式中的每一量都已知時,迭代就可進行。在這些變數中,最關鍵的是梯度向量。
2.2目標函數
在最小二乘理論中,權函數是協方差運算元逆的核。假設數據集中的誤差是不相關的,它僅取決於時間或源和接收器的位置,那麼有[14]
岩石圈構造和深部作用
其中σ為數據的均方差。
2.3各向異性介質中的彈性波動方程
令fi(x,t;xs)是第s次激發的內體力密度,Ti(x,t;xs)是地球表面S的應力矢量分量,ni(x)是表面的單位法向分量。那麼與第s次激發相應的位移由以下微分方程組給出[15]
岩石圈構造和深部作用
2.4梯度向量
式(4)中梯度向量的分量為[17]
岩石圈構造和深部作用
其中,T為地震記錄的長度,
岩石圈構造和深部作用
其中,t∈[T,0],
3結合反演方法
3.1遺傳演算法和非線性解析反演方法的優缺點
遺傳演算法是利用概率論來求解多極值復雜優化問題的一種隨機搜索方法,由一組隨機選取的模型開始,不需要更多的先驗信息,廣泛而有效地對模型空間的最優部分采樣。盡管遺傳演算法是基於自然選擇、遺傳規律,搜索模型空間的最優部分而求得最優解,但它是一種計算量很大的方法。由於地震模型空間大,用全局最優化方法估計各向異性介質參數的地震波形反演十分費時。
目標函數的梯度信息是非線性解析反演方法修改模型參數的依據,它能給出一個接近初始模型的一個局部最優解。如果初始模型選擇得合適,即當初始模型處在全局最優解所在的目標函數低谷時,非線性解析反演方法能收斂於全局最優解。然而,恰好給出一個接近全局最優解的初始模型的概率是非常小的,尤其對沒有模型參數的任何先驗信息的情況。但應強調的是,非線性解析反演方法具有較快的收斂速度。
發揮非線性解析反演方法快速收斂和遺傳演算法能搜索到全局最優解的優點,而克服前者僅能尋找到局部最優解和後者運算量大的缺點是很有意義的。非線性解析反演方法和遺傳演算法相結合的反演方法可達到上述目的。在結合反演方法中,遺傳演算法的作用是提供接近全局最優解的模型,非線性解析反演的作用是盡快求出全局最優解。因此,結合反演方法具有搜索到全局最優解的能力和比遺傳演算法收斂速度快的特點。
3.2結合方案
遺傳演算法在優化過程中連續不斷地搜索整個模型空間。在每次迭代結束後,得到一個本代的最優模型。根據遺傳演算法的數學原理[3],最優模型的數量在下一代中得以增加,同時經交叉和變異作用又有新的模型產生。在下一代種群中,最優模型可能與前一代的相同,也有可能劣於前一代的最優模型。所有這些最優模型可能在目標函數的同一低谷處,也有可能在其它低谷處。遺傳演算法尋找最優模型要經過多次迭代才能確定一個極值。遺傳演算法的隨機性導致遺傳演算法是一種費時的方法。然而正是遺傳演算法的這種隨機性保證了它能搜索到全局最優解。
如果將每次遺傳演算法迭代的最優解作為非線性解析反演的初始模型,非線性解析反演可以找出與初始模型毗鄰的局部最優解。由於非線性解析反演是一種確定性的方法,它按目標函數的梯度方向修改模型,所以非線性解析反演方法只需幾次迭代即可收斂。非線性解析反演求得的解是否為全局最優解,非線性解析反演方法本身是無法得以保證的。只有當遺傳演算法提供接近全局最優解的初始模型時,非線性解析方法反演才能收斂到全局最優解。
結合反演方法中遺傳演算法和非線性解析反演方法的匹配方式是十分重要的。非線性解析反演方法得到接近遺傳演算法提供的初始模型的局部最優解後,在以後若干代中因遺傳演算法的隨機性而使其最優解與該局部最優解相同。如果每次遺傳演算法迭代後作非線性解析反演,那麼結合反演的結果在幾代內都是相同的。顯然其中的一些非線性解析反演是沒有必要的。因此,結合方式應為在連續多次遺傳演算法迭代後作一次非線性解析反演,然後將非線性解析反演的結果作為下一代種群中的一個母本模型。圖1為結合反演的框圖。
圖1結合反演框圖
4算例
為了驗證結合反演方法的優越性,對一維多層橫向各向同性介質參數的反演理論實例作了分析。
圖2是目標函數值與迭代次數的關系圖。在該結合反演算例中每次遺傳演算法迭代後就作一次非線性解析反演迭代。結合反演的誤差在開始幾次迭代中下降很快,尤其在前3次。結合反演方法在第10次迭代達到的較小誤差,遺傳演算法在第42次迭代才達到。結合反演的誤差比遺傳演算法的跳躍得嚴重。這是因為非線性解析反演得到的模型在遺傳演算法中作為母代參加繁衍。這個模型因遺傳演算法的隨機性常常被新的模型替代。這兩個模型可能位於目標函數兩個不同的低谷中,因此非線性解析反演的結果不同。
盡管結合反演的目標函數有些振盪,但也存在連續幾次迭代目標函數幾乎不變的現象。這意味著這幾次迭代的最優模型是很接近的。在這種情況下非線性解析反演不能提供較大的改進。所以,此時的非線性解析反演是沒有必要的,否則只能增加計算量。
圖2結合反演(實線)和遺傳演算法(虛線)的誤差與迭代次數的關系
結合反演中每次遺傳演算法迭代後作一次非線性解析反演迭代
圖3是另一個例子。在該結合反演例子中,每五次遺傳演算法迭代作一次非線性解析反演。在這里遺傳演算法佔主要地位。此時結合反演的誤差函數明顯比遺傳演算法的小。結合反演的誤差在第5次迭代末突然下降,並在第10次迭代時的小誤差,遺傳演算法在42代才達到。遺傳演算法始終沒有到達結合反演的最小誤差。結合反演的誤差在後期迭代過程中平穩下降,這是遺傳演算法佔主導地位的原因。
從該例可知,若遺傳演算法與非線性解析反演方法比較合理地結合,結合反演方法比遺傳演算法具有快得多的收斂速度。
5結論
非線性結合反演方法揚遺傳演算法和非線性解析反演方法之長,抑其之短,它是一種具有較快收斂速度的全局反演方法。
在結合反演中遺傳演算法和非線性解析反演方法的結合方式是重要的。從算例可得出,五次遺傳演算法迭代後作一次非線性解析反演的結合反演的效果明顯優於每次遺傳演算法迭代後都作非線性解析反演的結合反演的效果。但是在結合反演中連續作多少次遺傳演算法迭代及連續迭代次數在整個迭代過程中的可變性還有待於進一步研究。
圖3結合反演(實線)和遺傳演算法(虛線)的誤差與迭代次數的關系
結合反演中每五次遺傳演算法迭代後作一次非線性解析反演迭代
在結合反演中遺傳演算法的作用是提供接近全局最優解的初始模型。結合反演的運算速度主要取決於遺傳演算法的運算速度。均勻設計理論可以應用於遺傳演算法以加快隨機搜索的速度。
與遺傳演算法相同,其它隨機搜索方法也可用來與非線性解析反演方法形成結合反演方法。
參考文獻
[1]E.Berg.Simple convergent genetic algorithm for inversion of multiparameter data.SEG60 Expanded Abstracts,1990,Ⅱ,1126~1128.
[2]O.Gauthier,J.Virieux and A.Tarantola.Two-dimensional nonlinear inversion of seismic waveforms:Numerical results.Geophysics,1986,51,1387~1403.
[3]D.E.Goldberg.Genetic Algorithms in Search,Optimiztion,and Machine Learning.Addison-Wesley,Reading,MA,1989.
[4]J.H.Holland.Adaptation in Natural and Artifical Systems.The University of Michigan Press,Ann Arbor,1975.
[5]P.Mora.2D elastic inversion of multi-offset seismic data.Geophysics,1988,52,2031~2050.
[6]G.S.Pan,R.A.Phinney,and R.I.Odom.Full-waveform inversion of plane-wave seismograms in stratified acoustic media:Theory and feasibility.Geophysics,1988,53,21~31.
[7]M.J.Porsani,P.L.Stoffa,M.K.Sen,et al..A combined Genetic and linear inversion algorithm for seismic wave-form inversion.SEG63 Expanded Abstracts,1993,692~695.
[8]M.S.Sambridge,A.Tatantola and Kennet.An alternative strategy for nonlinear inversion of seismic waveforms.Geophysical Prospecting,1991,39,723~736.
[9]M.Sambridge,and G.Drijkoningen.Genetic algorithms in seismic waveform inversion.Geophys.J.Int.,1992,109,323~342.
[10]M.K.Sen,P.L.Stoffa.Rapid sampling of model space using genetic algorithms:examples from seismic waveform inversion.Geophys.J.Int.,1992,109,323~342.
[11]P.L.Stoffa,M.K.Sen.Nonlinear multiparametre optimization using genetic algorithms:Inversion of plane-wave seismograms.Geophysics,1991,56,1794~1810.
[12]A.Tarantola.Inversion of seismic reflection data in the acoustic approximation.Geophysics,1984(a),49,1259~1266.
[13]A.Tarantola.The seismic reflection inverse problem.In:F.Santosa,Y.-H.Pao,W.W.System,and C.Holland Eds.Inverse problems of acoustic and elastic waves.Soc.Instr.Appl.Math.,1984(b),104~181.
[14]A.Tarantola.A strategy for nonlinear elastic inversion of seismic reflection data.Geophysics,1986,51,1893~1903.
[15]A.Tarantola.Inverse problem theory:Methods for data fitting and model parameter estimation.Elsevier Science Publ.Co.Inc.,1987.
[16]周輝,何樵登.遺傳演算法在各向異性介質參數反演中的應用.長春地質學院學報,1995,25,增刊1,62~67.
[17]周輝.各向異性介質波動方程正演及其非線性反演方法研究.長春地質學院博士論文,1995.
『貳』 基於遺傳演算法的疊前地震波形反演構建虛擬井曲線
羅文造1楊紹國2王英民3
(1.廣州海洋地質調查局 廣州 510760;2.成都理工大學 成都 610059;3.中國石油大學(北京)北京 102200)
第一作者簡介:羅文造,男,1969年出生,高級工程師,主要從事地球物理技術方法研究。
摘要 疊前地震波形反演能夠提供詳細的地下地層特徵,但由於其計算量大、數據和模型之間的非線性、目標函數的多極值和反演結果的多解性使疊前地震反演的實施成為一大難點。本文通過疊前和疊後混合反演技術採用遺傳演算法實現了深海無井地震反演。遺傳演算法思想簡單、易於實現和使用、具有隱含並行性和全局搜索能力等優點,基於遺傳演算法的疊前地震波形反演得到了與井中實際數據基本吻合的速度和密度數據。
關鍵詞 疊前反演 遺傳演算法 虛擬井
1 前言
地震反演分為疊前反演和疊後反演。一般疊前反演方法所得到的物理特性與疊後反演方法相比提供了更詳細的地下地層特徵。疊前反演解析度高,但速度慢、穩定性差,現處於研究階段,距大規模生產應用還有一定距離。疊後反演雖然解析度要低一些,但速度快、穩定性好,可滿足大規模生產應用的需要。
疊前地震波形反演所面臨的難題在於:①計算量和數據量非常龐大;②數據和模型之間高度非線性;③目標函數具有多個極小值;④反演結果具有多解性,可能存在多個模型與地震數據匹配良好(Sen等,1991)。非線性、非唯一性和大計算量交織在一起,使疊前地震波形反演的難度很大。但它對儲層岩性和所含流體的高解析度,對油氣勘探開發技術研究人員來說具有較大的吸引力。針對疊前地震波形反演所面臨的難題,近十年來,有許多地球物理工作者進行了大量的探索,取得了重要的研究成果,這些進展基本上解決了疊前地震波形反演所面臨的高度非線性和局部極小值問題;但對非唯一性和大計算量的問題沒得到很好解決。為此,有些學者採用了一種折中的辦法,即疊前和疊後混合反演的辦法,首先在一些控制點進行精細的疊前地震波形反演構建虛擬井曲線,然後以虛擬井作為控制信息進行疊後反演(Mallick,2000)。疊前和疊後混合反演的辦法利用了疊前反演解析度高,疊後反演速度快、穩定性好的優點,克服了各自的缺點,成為目前的一個研究亮點。特別對於深海無井的情況,具有很好的應用前景。本文採用疊前和疊後混合反演的辦法實現深海無井地震反演,其關鍵是疊前地震波形反演構建虛擬井曲線方法的研究。
2 遺傳演算法基本原理
遺傳演算法(Genetic Algorithm,簡稱GA)是美國Michigan大學的John H.Holland在60年代提出的,目的是把自然界的自適應機理應用於計算機系統的設計。目前,遺傳演算法作為一種有效的全局尋優自適應概率演算法,由於其演算法思想簡單、易於實現、易於使用、具有隱含並行性和全局搜索能力等優點,且對很多優化問題能夠較容易地得到令人滿意的解,在自適應控制、組合優化、模式識別、機器學習、人工智慧、地球物理反演、管理決策等涉及優化計算問題的領域得到了廣泛的應用,且影響越來越大。
盡管遺傳演算法在解決復雜非線性優化問題中具有獨特的優勢,但它本身也有局限性,其突出的一個弱點就是收斂性能差,尤其對於多參數、超大解空間的優化問題,其收斂速度有時讓人很難接受,這在一定程度上制約了GA的使用和發展(Sen等,1992)。採用GA求解高維、多約束、多目標的優化問題仍是一個沒有很好解決的課題,它的進展將會推動GA在許多工程領域的應用。
遺傳演算法是一種基於自然選擇和基因遺傳學原理的隨機搜索演算法,但又不同於一般隨機搜索演算法。它是通過將待尋優的模型空間的參數進行編碼,並用隨機選擇作為工具來引導搜索過程向著更高效的方向發展,其計算簡單、功能強大(Mallick,1995)。具有以下特點:
1)GA是對要尋優參數的編碼進行操作,而不是對參數本身;
2)GA是從「群體」(多個初始點)出發開始的並行操作,可以有效地防止搜索過程收斂於局部是優解,是一種全局尋優的方法,且計算速度較快;
3)GA採用目標函數來確定基因遺傳的概率,對問題的依賴性較小,適用范圍更廣;
4)GA的操作均採用隨機概率的方式,減少人為干預對結果的影響;
5)GA以隨機選擇來引導搜索過程,是一種啟發式的搜索方法,搜索效率更高;
6)GA適合於大規模復雜問題的優化,如地震反演問題。
遺傳演算法運算的原理簡單,只涉及參數編碼的復制和部分編碼的交換和變異操作,標准GA只包括選擇、交叉和變異三種基本操作:
(1)選擇(Selection)/再生(Reproction)
選擇是根據群體成員的適應度值fi,對群體成員進行復制的過程。其按照一定的概率選擇優秀成員並復制保留下來,體現「適者生存」的自然規律。
選擇運算有許多方法,最簡單的方法是採用輪盤賭法。該方法根據群體中各成員的適應度,計算適應概率fpi,適應度越大,適應概率越大。
(2)基因交換(Crossover)/重組(Recombination)
基因交換或重組由兩步構成,一是匹配,即對再生的群體成員做隨機匹配;二是交換匹配成員的基因,即對每對匹配成員,按照隨機概率Pc選擇隨機位置,將兩成員的編碼進行交換或重組。經過再生所得的新群體中並沒有新成員,也就是在搜索空間中沒有得到新的搜索點。而按隨機概率進行基因交換後,新群體中既有上一代的優秀成員,又有由優秀成員交叉後產生的新成員,得到的新搜索點。根據生物遺傳的「雜交優勢」規律,這種新成員應該優於原成員。
(3)基因變異(mutation)
基因變異的目的是在搜索過程中,不斷引入新的信息量,以免再生和交換的遺傳過程中丟失潛在的有用遺傳物質。基因變異實際上是對群體成員的基因按小概率Pm擾動而使其發生變化,以補充新的信息。
遺傳演算法求解優化問題的基本思路:
(1)確定目標函數
目標函數(Objects)是刻畫最優解的標准,也是適度計算的依據。一般是以計算值與觀測值之間的擬合程度或誤差大小為標準的。
(2)指定問題參數的搜索范圍
給定每一個模型參數的取值范圍,對任一參數x給出[Xmin,Xmax)。實際上是問題解空間搜索精度的描述,其決定了搜索空間的大小,精度越高,離散化的搜索空間越大。
(3)模型參數編碼
由於GA運算是對模型參數的編碼進行的。編碼方式有多種,常用的有二進制編碼和十進制編碼。
(4)初始群體的產生
給定群體成員數n,用隨機生成的方法獲取n個群體成員構成初始群體;
(5)遺傳計算
① 求取適應度值
適應度值是直接由目標函數轉換計算出來的。對最小化問題可用
指數轉換:
南海地質研究.2006
i=1,…,n
其中:Objects[i]為第i個成員的目標函數值;σ為群體目標函數值的方差;Fitness[i]為第i個成員的適應度值。
② 再生
計算再生概率:
南海地質研究.2006
Ps[0]=0;
南海地質研究.2006
i=1,…,n
生成[0,1]隨機數r,如果Ps[i-1]≤r<Ps[i]則第i個成員獲得再生。
③ 交叉
將群體成員兩兩配對,組成n/2對母本,並按概率Pc進行交叉;即產生[0,1]隨機數r,如果r<=Pc,則在一隨機位置交換兩個母本的編碼;否則不變。
④ 變異
對每一個新成員,按概率Pm進行基因的隨機突變,即產生[0,1]隨機數r,如果r<=Pm,則在一隨機位置改變該成員的編碼,由1變0,或由0變1。
遺傳演算法對問題的求解是通過對尋優參數空間進行編碼,從多點出發,採用隨機選擇作為工具來引導搜索過程向著更高效的方向發展,是一種普適性的搜索方法(Mallick,1999)。由於在搜索過程中使用了其父輩的適應度函數值作為啟發知識,因此又是一種啟發式搜索方法。這種搜索方法,對於簡單的多極值優化問題可能會產生好的效果。盡管如此,GA對於多參數復雜非線性問題收斂速度還是過慢(Xia等,1998)。
就遺傳演算法本身而言,提高其收斂速度的關鍵在於合理的適合問題特點的遺傳編碼方法、適應度函數及變換方法、遺傳運算元、演算法參數的設置和選取。
3 基於遺傳演算法的疊前地震波形反演
採用GA疊前地震波形反演估算彈性參數。疊前反演在角道集上進行,以便減少計算工作量。疊前資料預處理包括:角道集抽取、疊前去噪、壓制多次波和高精度速度分析等方。GA疊前地震波形反演的技術路線如圖1。
圖1 GA疊前地震波形反演框圖
Fig.1 The flow chart of pre-stack seismic waveform inversion by means of GA
其演算法如下:
1)准備初始模型、地震記錄Seis等數據
由高精度速度分析構建初始模型,地震記錄Seis為角道集地震記錄。
2)確定地質模型參數及參數搜索范圍和搜索間隔
3)對模型參數編碼。根據搜索范圍的搜索間隔,先確定各參數可能取得的不同值的個數,為節省空間對所有參數進行整數編碼。
4)生成擬合模型的初始隨機總體P,假設生成了n個隨機模型
由X=Xmin+Code×Dx,對Vp,Vs和ρ三個參數nt個樣點用隨機生成的方式生成整數碼產生要求的樣本量。
5)計算各模型的合成地震記錄Syni。
合成地震記錄採用Zoeppritz方程計算。
6)比較Syni與Seis,計算並保存目標函數值
觀測記錄與合成記錄之間的匹配程度稱為模型的擬合度(Inger等,1992),如果隨機模型與實際情況相差很遠,由觀測記錄計算得到的角道集與相應的合成角道集匹配就會很差。相反如果所選隨機模型接近實際情況,從而使由觀測記錄計算得到的角道集與相應的合成角道集能很好地匹配。
南海地質研究.2006
i=1,…,n
其中:n為群體樣本數;從理論上說,點越多,搜索效率應該越高。但實際上增加搜索點,也高增加了遺傳計算的計算量。因此解決實際問題時,根據問題的性質及解空間的大小,做適當選擇。在計算時,由於遺傳計算量相對較大,選擇了較小的群體。為便於操作和增加程序的適應能力,採用人機交互輸入的方式選擇8到32間的偶整數。
Nt=nt×angles;
nt:地震道時間取樣點數;
angles:角道集所選角度個數。
seis[j]:觀測記錄角道集
Syn[j][i]:第i個群體成員的合成記錄角道集
7)根據目標函數值對P做再生、交叉、變異操作,更新P生成新的隨機總體;
8)如果滿足結束條件,結束並輸出結果;否則重復5)至8)直到結束。
4 疊前地震波形反演的實施
針對地震波反演問題這種多參數、復雜非線性問題的特點採用了如下技術措施:
(1)編碼方法
對多參數、復雜非線性問題,其編碼的優劣直接影響計算效率。為此採用了整數編碼方案有效降低碼的長度,加快計算速度。參數編碼採用整數編碼,方法如下:
參數值=參數最小值+碼值×參數搜索精度;
碼值=(參數值-參數最小值)/參數搜索精度;
即:Dx=(Xmax-Xmin)/Codemax
X=Xmin+Code×Dx
Code=(X-Xmin)/Dx
(2)適應度函數
適應度函數是由目標函數轉換而得的用以刻劃個體適應生存能力的函數。對極小值問題一般採用指數變換,但這種變換是一種均勻變換,在計算後期當群體中各樣本目標函數值接近時,為增加優秀個體在再生時被選中的可能性,從而加快演算法收斂,選擇採用了S函數做疊加變換。
開始時使用指數變換:
南海地質研究.2006
i=1,…,n
其中:Objects[i]為第i個成員的目標函數值;σ為群體目標函數值的方差;Fitness[i]為第i個成員的適應度值。
當群體中樣本目標函數值接近時使用S函數變換:
南海地質研究.2006
用於在遺傳迭代計算後期,當群體各樣本適應度很接近時,以指數形式放大平均適應度以上的樣本適應度差異,縮小平均適應度以下的樣本適應度的差異,以便更好地選擇優秀個體(Sen,2001)。
式中:x對應用不同樣本的原適應度值;y為變換後的適應度值;θ0為所有樣本的平均適應度。a>0表示用於控制放大比例參數,越大對平均值以上的部分放大越明顯。b>0表示調節系數,當a=1時,可取b為8到10;b太大達不到對接近最大值處的適應度的放大,b較小時可用線性變換取代。
南海地質研究.2006
當然為達到上述目的,也可使用其它函數,選擇使用S函數,一是因為S變換的連續性,可使大於平均值的適應度放大,而使小於平均值的適應度縮小。二是基於前人的經驗增加優秀個體在再生時被選中的可能性,從而加快演算法收斂。
(3)演算法過程
一般GA在計算時採用的是上一代的適應度作為啟發函數再生後進行的隨機啟發搜索方法。為提高演算法速度在實際處理中除使用上一代的適應度,還充分利用了優秀的隔代遺傳的信息作為啟發信息,參與遺傳過程的計算。採用一種有限深度回溯搜索的方法,避免了迭代計算的反復,從而加快了計算收斂速度。事實上,在超大解空間中,某一代的遺傳性能往往很難決定最終結果的好壞。另外,在交叉中每對成員交叉變換使用兩次概率選擇方法,即先選成員對,再選參數,且每個參數分別選擇,這樣可以有效地增加搜索能力。
5 試算效果實例分析
圖2給出了理論地震記錄的基於遺傳演算法的疊前地震波形反演的實例。圖中展示了反演縱波速度和實際井中速度曲線,反演橫波速度和實際井中速度曲線,反演密度和實際井中密度曲線,理論地震角道集記錄和反演結果的合成角道集記錄。基於遺傳演算法疊前反演結果與井中實際數據基本吻合,理論地震角道集記錄和反演結果的合成角道集記錄吻合非常好。
圖2 基於遺傳演算法的疊前地震波形反演實例
Fig.2 A case for GA based pre-stack seismic waveform inversion
圖中從左到右為反演縱波速度和實際井中速度曲線,反演橫波速度和實際井中速度曲線,反演密度和實際井中密度曲線,5°理論地震角道集記錄和反演結果的合成角道集記錄,10°理論地震角道集記錄和反演結果的合成角道集記錄,15°理論地震角道集記錄和反演結果的合成角道集記錄,20°理論地震角道集記錄和反演結果的合成角道集記錄
參考文獻
Inger L,and Rosen B.1992.Genetic algorithms and very fast simulated annealing:A comparision,Math.Comput.Modelling,16,87~100
Mallick S.1995.Model-based inversion of amplitude-variation-with-offset data using a genetic algorithm,Geophysics,52,1355~1364
Mallick S.1999.Some practical aspects of prestack waveform inversion using a genetic algorthm:An example from the east Texas Woodbine gas sand,Geophysics,64,326~336
Mallick S.2000.Hybrid seismic inversion:A reconnaissance tool for deepwater exploration.The Leading Edge,19,1230~1237
Sen M K,and Stoffa P L.1991.Nonlinear one-dimensional seismic waveform inversion using simulated annealing,Geophysics,56,1624~1638
Sen M K,and Stoffa P L.1992.Rapid sampling of model space using genetic algorithms:Examples from seismic waveform inversion,Geophys.J.Internat.,108,281~292
Sen M K.2001.Pre-stack waveform inversion:Current status and future direction,Institute for Geophysics
Xia G,Sen M K,and Stoffa P L.1998.1-D elastic waveform inversion:A divide-and-conquer approach,Geophysics,63,1670~1684
The construction of pseudo-well logs by inversion of pre-stack seismic waveform based on genetic algorithm
Luo Wenzao1Yang Shaoguo2Wang Yingmin3
(1.Guangzhou Marine Geological Survey,Guangzhou,510760;2.Cheng University Sciences and Technologies,Cheng,610059;3.China Petroleum University,Beijing,102200)
Abstract:The inversion of pre-stack seismic waveform is capable of providing the detailed character of subsurface stratigraphy.But its large scale of calculation,the non-linear relationship between data and model,multi-pole of objective functions and its multi-resolution has resulted in the difficulty of its operation.The seismic inversion without well constrained in the deep sea has been realized by hybrid inversion of pre-and post-inversion.The genetic algorithm is simple,easy to realizing and using with the character of latent paralleling and global searching capability.The inversion of pre-stack seismic waveform based on genetic algorithm gives the velocity and density which consists basically with those from the wells.
Key Words:Pre-stack inversion Genetic algorithm Pseudo-well
『叄』 用改進遺傳演算法求取水文地質參數
任廣軍1 張勇2
(1.山東省魯南地質工程勘察院,兗州272000;2.山東省地礦工程集團有限公司,濟南250013)
作者簡介:任廣軍(1972—),男,工程師,主要從事水文地質、環境地質等。
摘要:本文利用非穩定流抽水試驗資料,採用改進的十進制遺傳演算法在計算機上自動優選含水層水文地質參數。該方法同傳統上使用的配線法相比較,具有節省時間,減少人工配線誤差,所求參數逼真,且能對一些線性、非線性問題求解,具有很高的推廣和應用價值。
關鍵詞:遺傳演算法;隨機模擬;含水層;水文地質參數;優選
0 引言
利用改進的十進制遺傳演算法,根據抽水試驗資料來認識水文地質條件、反求水文地質參數是水文地質計算中的基本問題。具體地講,在探明含水層范圍、類型的基礎上,建立描述該含水層水流運動模型,利用抽水試驗過程中的地下水位變化過程資料來確定水文地質參數。
雖然非穩定抽水試驗公式適用條件非常苛刻,但能反映出含水層非穩定流的一些基本特點,還可運用疊加原理解決某些比較復雜的非穩定流問題。此外,作為檢驗數值方法精確性的重要依據,具有廣泛應用和發展前景。
目前,由於非穩定流抽水試驗確定水文地質參數的具體實現方法主要有人工配線法或以計算輔助的配線法,但這種方法的效果好壞完全取決於肉眼觀察,帶有很大的主觀性。本文作者選取了一些典型實例,採用遺傳演算法建立了一種計算機全自動求參的全局優選法,通過與人工配線分析比較,確定本方法計算機求參的高精度與高可靠性。
求取參數是通過實測結果與模型計算結果的最佳擬合(模擬)程度來實現的,參數的精確程度在很大程度上取決於實測資料的精度。
1 遺傳演算法介紹
生物的進化是一個奇妙的優化過程,它通過選擇淘汰,突然變異,基因遺傳等規律產生適應環境變化的優良物種。遺傳演算法是根據生物進化思想而啟發得出的一種全局優化演算法。
遺傳演算法的概念最早是由Bagley J.D在1967年提出的;而開始遺傳演算法的理論和方法的系統性研究的是1975年,這一開創性工作是由Michigan大學的J.H.Holland所實行。當時,其主要目的是說明自然和人工系統的自適應過程。
遺傳演算法簡稱GA(Genetic Algorithm),在本質上是一種不依賴具體問題的直接搜索方法。遺傳演算法在模式識別、神經網路、圖像處理、機器學習、工業優化控制、自適應控制、生物科學、社會科學等方面都得到應用。在人工智慧研究中,現在人們認為「遺傳演算法、自適應系統、細胞自動機、混沌理論與人工智慧一樣,都是對今後十年的計算技術有重大影響的關鍵技術」。
2 目標函數的確定
通過綜合考慮計算程序的運算時間、速度以及含水層的類型,確立利用抽水實測資料和計算資料的擬合程度為目標函數。其計算公式為:
山東省環境地質文集
式中:s實測為實測抽水試驗觀測孔的降深;s計算為計算抽水試驗觀測孔的降深;NT為計算時段。
3 計算實例及結果分析
3.1 承壓含水層地下水降深公式
承壓含水層地下水降深公式為:
山東省環境地質文集
式中:S為以固定流量Q抽水時與抽水井距離為r處任一時間的水位降深(m);T為導水系數;Q為涌水量;W(u)為井函數,是一個指數積分函數:
山東省環境地質文集
式中:u為井函數的自變數,
例1:某地區進行非穩定流抽水試驗。區域地層剖面是:地表下18~25 m是由含礫粗砂層組成的含水層,其底板由粘土質沉積物組成,18 m以上是粘土、泥炭層。抽水井的過濾器安裝在含水層的整個厚度上。觀測孔距抽水井30m,觀測資料如表1所示。主井作定流量抽水,Q=788m3/d,抽水接近14小時。試根據觀測資料求取水文地質參數。
(1)lgS-lgt配線法所求參數:T配線=439m2/d,s配線=1.694×10-4;
(2)S-lgt直線圖解法所求參數:T配線=450.7m2/d,s配線=1.392×10-4;
(3)計算機所求參數:T=383.0088m2/d,s= 1.78×10-4。
為更直觀地說明上述所求參數的可靠性,由上述參數所求計算降深與實測降深進行比較(圖1)。通過比較,進一步確定了計算機求參的高精度與穩定性。承壓含水層配線參數與優選參數比較分析:T配線=439m2/d,s配線=0.0001694;T計算=383.0088m2/d,s計算=0.0001780。
表1 遺傳演算法計算水位降深與實測水位降深結果表
圖1 計算降深與實測降深比較圖
3.2 在有越流補給的承壓含水層地下水降深公式
在有越流補給的承壓含水層地下水降深公式為:
山東省環境地質文集
式中:u同(3)式;
山東省環境地質文集
例2:有一無限分布的承壓含水層,厚度20m,其底部為絕對隔水的粘土層;上部為弱透水的亞砂土層,厚2m;弱透水層之上為潛水含水層。在承壓含水層中有一完整抽水井,抽水時的穩定流量Q=5530m3/d。距抽水井r=17.34m處有一觀測孔據觀測知,在抽水過程中上部潛水的水位不變。抽水層的水位降深值載於表2,試計算含水層水文地質參數。
(1)lgS-lgt配線法所求參數:T配線=853.50m2/d,s配線=4.20×10-4;B配線=568.50m;
(2)lgS-lgt配線法所求參數:T計算=817.19m2/d,s計算=4.31×10-4;B計算=482.80m。
為更直觀地說明上述所求參數的可靠性,由上述參數所求計算降深與實測降深進行比較(圖2)。通過比較,進一步確定了計算機求參的高精度與穩定性。有越流時承壓含水層優選參數誤差分析:T配線=853.50m2/d,s配線=0.00042,B配線=568.50m;T計算=817.1950m2/d,s計算=0.00043103,B計算=482.798m。
表2 遺傳演算法計算水位降深與實測水位降深結果表
續表
圖2 計算降深與實測降深比較圖
3.3 考慮有滯後補給的潛水含水層地下水降深公式
根據博爾頓理論,潛水含水層地下水降深公式計算公式可分為抽水前期、抽水中期和抽水後期。參數優選主要根據抽水前期和抽水後期的資料擬合而得:
山東省環境地質文集
其中D為疏干因子。
抽水前期計算公式:
抽水後期計算公式:同(2)式。
4 結論及不足之處
4.1 結論
通過上述實例計算結果表明:計算結果同人工加以計算機輔助配線法相比較,其計算水文地質參數精度較高,且其參數初值依賴程度較低,對於復雜的線性、非線性及多態性、多峰值問題在全局優化方面有著其他方法所無法比擬的優勢,具有很高的推廣和應用價值。
4.2 不足之處
遺傳演算法雖然可以在多種領域都有實際應用,並且也展示了它潛力和寬廣前景;但是,遺傳演算法還有大量的問題需要研究,目前也還存在著各種不足。首先,在變數多,取值范圍大或無給定范圍時,收斂速度下降;其次,可找到最優解附近,但無法精確確定最優解位置;最後,遺傳演算法的參數選擇尚未有定量方法。對於遺傳演算法,一是還需要進一步研究其數學基礎理論;二是還需要在理論上證明它與其他優化技術的優劣及原因;三是還需研究硬體化的遺傳演算法;以及遺傳演算法的通用編程和形式等。此外,對於地下水滲流問題的數值解反求多類各種水文地質參數雖有成功實例,對於運算速度問題,還存在著相當大的難度。
參考文獻
陳崇希,唐仲華.1990.地下水流動問題數值方法.武漢:中國地質大學出版社
陳喜.1998.含水層水文地質參數自動優選方法.工程勘察,(2)
郭東屏.1994.地下水動力學.西安:陝西科學技術出版社
GB 50027—2001 供水水文地質勘察規范
李俊亭,王愈吉.1987.地下水動力學.北京:地質出版社
劉寶碇,趙瑞清,王綱.2003.不確定規劃及應用.北京:清華大學出版社
朱國祥,王峰.1999.利用配線法水文地質參數計算機程序簡介.工程勘察,(3)
鄒正盛,趙智榮.2001.淺析抽水水文地質參數確定中的問題.水文地質工程地質,(3)
『肆』 遺傳演算法第一次提出來是在什麼文獻中
《搜索、優化和機器學習中的遺傳演算法》。
遺傳演算法(Genetic Algorithm,GA)最早是由美國的 John holland於20世紀70年代提出,該演算法是根據大自然中生物體進化規律而設計提出的。是模擬達爾文生物進化論的自然選擇和遺傳學機理的生物進化過程的計算模型,是一種通過模擬自然進化過程搜索最優解的方法。
遺傳演算法的基本運算過程如下:
(1)初始化:設置進化代數計數器t=0,設置最大進化代數T,隨機生成M個個體作為初始群體P(0)。
(2)個體評價:計算群體P(t)中各個個體的適應度。
(3)選擇運算:將選擇運算元作用於群體。選擇的目的是把優化的個體直接遺傳到下一代或通過配對交叉產生新的個體再遺傳到下一代。選擇操作是建立在群體中個體的適應度評估基礎上的。
(4)交叉運算:將交叉運算元作用於群體。遺傳演算法中起核心作用的就是交叉運算元。
(5)變異運算:將變異運算元作用於群體。即是對群體中的個體串的某些基因座上的基因值作變動。群體P(t)經過選擇、交叉、變異運算之後得到下一代群體P(t+1)。
(6)終止條件判斷:若t=T,則以進化過程中所得到的具有最大適應度個體作為最優解輸出,終止計算。
『伍』 量子遺傳演算法的量子遺傳演算法發展簡介
前者的貢獻在於將量子多宇宙的概念引入遺傳演算法,利用多個宇宙的並行搜索,增大搜索范圍,利用宇宙之間的聯合交叉,實現信息的交流,從而整體上提高了演算法的搜索效率。但演算法中的多宇宙是通過分別產生多個種群獲得的,並沒有利用量子態,因而仍屬於常規遺傳演算法。後者將量子的態矢量表達引入遺傳編碼,利用量子旋轉門實現染色體的演化,實現了比常規遺傳演算法更好的效果。但該演算法主要用來解決0-1背包問題。編碼方案和量子旋轉門的演化策略不具有通用性,尤其是由於所有個體都朝一個目標演化,如果沒有交叉操作,極有可能陷入局部最優。
文獻[1]對QGA進行了改進,提出量子遺傳演算法(Quantum GeneticA lgorithm,QGA)。QGA採用多狀態基因量子比特編碼方式和通用的量子旋轉門操作。引入動態調整旋轉角機制和量子交叉,比文獻[2]的方法更具有通用性,且效率更高。但該方法仍是一個群體獨自演化沒有利用盈子信息的多宇宙和宇宙間的糾纏特性效率有待進一步提高。文獻[3]提出一種多宇宙並行量子遺傳演算法(Multiuniverse Parallel Quantum Genetic Algorithm,MPQGA),演算法中將所有的個體按照一定的拓撲結構分成一個個獨立的子群體,稱為宇宙;採用多狀態基因量子比特編碼方式來表達宇宙中的個體;採用通用的量子旋轉門策略和動態調整旋轉角機制對個體進行演化;各宇宙獨立演化,這樣可擴大搜索空間,宇宙之間採用最佳移民、量子交叉和量子變異操作來交換信息使演算法的適應性更強,效率更高。