遗传算法的文献
‘壹’ 非线性解析反演与遗传算法的结合反演方法
周辉
(青岛海洋大学海洋地球科学学院,青岛266003)
何樵登
(长春地质学院地球物理系,长春130026)
摘要各向异性介质参数反演通常为非线性优化问题。非线性反演方法可以分为两大类:随机搜索方法,如Monte Carlo法、模拟退火和遗传算法及基于非线性最小平方理论的非线性解析反演方法。遗传算法能寻找到全局最优解,但它为一种较费时的方法。非线性解析反演方法能给出一个与初始模型有关的局部最优解。然而,这种方法具有较快的收敛速度。遗传算法与非线性解析反演方法相结合的反演方法利用这两种反演方法的优点而克服其缺点。因此,结合反演方法既能快速收敛,又能寻找到全局最优解。如何合理地将遗传算法和非线性解析反演方法结合是十分重要的。本文提出一种结合方案,即在连续若干次遗传算法迭代后作一次非线性解析反演。理论算例表明结合反演方法具有上述特点。
关键词遗传算法非线性解析反演非线性结合反演各向异性介质
1引言
遗传算法为随机搜索类方法之一,它以概率论为理论基础,用于求解多极值复杂优化问题[9]。遗传算法不要求已知模型空间中后验概率密度的形状并能广泛搜索模型空间。遗传算法模拟自然选择和遗传规律,并遵循适者生存的原则。
遗传算法由Holland在1975年提出[4]。Berg首先将遗传算法应用于地球物理优化问题[1]。Stoffa等系统地研究了种群大小、交叉概率、选择概率和变异概率对多参数优化问题收敛性和收敛速度的影响[11]。Sen等讨论了在选择概率中引入温度参数的作用并提出一些退火方案[10]。周辉等则研究了目标函数与收敛速度和解的精度的关系[16]。
基于最小平方优化理论的非线性反演方法是两大类反演方法之一。当给定的初始模型位于目标函数全局最优解所在的峰谷附近时,这种下降类方法能给出正确解而与初始模型位置无关。下降类算法研究得较深入,应用较广。
Tarantola提出一种基于广义最小二乘法的多维多偏移距声波地震波形解释的一般性非线性地震波形反演方法[12]。随后,Tarantola将该理论推广于各向同性介质的弹性波反演[13]。Gauthier等用理论数据验证了Tarantola提出的方法的正确性[2]。稍后,Tarantola研究非线性解析法反射波弹性反演的策略,指出以纵横波的波阻抗和密度作为反演参数,才尽可能使反演参数之间相互独立[14]。Pan用τ—P变换研究层状声学介质中平面波地震记录非线性解析反演的理论和可行性[6]。为了更多地利用地震数据中的信息,包括VSP资料中反射和转换信息,Mora作了一些工作[5]。当仅用反射数据时反演主要解决引起反射的P波和S波的波阻抗突变。当利用转换数据时,则能分辨大尺度的P波和S波速度变化。Sambridge等改进了修改模型的方法[8]。在子空间中,可同时得到P波、S波波阻抗和密度。周辉等将非线性梯度反演方法推广于多维、多道、多分量任意弹性各向异性介质参数的反演[17]。
非线性解析反演方法和遗传算法结合的反演方法利用非线性解析反演和遗传算法的优点,克服它们的缺点。因此,结合反演方法不仅能搜索到全局最优解,而且能较快地收敛。Porsani等在遗传算法和广义线性反演方法相结合方面作了一些研究[7]。
本文讨论各向异性介质的非线性解析反演方法和遗传算法与非线性解析反演方法相结合的结合反演方法[17]。对于遗传算法读者可参考遗传算法的相关文献[3,9~11]。
2各向异性介质参数非线性解析反演方法
2.1共轭梯度法
反演的目的是利用地面或井中测得的位移场ui(xr,t)求取地下介质密度分布ρ(x)和弹性参数分布Cijkl(x)。ρ(x)、Cijkl(x)称为模型参数。x为研究介质中或边界上任一点,x=(x1,x2,x3),xr为接收点。反演的目标是使目标函数
岩石圈构造和深部作用
取极小值。其中Cd、Cm分别为数据(波场)和模型参数的协方差算子。m0为先验模型参数,m为反演过程中求得的模型参数。由于模型参数有多个,故用向量表示。ucal为给定m的波动方程正演记录,uobs为观测波场,上角标t表示转置。地震记录u和模型参数m之间的函数关系为
岩石圈构造和深部作用
g为非线性算子,(2)式为波动方程的算子形式。记第n次迭代时的模型参数为mn,则有
岩石圈构造和深部作用
及共轭梯度法的迭代公式[15]
岩石圈构造和深部作用
其中Gn为g对mn的Frechet导数,ηn为一常数,可由多种方法计算[5,8]。
梯度
式(4)为梯度反演方法的基本公式。当该公式中的每一量都已知时,迭代就可进行。在这些变量中,最关键的是梯度向量。
2.2目标函数
在最小二乘理论中,权函数是协方差算子逆的核。假设数据集中的误差是不相关的,它仅取决于时间或源和接收器的位置,那么有[14]
岩石圈构造和深部作用
其中σ为数据的均方差。
2.3各向异性介质中的弹性波动方程
令fi(x,t;xs)是第s次激发的内体力密度,Ti(x,t;xs)是地球表面S的应力矢量分量,ni(x)是表面的单位法向分量。那么与第s次激发相应的位移由以下微分方程组给出[15]
岩石圈构造和深部作用
2.4梯度向量
式(4)中梯度向量的分量为[17]
岩石圈构造和深部作用
其中,T为地震记录的长度,
岩石圈构造和深部作用
其中,t∈[T,0],
3结合反演方法
3.1遗传算法和非线性解析反演方法的优缺点
遗传算法是利用概率论来求解多极值复杂优化问题的一种随机搜索方法,由一组随机选取的模型开始,不需要更多的先验信息,广泛而有效地对模型空间的最优部分采样。尽管遗传算法是基于自然选择、遗传规律,搜索模型空间的最优部分而求得最优解,但它是一种计算量很大的方法。由于地震模型空间大,用全局最优化方法估计各向异性介质参数的地震波形反演十分费时。
目标函数的梯度信息是非线性解析反演方法修改模型参数的依据,它能给出一个接近初始模型的一个局部最优解。如果初始模型选择得合适,即当初始模型处在全局最优解所在的目标函数低谷时,非线性解析反演方法能收敛于全局最优解。然而,恰好给出一个接近全局最优解的初始模型的概率是非常小的,尤其对没有模型参数的任何先验信息的情况。但应强调的是,非线性解析反演方法具有较快的收敛速度。
发挥非线性解析反演方法快速收敛和遗传算法能搜索到全局最优解的优点,而克服前者仅能寻找到局部最优解和后者运算量大的缺点是很有意义的。非线性解析反演方法和遗传算法相结合的反演方法可达到上述目的。在结合反演方法中,遗传算法的作用是提供接近全局最优解的模型,非线性解析反演的作用是尽快求出全局最优解。因此,结合反演方法具有搜索到全局最优解的能力和比遗传算法收敛速度快的特点。
3.2结合方案
遗传算法在优化过程中连续不断地搜索整个模型空间。在每次迭代结束后,得到一个本代的最优模型。根据遗传算法的数学原理[3],最优模型的数量在下一代中得以增加,同时经交叉和变异作用又有新的模型产生。在下一代种群中,最优模型可能与前一代的相同,也有可能劣于前一代的最优模型。所有这些最优模型可能在目标函数的同一低谷处,也有可能在其它低谷处。遗传算法寻找最优模型要经过多次迭代才能确定一个极值。遗传算法的随机性导致遗传算法是一种费时的方法。然而正是遗传算法的这种随机性保证了它能搜索到全局最优解。
如果将每次遗传算法迭代的最优解作为非线性解析反演的初始模型,非线性解析反演可以找出与初始模型毗邻的局部最优解。由于非线性解析反演是一种确定性的方法,它按目标函数的梯度方向修改模型,所以非线性解析反演方法只需几次迭代即可收敛。非线性解析反演求得的解是否为全局最优解,非线性解析反演方法本身是无法得以保证的。只有当遗传算法提供接近全局最优解的初始模型时,非线性解析方法反演才能收敛到全局最优解。
结合反演方法中遗传算法和非线性解析反演方法的匹配方式是十分重要的。非线性解析反演方法得到接近遗传算法提供的初始模型的局部最优解后,在以后若干代中因遗传算法的随机性而使其最优解与该局部最优解相同。如果每次遗传算法迭代后作非线性解析反演,那么结合反演的结果在几代内都是相同的。显然其中的一些非线性解析反演是没有必要的。因此,结合方式应为在连续多次遗传算法迭代后作一次非线性解析反演,然后将非线性解析反演的结果作为下一代种群中的一个母本模型。图1为结合反演的框图。
图1结合反演框图
4算例
为了验证结合反演方法的优越性,对一维多层横向各向同性介质参数的反演理论实例作了分析。
图2是目标函数值与迭代次数的关系图。在该结合反演算例中每次遗传算法迭代后就作一次非线性解析反演迭代。结合反演的误差在开始几次迭代中下降很快,尤其在前3次。结合反演方法在第10次迭代达到的较小误差,遗传算法在第42次迭代才达到。结合反演的误差比遗传算法的跳跃得严重。这是因为非线性解析反演得到的模型在遗传算法中作为母代参加繁衍。这个模型因遗传算法的随机性常常被新的模型替代。这两个模型可能位于目标函数两个不同的低谷中,因此非线性解析反演的结果不同。
尽管结合反演的目标函数有些振荡,但也存在连续几次迭代目标函数几乎不变的现象。这意味着这几次迭代的最优模型是很接近的。在这种情况下非线性解析反演不能提供较大的改进。所以,此时的非线性解析反演是没有必要的,否则只能增加计算量。
图2结合反演(实线)和遗传算法(虚线)的误差与迭代次数的关系
结合反演中每次遗传算法迭代后作一次非线性解析反演迭代
图3是另一个例子。在该结合反演例子中,每五次遗传算法迭代作一次非线性解析反演。在这里遗传算法占主要地位。此时结合反演的误差函数明显比遗传算法的小。结合反演的误差在第5次迭代末突然下降,并在第10次迭代时的小误差,遗传算法在42代才达到。遗传算法始终没有到达结合反演的最小误差。结合反演的误差在后期迭代过程中平稳下降,这是遗传算法占主导地位的原因。
从该例可知,若遗传算法与非线性解析反演方法比较合理地结合,结合反演方法比遗传算法具有快得多的收敛速度。
5结论
非线性结合反演方法扬遗传算法和非线性解析反演方法之长,抑其之短,它是一种具有较快收敛速度的全局反演方法。
在结合反演中遗传算法和非线性解析反演方法的结合方式是重要的。从算例可得出,五次遗传算法迭代后作一次非线性解析反演的结合反演的效果明显优于每次遗传算法迭代后都作非线性解析反演的结合反演的效果。但是在结合反演中连续作多少次遗传算法迭代及连续迭代次数在整个迭代过程中的可变性还有待于进一步研究。
图3结合反演(实线)和遗传算法(虚线)的误差与迭代次数的关系
结合反演中每五次遗传算法迭代后作一次非线性解析反演迭代
在结合反演中遗传算法的作用是提供接近全局最优解的初始模型。结合反演的运算速度主要取决于遗传算法的运算速度。均匀设计理论可以应用于遗传算法以加快随机搜索的速度。
与遗传算法相同,其它随机搜索方法也可用来与非线性解析反演方法形成结合反演方法。
参考文献
[1]E.Berg.Simple convergent genetic algorithm for inversion of multiparameter data.SEG60 Expanded Abstracts,1990,Ⅱ,1126~1128.
[2]O.Gauthier,J.Virieux and A.Tarantola.Two-dimensional nonlinear inversion of seismic waveforms:Numerical results.Geophysics,1986,51,1387~1403.
[3]D.E.Goldberg.Genetic Algorithms in Search,Optimiztion,and Machine Learning.Addison-Wesley,Reading,MA,1989.
[4]J.H.Holland.Adaptation in Natural and Artifical Systems.The University of Michigan Press,Ann Arbor,1975.
[5]P.Mora.2D elastic inversion of multi-offset seismic data.Geophysics,1988,52,2031~2050.
[6]G.S.Pan,R.A.Phinney,and R.I.Odom.Full-waveform inversion of plane-wave seismograms in stratified acoustic media:Theory and feasibility.Geophysics,1988,53,21~31.
[7]M.J.Porsani,P.L.Stoffa,M.K.Sen,et al..A combined Genetic and linear inversion algorithm for seismic wave-form inversion.SEG63 Expanded Abstracts,1993,692~695.
[8]M.S.Sambridge,A.Tatantola and Kennet.An alternative strategy for nonlinear inversion of seismic waveforms.Geophysical Prospecting,1991,39,723~736.
[9]M.Sambridge,and G.Drijkoningen.Genetic algorithms in seismic waveform inversion.Geophys.J.Int.,1992,109,323~342.
[10]M.K.Sen,P.L.Stoffa.Rapid sampling of model space using genetic algorithms:examples from seismic waveform inversion.Geophys.J.Int.,1992,109,323~342.
[11]P.L.Stoffa,M.K.Sen.Nonlinear multiparametre optimization using genetic algorithms:Inversion of plane-wave seismograms.Geophysics,1991,56,1794~1810.
[12]A.Tarantola.Inversion of seismic reflection data in the acoustic approximation.Geophysics,1984(a),49,1259~1266.
[13]A.Tarantola.The seismic reflection inverse problem.In:F.Santosa,Y.-H.Pao,W.W.System,and C.Holland Eds.Inverse problems of acoustic and elastic waves.Soc.Instr.Appl.Math.,1984(b),104~181.
[14]A.Tarantola.A strategy for nonlinear elastic inversion of seismic reflection data.Geophysics,1986,51,1893~1903.
[15]A.Tarantola.Inverse problem theory:Methods for data fitting and model parameter estimation.Elsevier Science Publ.Co.Inc.,1987.
[16]周辉,何樵登.遗传算法在各向异性介质参数反演中的应用.长春地质学院学报,1995,25,增刊1,62~67.
[17]周辉.各向异性介质波动方程正演及其非线性反演方法研究.长春地质学院博士论文,1995.
‘贰’ 基于遗传算法的叠前地震波形反演构建虚拟井曲线
罗文造1杨绍国2王英民3
(1.广州海洋地质调查局 广州 510760;2.成都理工大学 成都 610059;3.中国石油大学(北京)北京 102200)
第一作者简介:罗文造,男,1969年出生,高级工程师,主要从事地球物理技术方法研究。
摘要 叠前地震波形反演能够提供详细的地下地层特征,但由于其计算量大、数据和模型之间的非线性、目标函数的多极值和反演结果的多解性使叠前地震反演的实施成为一大难点。本文通过叠前和叠后混合反演技术采用遗传算法实现了深海无井地震反演。遗传算法思想简单、易于实现和使用、具有隐含并行性和全局搜索能力等优点,基于遗传算法的叠前地震波形反演得到了与井中实际数据基本吻合的速度和密度数据。
关键词 叠前反演 遗传算法 虚拟井
1 前言
地震反演分为叠前反演和叠后反演。一般叠前反演方法所得到的物理特性与叠后反演方法相比提供了更详细的地下地层特征。叠前反演分辨率高,但速度慢、稳定性差,现处于研究阶段,距大规模生产应用还有一定距离。叠后反演虽然分辨率要低一些,但速度快、稳定性好,可满足大规模生产应用的需要。
叠前地震波形反演所面临的难题在于:①计算量和数据量非常庞大;②数据和模型之间高度非线性;③目标函数具有多个极小值;④反演结果具有多解性,可能存在多个模型与地震数据匹配良好(Sen等,1991)。非线性、非唯一性和大计算量交织在一起,使叠前地震波形反演的难度很大。但它对储层岩性和所含流体的高分辨率,对油气勘探开发技术研究人员来说具有较大的吸引力。针对叠前地震波形反演所面临的难题,近十年来,有许多地球物理工作者进行了大量的探索,取得了重要的研究成果,这些进展基本上解决了叠前地震波形反演所面临的高度非线性和局部极小值问题;但对非唯一性和大计算量的问题没得到很好解决。为此,有些学者采用了一种折中的办法,即叠前和叠后混合反演的办法,首先在一些控制点进行精细的叠前地震波形反演构建虚拟井曲线,然后以虚拟井作为控制信息进行叠后反演(Mallick,2000)。叠前和叠后混合反演的办法利用了叠前反演分辨率高,叠后反演速度快、稳定性好的优点,克服了各自的缺点,成为目前的一个研究亮点。特别对于深海无井的情况,具有很好的应用前景。本文采用叠前和叠后混合反演的办法实现深海无井地震反演,其关键是叠前地震波形反演构建虚拟井曲线方法的研究。
2 遗传算法基本原理
遗传算法(Genetic Algorithm,简称GA)是美国Michigan大学的John H.Holland在60年代提出的,目的是把自然界的自适应机理应用于计算机系统的设计。目前,遗传算法作为一种有效的全局寻优自适应概率算法,由于其算法思想简单、易于实现、易于使用、具有隐含并行性和全局搜索能力等优点,且对很多优化问题能够较容易地得到令人满意的解,在自适应控制、组合优化、模式识别、机器学习、人工智能、地球物理反演、管理决策等涉及优化计算问题的领域得到了广泛的应用,且影响越来越大。
尽管遗传算法在解决复杂非线性优化问题中具有独特的优势,但它本身也有局限性,其突出的一个弱点就是收敛性能差,尤其对于多参数、超大解空间的优化问题,其收敛速度有时让人很难接受,这在一定程度上制约了GA的使用和发展(Sen等,1992)。采用GA求解高维、多约束、多目标的优化问题仍是一个没有很好解决的课题,它的进展将会推动GA在许多工程领域的应用。
遗传算法是一种基于自然选择和基因遗传学原理的随机搜索算法,但又不同于一般随机搜索算法。它是通过将待寻优的模型空间的参数进行编码,并用随机选择作为工具来引导搜索过程向着更高效的方向发展,其计算简单、功能强大(Mallick,1995)。具有以下特点:
1)GA是对要寻优参数的编码进行操作,而不是对参数本身;
2)GA是从“群体”(多个初始点)出发开始的并行操作,可以有效地防止搜索过程收敛于局部是优解,是一种全局寻优的方法,且计算速度较快;
3)GA采用目标函数来确定基因遗传的概率,对问题的依赖性较小,适用范围更广;
4)GA的操作均采用随机概率的方式,减少人为干预对结果的影响;
5)GA以随机选择来引导搜索过程,是一种启发式的搜索方法,搜索效率更高;
6)GA适合于大规模复杂问题的优化,如地震反演问题。
遗传算法运算的原理简单,只涉及参数编码的复制和部分编码的交换和变异操作,标准GA只包括选择、交叉和变异三种基本操作:
(1)选择(Selection)/再生(Reproction)
选择是根据群体成员的适应度值fi,对群体成员进行复制的过程。其按照一定的概率选择优秀成员并复制保留下来,体现“适者生存”的自然规律。
选择运算有许多方法,最简单的方法是采用轮盘赌法。该方法根据群体中各成员的适应度,计算适应概率fpi,适应度越大,适应概率越大。
(2)基因交换(Crossover)/重组(Recombination)
基因交换或重组由两步构成,一是匹配,即对再生的群体成员做随机匹配;二是交换匹配成员的基因,即对每对匹配成员,按照随机概率Pc选择随机位置,将两成员的编码进行交换或重组。经过再生所得的新群体中并没有新成员,也就是在搜索空间中没有得到新的搜索点。而按随机概率进行基因交换后,新群体中既有上一代的优秀成员,又有由优秀成员交叉后产生的新成员,得到的新搜索点。根据生物遗传的“杂交优势”规律,这种新成员应该优于原成员。
(3)基因变异(mutation)
基因变异的目的是在搜索过程中,不断引入新的信息量,以免再生和交换的遗传过程中丢失潜在的有用遗传物质。基因变异实际上是对群体成员的基因按小概率Pm扰动而使其发生变化,以补充新的信息。
遗传算法求解优化问题的基本思路:
(1)确定目标函数
目标函数(Objects)是刻画最优解的标准,也是适度计算的依据。一般是以计算值与观测值之间的拟合程度或误差大小为标准的。
(2)指定问题参数的搜索范围
给定每一个模型参数的取值范围,对任一参数x给出[Xmin,Xmax)。实际上是问题解空间搜索精度的描述,其决定了搜索空间的大小,精度越高,离散化的搜索空间越大。
(3)模型参数编码
由于GA运算是对模型参数的编码进行的。编码方式有多种,常用的有二进制编码和十进制编码。
(4)初始群体的产生
给定群体成员数n,用随机生成的方法获取n个群体成员构成初始群体;
(5)遗传计算
① 求取适应度值
适应度值是直接由目标函数转换计算出来的。对最小化问题可用
指数转换:
南海地质研究.2006
i=1,…,n
其中:Objects[i]为第i个成员的目标函数值;σ为群体目标函数值的方差;Fitness[i]为第i个成员的适应度值。
② 再生
计算再生概率:
南海地质研究.2006
Ps[0]=0;
南海地质研究.2006
i=1,…,n
生成[0,1]随机数r,如果Ps[i-1]≤r<Ps[i]则第i个成员获得再生。
③ 交叉
将群体成员两两配对,组成n/2对母本,并按概率Pc进行交叉;即产生[0,1]随机数r,如果r<=Pc,则在一随机位置交换两个母本的编码;否则不变。
④ 变异
对每一个新成员,按概率Pm进行基因的随机突变,即产生[0,1]随机数r,如果r<=Pm,则在一随机位置改变该成员的编码,由1变0,或由0变1。
遗传算法对问题的求解是通过对寻优参数空间进行编码,从多点出发,采用随机选择作为工具来引导搜索过程向着更高效的方向发展,是一种普适性的搜索方法(Mallick,1999)。由于在搜索过程中使用了其父辈的适应度函数值作为启发知识,因此又是一种启发式搜索方法。这种搜索方法,对于简单的多极值优化问题可能会产生好的效果。尽管如此,GA对于多参数复杂非线性问题收敛速度还是过慢(Xia等,1998)。
就遗传算法本身而言,提高其收敛速度的关键在于合理的适合问题特点的遗传编码方法、适应度函数及变换方法、遗传算子、算法参数的设置和选取。
3 基于遗传算法的叠前地震波形反演
采用GA叠前地震波形反演估算弹性参数。叠前反演在角道集上进行,以便减少计算工作量。叠前资料预处理包括:角道集抽取、叠前去噪、压制多次波和高精度速度分析等方。GA叠前地震波形反演的技术路线如图1。
图1 GA叠前地震波形反演框图
Fig.1 The flow chart of pre-stack seismic waveform inversion by means of GA
其算法如下:
1)准备初始模型、地震记录Seis等数据
由高精度速度分析构建初始模型,地震记录Seis为角道集地震记录。
2)确定地质模型参数及参数搜索范围和搜索间隔
3)对模型参数编码。根据搜索范围的搜索间隔,先确定各参数可能取得的不同值的个数,为节省空间对所有参数进行整数编码。
4)生成拟合模型的初始随机总体P,假设生成了n个随机模型
由X=Xmin+Code×Dx,对Vp,Vs和ρ三个参数nt个样点用随机生成的方式生成整数码产生要求的样本量。
5)计算各模型的合成地震记录Syni。
合成地震记录采用Zoeppritz方程计算。
6)比较Syni与Seis,计算并保存目标函数值
观测记录与合成记录之间的匹配程度称为模型的拟合度(Inger等,1992),如果随机模型与实际情况相差很远,由观测记录计算得到的角道集与相应的合成角道集匹配就会很差。相反如果所选随机模型接近实际情况,从而使由观测记录计算得到的角道集与相应的合成角道集能很好地匹配。
南海地质研究.2006
i=1,…,n
其中:n为群体样本数;从理论上说,点越多,搜索效率应该越高。但实际上增加搜索点,也高增加了遗传计算的计算量。因此解决实际问题时,根据问题的性质及解空间的大小,做适当选择。在计算时,由于遗传计算量相对较大,选择了较小的群体。为便于操作和增加程序的适应能力,采用人机交互输入的方式选择8到32间的偶整数。
Nt=nt×angles;
nt:地震道时间取样点数;
angles:角道集所选角度个数。
seis[j]:观测记录角道集
Syn[j][i]:第i个群体成员的合成记录角道集
7)根据目标函数值对P做再生、交叉、变异操作,更新P生成新的随机总体;
8)如果满足结束条件,结束并输出结果;否则重复5)至8)直到结束。
4 叠前地震波形反演的实施
针对地震波反演问题这种多参数、复杂非线性问题的特点采用了如下技术措施:
(1)编码方法
对多参数、复杂非线性问题,其编码的优劣直接影响计算效率。为此采用了整数编码方案有效降低码的长度,加快计算速度。参数编码采用整数编码,方法如下:
参数值=参数最小值+码值×参数搜索精度;
码值=(参数值-参数最小值)/参数搜索精度;
即:Dx=(Xmax-Xmin)/Codemax
X=Xmin+Code×Dx
Code=(X-Xmin)/Dx
(2)适应度函数
适应度函数是由目标函数转换而得的用以刻划个体适应生存能力的函数。对极小值问题一般采用指数变换,但这种变换是一种均匀变换,在计算后期当群体中各样本目标函数值接近时,为增加优秀个体在再生时被选中的可能性,从而加快算法收敛,选择采用了S函数做叠加变换。
开始时使用指数变换:
南海地质研究.2006
i=1,…,n
其中:Objects[i]为第i个成员的目标函数值;σ为群体目标函数值的方差;Fitness[i]为第i个成员的适应度值。
当群体中样本目标函数值接近时使用S函数变换:
南海地质研究.2006
用于在遗传迭代计算后期,当群体各样本适应度很接近时,以指数形式放大平均适应度以上的样本适应度差异,缩小平均适应度以下的样本适应度的差异,以便更好地选择优秀个体(Sen,2001)。
式中:x对应用不同样本的原适应度值;y为变换后的适应度值;θ0为所有样本的平均适应度。a>0表示用于控制放大比例参数,越大对平均值以上的部分放大越明显。b>0表示调节系数,当a=1时,可取b为8到10;b太大达不到对接近最大值处的适应度的放大,b较小时可用线性变换取代。
南海地质研究.2006
当然为达到上述目的,也可使用其它函数,选择使用S函数,一是因为S变换的连续性,可使大于平均值的适应度放大,而使小于平均值的适应度缩小。二是基于前人的经验增加优秀个体在再生时被选中的可能性,从而加快算法收敛。
(3)算法过程
一般GA在计算时采用的是上一代的适应度作为启发函数再生后进行的随机启发搜索方法。为提高算法速度在实际处理中除使用上一代的适应度,还充分利用了优秀的隔代遗传的信息作为启发信息,参与遗传过程的计算。采用一种有限深度回溯搜索的方法,避免了迭代计算的反复,从而加快了计算收敛速度。事实上,在超大解空间中,某一代的遗传性能往往很难决定最终结果的好坏。另外,在交叉中每对成员交叉变换使用两次概率选择方法,即先选成员对,再选参数,且每个参数分别选择,这样可以有效地增加搜索能力。
5 试算效果实例分析
图2给出了理论地震记录的基于遗传算法的叠前地震波形反演的实例。图中展示了反演纵波速度和实际井中速度曲线,反演横波速度和实际井中速度曲线,反演密度和实际井中密度曲线,理论地震角道集记录和反演结果的合成角道集记录。基于遗传算法叠前反演结果与井中实际数据基本吻合,理论地震角道集记录和反演结果的合成角道集记录吻合非常好。
图2 基于遗传算法的叠前地震波形反演实例
Fig.2 A case for GA based pre-stack seismic waveform inversion
图中从左到右为反演纵波速度和实际井中速度曲线,反演横波速度和实际井中速度曲线,反演密度和实际井中密度曲线,5°理论地震角道集记录和反演结果的合成角道集记录,10°理论地震角道集记录和反演结果的合成角道集记录,15°理论地震角道集记录和反演结果的合成角道集记录,20°理论地震角道集记录和反演结果的合成角道集记录
参考文献
Inger L,and Rosen B.1992.Genetic algorithms and very fast simulated annealing:A comparision,Math.Comput.Modelling,16,87~100
Mallick S.1995.Model-based inversion of amplitude-variation-with-offset data using a genetic algorithm,Geophysics,52,1355~1364
Mallick S.1999.Some practical aspects of prestack waveform inversion using a genetic algorthm:An example from the east Texas Woodbine gas sand,Geophysics,64,326~336
Mallick S.2000.Hybrid seismic inversion:A reconnaissance tool for deepwater exploration.The Leading Edge,19,1230~1237
Sen M K,and Stoffa P L.1991.Nonlinear one-dimensional seismic waveform inversion using simulated annealing,Geophysics,56,1624~1638
Sen M K,and Stoffa P L.1992.Rapid sampling of model space using genetic algorithms:Examples from seismic waveform inversion,Geophys.J.Internat.,108,281~292
Sen M K.2001.Pre-stack waveform inversion:Current status and future direction,Institute for Geophysics
Xia G,Sen M K,and Stoffa P L.1998.1-D elastic waveform inversion:A divide-and-conquer approach,Geophysics,63,1670~1684
The construction of pseudo-well logs by inversion of pre-stack seismic waveform based on genetic algorithm
Luo Wenzao1Yang Shaoguo2Wang Yingmin3
(1.Guangzhou Marine Geological Survey,Guangzhou,510760;2.Cheng University Sciences and Technologies,Cheng,610059;3.China Petroleum University,Beijing,102200)
Abstract:The inversion of pre-stack seismic waveform is capable of providing the detailed character of subsurface stratigraphy.But its large scale of calculation,the non-linear relationship between data and model,multi-pole of objective functions and its multi-resolution has resulted in the difficulty of its operation.The seismic inversion without well constrained in the deep sea has been realized by hybrid inversion of pre-and post-inversion.The genetic algorithm is simple,easy to realizing and using with the character of latent paralleling and global searching capability.The inversion of pre-stack seismic waveform based on genetic algorithm gives the velocity and density which consists basically with those from the wells.
Key Words:Pre-stack inversion Genetic algorithm Pseudo-well
‘叁’ 用改进遗传算法求取水文地质参数
任广军1 张勇2
(1.山东省鲁南地质工程勘察院,兖州272000;2.山东省地矿工程集团有限公司,济南250013)
作者简介:任广军(1972—),男,工程师,主要从事水文地质、环境地质等。
摘要:本文利用非稳定流抽水试验资料,采用改进的十进制遗传算法在计算机上自动优选含水层水文地质参数。该方法同传统上使用的配线法相比较,具有节省时间,减少人工配线误差,所求参数逼真,且能对一些线性、非线性问题求解,具有很高的推广和应用价值。
关键词:遗传算法;随机模拟;含水层;水文地质参数;优选
0 引言
利用改进的十进制遗传算法,根据抽水试验资料来认识水文地质条件、反求水文地质参数是水文地质计算中的基本问题。具体地讲,在探明含水层范围、类型的基础上,建立描述该含水层水流运动模型,利用抽水试验过程中的地下水位变化过程资料来确定水文地质参数。
虽然非稳定抽水试验公式适用条件非常苛刻,但能反映出含水层非稳定流的一些基本特点,还可运用叠加原理解决某些比较复杂的非稳定流问题。此外,作为检验数值方法精确性的重要依据,具有广泛应用和发展前景。
目前,由于非稳定流抽水试验确定水文地质参数的具体实现方法主要有人工配线法或以计算辅助的配线法,但这种方法的效果好坏完全取决于肉眼观察,带有很大的主观性。本文作者选取了一些典型实例,采用遗传算法建立了一种计算机全自动求参的全局优选法,通过与人工配线分析比较,确定本方法计算机求参的高精度与高可靠性。
求取参数是通过实测结果与模型计算结果的最佳拟合(仿真)程度来实现的,参数的精确程度在很大程度上取决于实测资料的精度。
1 遗传算法介绍
生物的进化是一个奇妙的优化过程,它通过选择淘汰,突然变异,基因遗传等规律产生适应环境变化的优良物种。遗传算法是根据生物进化思想而启发得出的一种全局优化算法。
遗传算法的概念最早是由Bagley J.D在1967年提出的;而开始遗传算法的理论和方法的系统性研究的是1975年,这一开创性工作是由Michigan大学的J.H.Holland所实行。当时,其主要目的是说明自然和人工系统的自适应过程。
遗传算法简称GA(Genetic Algorithm),在本质上是一种不依赖具体问题的直接搜索方法。遗传算法在模式识别、神经网络、图像处理、机器学习、工业优化控制、自适应控制、生物科学、社会科学等方面都得到应用。在人工智能研究中,现在人们认为“遗传算法、自适应系统、细胞自动机、混沌理论与人工智能一样,都是对今后十年的计算技术有重大影响的关键技术”。
2 目标函数的确定
通过综合考虑计算程序的运算时间、速度以及含水层的类型,确立利用抽水实测资料和计算资料的拟合程度为目标函数。其计算公式为:
山东省环境地质文集
式中:s实测为实测抽水试验观测孔的降深;s计算为计算抽水试验观测孔的降深;NT为计算时段。
3 计算实例及结果分析
3.1 承压含水层地下水降深公式
承压含水层地下水降深公式为:
山东省环境地质文集
式中:S为以固定流量Q抽水时与抽水井距离为r处任一时间的水位降深(m);T为导水系数;Q为涌水量;W(u)为井函数,是一个指数积分函数:
山东省环境地质文集
式中:u为井函数的自变量,
例1:某地区进行非稳定流抽水试验。区域地层剖面是:地表下18~25 m是由含砾粗砂层组成的含水层,其底板由粘土质沉积物组成,18 m以上是粘土、泥炭层。抽水井的过滤器安装在含水层的整个厚度上。观测孔距抽水井30m,观测资料如表1所示。主井作定流量抽水,Q=788m3/d,抽水接近14小时。试根据观测资料求取水文地质参数。
(1)lgS-lgt配线法所求参数:T配线=439m2/d,s配线=1.694×10-4;
(2)S-lgt直线图解法所求参数:T配线=450.7m2/d,s配线=1.392×10-4;
(3)计算机所求参数:T=383.0088m2/d,s= 1.78×10-4。
为更直观地说明上述所求参数的可靠性,由上述参数所求计算降深与实测降深进行比较(图1)。通过比较,进一步确定了计算机求参的高精度与稳定性。承压含水层配线参数与优选参数比较分析:T配线=439m2/d,s配线=0.0001694;T计算=383.0088m2/d,s计算=0.0001780。
表1 遗传算法计算水位降深与实测水位降深结果表
图1 计算降深与实测降深比较图
3.2 在有越流补给的承压含水层地下水降深公式
在有越流补给的承压含水层地下水降深公式为:
山东省环境地质文集
式中:u同(3)式;
山东省环境地质文集
例2:有一无限分布的承压含水层,厚度20m,其底部为绝对隔水的粘土层;上部为弱透水的亚砂土层,厚2m;弱透水层之上为潜水含水层。在承压含水层中有一完整抽水井,抽水时的稳定流量Q=5530m3/d。距抽水井r=17.34m处有一观测孔据观测知,在抽水过程中上部潜水的水位不变。抽水层的水位降深值载于表2,试计算含水层水文地质参数。
(1)lgS-lgt配线法所求参数:T配线=853.50m2/d,s配线=4.20×10-4;B配线=568.50m;
(2)lgS-lgt配线法所求参数:T计算=817.19m2/d,s计算=4.31×10-4;B计算=482.80m。
为更直观地说明上述所求参数的可靠性,由上述参数所求计算降深与实测降深进行比较(图2)。通过比较,进一步确定了计算机求参的高精度与稳定性。有越流时承压含水层优选参数误差分析:T配线=853.50m2/d,s配线=0.00042,B配线=568.50m;T计算=817.1950m2/d,s计算=0.00043103,B计算=482.798m。
表2 遗传算法计算水位降深与实测水位降深结果表
续表
图2 计算降深与实测降深比较图
3.3 考虑有滞后补给的潜水含水层地下水降深公式
根据博尔顿理论,潜水含水层地下水降深公式计算公式可分为抽水前期、抽水中期和抽水后期。参数优选主要根据抽水前期和抽水后期的资料拟合而得:
山东省环境地质文集
其中D为疏干因子。
抽水前期计算公式:
抽水后期计算公式:同(2)式。
4 结论及不足之处
4.1 结论
通过上述实例计算结果表明:计算结果同人工加以计算机辅助配线法相比较,其计算水文地质参数精度较高,且其参数初值依赖程度较低,对于复杂的线性、非线性及多态性、多峰值问题在全局优化方面有着其他方法所无法比拟的优势,具有很高的推广和应用价值。
4.2 不足之处
遗传算法虽然可以在多种领域都有实际应用,并且也展示了它潜力和宽广前景;但是,遗传算法还有大量的问题需要研究,目前也还存在着各种不足。首先,在变量多,取值范围大或无给定范围时,收敛速度下降;其次,可找到最优解附近,但无法精确确定最优解位置;最后,遗传算法的参数选择尚未有定量方法。对于遗传算法,一是还需要进一步研究其数学基础理论;二是还需要在理论上证明它与其他优化技术的优劣及原因;三是还需研究硬件化的遗传算法;以及遗传算法的通用编程和形式等。此外,对于地下水渗流问题的数值解反求多类各种水文地质参数虽有成功实例,对于运算速度问题,还存在着相当大的难度。
参考文献
陈崇希,唐仲华.1990.地下水流动问题数值方法.武汉:中国地质大学出版社
陈喜.1998.含水层水文地质参数自动优选方法.工程勘察,(2)
郭东屏.1994.地下水动力学.西安:陕西科学技术出版社
GB 50027—2001 供水水文地质勘察规范
李俊亭,王愈吉.1987.地下水动力学.北京:地质出版社
刘宝碇,赵瑞清,王纲.2003.不确定规划及应用.北京:清华大学出版社
朱国祥,王峰.1999.利用配线法水文地质参数计算机程序简介.工程勘察,(3)
邹正盛,赵智荣.2001.浅析抽水水文地质参数确定中的问题.水文地质工程地质,(3)
‘肆’ 遗传算法第一次提出来是在什么文献中
《搜索、优化和机器学习中的遗传算法》。
遗传算法(Genetic Algorithm,GA)最早是由美国的 John holland于20世纪70年代提出,该算法是根据大自然中生物体进化规律而设计提出的。是模拟达尔文生物进化论的自然选择和遗传学机理的生物进化过程的计算模型,是一种通过模拟自然进化过程搜索最优解的方法。
遗传算法的基本运算过程如下:
(1)初始化:设置进化代数计数器t=0,设置最大进化代数T,随机生成M个个体作为初始群体P(0)。
(2)个体评价:计算群体P(t)中各个个体的适应度。
(3)选择运算:将选择算子作用于群体。选择的目的是把优化的个体直接遗传到下一代或通过配对交叉产生新的个体再遗传到下一代。选择操作是建立在群体中个体的适应度评估基础上的。
(4)交叉运算:将交叉算子作用于群体。遗传算法中起核心作用的就是交叉算子。
(5)变异运算:将变异算子作用于群体。即是对群体中的个体串的某些基因座上的基因值作变动。群体P(t)经过选择、交叉、变异运算之后得到下一代群体P(t+1)。
(6)终止条件判断:若t=T,则以进化过程中所得到的具有最大适应度个体作为最优解输出,终止计算。
‘伍’ 量子遗传算法的量子遗传算法发展简介
前者的贡献在于将量子多宇宙的概念引入遗传算法,利用多个宇宙的并行搜索,增大搜索范围,利用宇宙之间的联合交叉,实现信息的交流,从而整体上提高了算法的搜索效率。但算法中的多宇宙是通过分别产生多个种群获得的,并没有利用量子态,因而仍属于常规遗传算法。后者将量子的态矢量表达引入遗传编码,利用量子旋转门实现染色体的演化,实现了比常规遗传算法更好的效果。但该算法主要用来解决0-1背包问题。编码方案和量子旋转门的演化策略不具有通用性,尤其是由于所有个体都朝一个目标演化,如果没有交叉操作,极有可能陷入局部最优。
文献[1]对QGA进行了改进,提出量子遗传算法(Quantum GeneticA lgorithm,QGA)。QGA采用多状态基因量子比特编码方式和通用的量子旋转门操作。引入动态调整旋转角机制和量子交叉,比文献[2]的方法更具有通用性,且效率更高。但该方法仍是一个群体独自演化没有利用盈子信息的多宇宙和宇宙间的纠缠特性效率有待进一步提高。文献[3]提出一种多宇宙并行量子遗传算法(Multiuniverse Parallel Quantum Genetic Algorithm,MPQGA),算法中将所有的个体按照一定的拓扑结构分成一个个独立的子群体,称为宇宙;采用多状态基因量子比特编码方式来表达宇宙中的个体;采用通用的量子旋转门策略和动态调整旋转角机制对个体进行演化;各宇宙独立演化,这样可扩大搜索空间,宇宙之间采用最佳移民、量子交叉和量子变异操作来交换信息使算法的适应性更强,效率更高。