模擬退火演算法原理
Ⅰ 模擬退火演算法的意義
退火演算法具有計算過程簡單、通用、魯棒性強、適合並行處理等優點,可用於求解復雜的非線性優化問題。缺點: 收斂速度慢,執行時間長,演算法性能與初值有關,參數敏感。Pso: 進化支持計算的優點在於它能處理一些傳統方法無法處理的例子,如不可微節點傳遞函數或其固有的梯度信息缺失。缺點是: 它在某些問題上表現不是特別好。圖2。網路權重容量的編碼和遺傳運算元的選擇有時比較麻煩
Ⅱ 模擬退火法(SA)和遺傳演算法(GA)的專業解釋
n局部搜索,模擬退火,遺傳演算法,禁忌搜索的形象比喻:
為了找出地球上最高的山,一群有志氣的兔子們開始想辦法。
1.兔子朝著比現在高的地方跳去。他們找到了不遠處的最高山峰。但是這座山不一定是珠穆朗瑪峰。這就是局部搜索,它不能保證局部最優值就是全局最優值。
2.兔子喝醉了。他隨機地跳了很長時間。這期間,它可能走向高處,也可能踏入平地。但是,他漸漸清醒了並朝最高方向跳去。這就是模擬退火。
3.兔子們吃了失憶葯片,並被發射到太空,然後隨機落到了地球上的某些地方。他們不知道自己的使命是什麼。但是,如果你過幾年就殺死一部分海拔低的兔子,多產的兔子們自己就會找到珠穆朗瑪峰。這就是遺傳演算法。
4.兔子們知道一個兔的力量是渺小的。他們互相轉告著,哪裡的山已經找過,並且找過的每一座山他們都留下一隻兔子做記號。他們制定了下一步去哪裡尋找的策略。這就是禁忌搜索。
Ⅲ 模擬退火演算法是什麼
從代碼角度來說,就是2個循環,一個總溫度外循環(足夠大,並逐漸減小),另一個內部循環(使其達到該特定溫度下的平衡,怎麼算平衡自己定義的)。很多書都說外部的總溫度外循環,卻忽略了內部循環,內部循環值應該多大,我也很模糊。
Ⅳ 模擬退火演算法和粒子群演算法的優缺點有那些具體點,謝啦
他們有類似之處,但差別也不小。
蒙特卡洛演算法是數值計算方法,原理是利用隨機數來解決計算問題。與它對應的是確定性演算法。也就是說該種演算法屬於隨機演算法,得到的解是近似解。
而遺傳演算法、粒子群、模擬退火雖然也是隨機近似演算法,但這三種都是仿生智能演算法,且比蒙特卡洛演算法要復雜,應用的領域也不太相同。
顯然,蒙特卡洛演算法很輕巧,求解問題更快速。
Ⅳ 什麼是退火演算法
模擬退火的基本思想:
(1) 初始化:初始溫度T(充分大),初始解狀態S(是演算法迭代的起點), 每個T值的迭代次數L
(2) 對k=1,……,L做第(3)至第6步:
(3) 產生新解S′
(4) 計算增量Δt′=C(S′)-C(S),其中C(S)為評價函數
(5) 若Δt′<0則接受S′作為新的當前解,否則以概率exp(-Δt′/T)接受S′作為新的當前解.
(6) 如果滿足終止條件則輸出當前解作為最優解,結束程序。
終止條件通常取為連續若干個新解都沒有被接受時終止演算法。
(7) T逐漸減少,且T->0,然後轉第2步。
Ⅵ 模擬退火演算法的簡介
模擬退火演算法(Simulated Annealing,SA)最早的思想是由N. Metropolis 等人於1953年提出。1983 年,S. Kirkpatrick 等成功地將退火思想引入到組合優化領域。它是基於Monte-Carlo迭代求解策略的一種隨機尋優演算法,其出發點是基於物理中固體物質的退火過程與一般組合優化問題之間的相似性。模擬退火演算法從某一較高初溫出發,伴隨溫度參數的不斷下降,結合概率突跳特性在解空間中隨機尋找目標函數的全局最優解,即在局部最優解能概率性地跳出並最終趨於全局最優。模擬退火演算法是一種通用的優化演算法,理論上演算法具有概率的全局優化性能,目前已在工程中得到了廣泛應用,諸如VLSI、生產調度、控制工程、機器學習、神經網路、信號處理等領域。
模擬退火演算法是通過賦予搜索過程一種時變且最終趨於零的概率突跳性,從而可有效避免陷入局部極小並最終趨於全局最優的串列結構的優化演算法。
Ⅶ 非數值演算法的模擬退火演算法
模擬退火演算法來源於固體退火原理,將固體加溫至充分高,再讓其徐徐冷卻,加溫時,固體
內部粒子隨溫升變為無序狀,內能增大,而徐徐冷卻時粒子漸趨有序,在每個溫度都達到平
衡態,最後在常溫時達到基態,內能減為最小。根據Metropolis 准則,粒子在溫度T 時趨於
平衡的概率為e-ΔE/(kT),其中E 為溫度T 時的內能,ΔE 為其改變數,k 為Boltzmann 常
數。用固體退火模擬組合優化問題,將內能E 模擬為目標函數值f,溫度T 演化成控制參數
t,即得到解組合優化問題的模擬退火演算法:由初始解i 和控制參數初值t 開始,對當前解重
復「產生新解→計算目標函數差→接受或舍棄」的迭代,並逐步衰減t 值,演算法終止時的當
前解即為所得近似最優解,這是基於蒙特卡羅迭代求解法的一種啟發式隨機搜索過程。退火
過程由冷卻進度表(Cooling Schele)控制,包括控制參數的初值t 及其衰減因子Δt、每個t
值時的迭代次數L 和停止條件S。
1、模擬退火演算法可以分解為解空間、目標函數和初始解三部分 。 它為問題的所有可能(可行的或包括不可行的)解的集合,它限定了初始解選取和新解產
生時的范圍。對無約束的優化問題,任一可能解(possible solution)即為一可行解(feasible
solution),因此解空間就是所有可行解的集合;而在許多組合優化問題中,一個解除滿足目
標函數最優的要求外,還必須滿足一組約束(constraint),因此在解集中可能包含一些不可行
解(infeasible so1ution)。為此,可以限定解空間僅為所有可行解的集合,即在構造解時就考
慮到對解的約束;也可允許解空間包含不可行解,而在目標函數中加上所謂罰函數(penalty
function)以「懲罰」不可行解的出現。 它是對問題的優化目標的數學描述,通常表述為若干優化目標的一個和式。目標函數的
選取必須正確體現對問題的整體優化要求。例如,如上所述,當解空間包含不可行解時,目
標函數中應包含對不可行解的罰函數項,藉此將一個有約束的優化問題轉化為無約束的優化
問題。一般地,目標函數值不一定就是問題的優化目標值,但其對應關系應是顯明的。此外,
目標函數式應當是易於計算的,這將有利於在優化過程中簡化目標函數差的計算以提高演算法
的效率。 是演算法迭代的起點,試驗表明,模擬退火演算法是魯棒的(Robust),即最終解的求得幾乎
不依賴於初始解的選取。
2、基本思想:
(1) 初始化:初始溫度T(充分大),初始解狀態S(是演算法迭代的起點), 每個T 值的迭
代次數L
(2) 對k=1,,L 做第(3)至第6 步:
(3) 產生新解S′
(4) 計算增量Δt′=C(S′)-C(S),其中C(S)為評價函數
(5) 若Δt′<0 則接受S′作為新的當前解,否則以概率exp(-Δt′/T)接受S′作為新的
當前解.
(6) 如果滿足終止條件則輸出當前解作為最優解,結束程序。
終止條件通常取為連續若干個新解都沒有被接受時終止演算法。
(7) T 逐漸減少,且T->0,然後轉第2 步。
二、遺傳演算法
遺傳演算法的基本思想是基於Darwin 進化論和Mendel 的遺傳學說的。
Darwin 進化論最重要的是適者生存原理。它認為每一物種在發展中越來越適應環境。物種
每個個體的基本特徵由後代所繼承,但後代又會產生一些異於父代的新變化。在環境變化時,
只有那些能適應環境的個體特徵方能保留下來。
Mendel 遺傳學說最重要的是基因遺傳原理。它認為遺傳以密碼方式存在細胞中,並以基因
形式包含在染色體內。每個基因有特殊的位置並控制某種特殊性質;所以,每個基因產生的
個體對環境具有某種適應性。基因突變和基因雜交可產生更適應於環境的後代。經過存優去
劣的自然淘汰,適應性高的基因結構得以保存下來。
遺傳演算法簡稱GA(Genetic Algorithm),在本質上是一種不依賴具體問題的直接搜索方法。
1、遺傳演算法的原理
遺傳演算法GA 把問題的解表示成「染色體」,在演算法中也即是以二進制編碼的串。並且,在
執行遺傳演算法之前,給出一群「染色體」,也即是假設解。然後,把這些假設解置於問題的
「環境」中,並按適者生存的原則,從中選擇出較適應環境的「染色體」進行復制,再通過
交叉,變異過程產生更適應環境的新一代「染色體」群。這樣,一代一代地進化,最後就會
收斂到最適應環境的一個「染色體」上,它就是問題的最優解。
長度為L 的n 個二進制串bi(i=1,2,,n)組成了遺傳演算法的初解群,也稱為初始群體。
在每個串中,每個二進制位就是個體染色體的基因。根據進化術語,對群體執行的操作有三
種:
(1).選擇(Selection)
這是從群體中選擇出較適應環境的個體。這些選中的個體用於繁殖下一代。故有時也稱這一
操作為再生(Reproction)。由於在選擇用於繁殖下一代的個體時,是根據個體對環境的適
應度而決定其繁殖量的,故而有時也稱為非均勻再生(differential reproction)。
(2).交叉(Crossover)
這是在選中用於繁殖下一代的個體中,對兩個不同的個體的相同位置的基因進行交換,從而
產生新的個體。
(3).變異(Mutation)
這是在選中的個體中,對個體中的某些基因執行異向轉化。在串bi 中,如果某位基因為1,
產生變異時就是把它變成0;反亦反之。
2、遺傳演算法的特點
(1).遺傳演算法從問題解的中集開始嫂索,而不是從單個解開始。
這是遺傳演算法與傳統優化演算法的極大區別。傳統優化演算法是從單個初始值迭代求最優解的;
容易誤入局部最優解。遺傳演算法從串集開始搜索,覆蓋面大,利於全局擇優。
(2).遺傳演算法求解時使用特定問題的信息極少,容易形成通用演算法程序。
由於遺傳演算法使用適應值這一信息進行搜索,並不需要問題導數等與問題直接相關的信息。
遺傳演算法只需適應值和串編碼等通用信息,故幾乎可處理任何問題。
(3).遺傳演算法有極強的容錯能力
遺傳演算法的初始串集本身就帶有大量與最優解甚遠的信息;通過選擇、交叉、變異操作能迅
速排除與最優解相差極大的串;這是一個強烈的濾波過程;並且是一個並行濾波機制。故而,
遺傳演算法有很高的容錯能力。
(4).遺傳演算法中的選擇、交叉和變異都是隨機操作,而不是確定的精確規則。
這說明遺傳演算法是採用隨機方法進行最優解搜索,選擇體現了向最優解迫近,交叉體現了最
優解的產生,變異體現了全局最優解的覆蓋。
三、神經網路演算法
「人工神經網路」(ARTIFICIAL NEURAL NETWORK,簡稱A.N.N.)是在對人腦組織結構和
運行機智的認識理解基礎之上模擬其結構和智能行為的一種工程系統。早在本世紀40 年代
初期,心理學家McCulloch、數學家Pitts 就提出了人工神經網路的第一個數學模型,從此開
創了神經科學理論的研究時代。其後,F.Rosenblatt、Widrow 和Hopf、J.J.Hopfield 等學者又
先後提出了感知模型,使得人工神經網路技術得以蓬勃發展。
神經系統的基本構造是神經元(神經細胞),它是處理人體內各部分之間相互信息傳遞的基本
單元。據神經生物學家研究的結果表明,人的一個大腦一般有10 10 ~10 11
個神經元。每個神經元都由一個細胞體,一個連接其他神經元的軸突和一些向外伸出的其它
較短分支——樹突組成。軸突的功能是將本神經元的輸出信號(興奮)傳遞給別的神經元。其
末端的許多神經末梢使得興奮可以同時傳送給多個神經元。樹突的功能是接受來自其它神經
元的興奮。神經元細胞體將接受到的所有信號進行簡單地處理(如:加權求和,即對所有的
輸入信號都加以考慮且對每個信號的重視程度——體現在權值上——有所不同)後由軸突輸
出。神經元的樹突與另外的神經元的神經末梢相連的部分稱為突觸。
1、神經網路的工作原理
人工神經網路首先要以一定的學習准則進行學習,然後才能工作。現以人工神經網路對手寫
「A」、「B」兩個字母的識別為例進行說明,規定當「A」輸入網路時,應該輸出「1」,而
當輸入為「B」時,輸出為「0」。所以網路學習的准則應該是:如果網路作出錯誤的的判決,
則通過網路的學習,應使得網路減少下次犯同樣錯誤的可能性。首先,給網路的各連接權值
賦予(0,1)區間內的隨機值,將「A」所對應的圖象模式輸入給網路,網路將輸入模式加權
求和、與門限比較、再進行非線性運算,得到網路的輸出。在此情況下,網路輸出為「1」
和「0」的概率各為50%,也就是說是完全隨機的。這時如果輸出為「1」(結果正確),則使
連接權值增大,以便使網路再次遇到「A」模式輸入時,仍然能作出正確的判斷。如果輸出
為「0」(即結果錯誤),則把網路連接權值朝著減小綜合輸入加權值的方向調整,其目的在
於使網路下次再遇到「A」模式輸入時,減小犯同樣錯誤的可能性。如此操作調整,當給網
絡輪番輸入若干個手寫字母「A」、「B」後,經過網路按以上學習方法進行若干次學習後,
網路判斷的正確率將大大提高。這說明網路對這兩個模式的學習已經獲得了成功,它已將這
兩個模式分布地記憶在網路的各個連接權值上。當網路再次遇到其中任何一個模式時,能夠
作出迅速、准確的判斷和識別。一般說來,網路中所含的神經元個數越多,則它能記憶、識
別的模式也就越多。
2、人工神經網路的特點
人工神經網路是由大量的神經元廣泛互連而成的系統,它的這一結構特點決定著人工神經網
絡具有高速信息處理的能力。人腦的每個神經元大約有10 3~10 4 個樹突及相應的突
觸,一個人的大腦總計約形成10 14 ~10 15 個突觸。用神經網路的術語來說,
即是人腦具有10 14 ~10 15 個互相連接的存儲潛力。雖然每個神經元的運算
功能十分簡單,且信號傳輸速率也較低(大約100 次/秒),但由於各神經元之間的極度並行互
連功能,最終使得一個普通人的大腦在約1 秒內就能完成現行計算機至少需要數10 億次處
理步驟才能完成的任務。
人工神經網路的知識存儲容量很大。在神經網路中,知識與信息的存儲表現為神經元之間分
布式的物理聯系。它分散地表示和存儲於整個網路內的各神經元及其連線上。每個神經元及
其連線只表示一部分信息,而不是一個完整具體概念。只有通過各神經元的分布式綜合效果
才能表達出特定的概念和知識。
由於人工神經網路中神經元個數眾多以及整個網路存儲信息容量的巨大,使得它具有很強的
不確定性信息處理能力。即使輸入信息不完全、不準確或模糊不清,神經網路仍然能夠聯想
思維存在於記憶中的事物的完整圖象。只要輸入的模式接近於訓練樣本,系統就能給出正確
的推理結論。
正是因為人工神經網路的結構特點和其信息存儲的分布式特點,使得它相對於其它的判斷識
別系統,如:專家系統等,具有另一個顯著的優點:健壯性。生物神經網路不會因為個別神
經元的損失而失去對原有模式的記憶。最有力的證明是,當一個人的大腦因意外事故受輕微
損傷之後,並不會失去原有事物的全部記憶。人工神經網路也有類似的情況。因某些原因,
無論是網路的硬體實現還是軟體實現中的某個或某些神經元失效,整個網路仍然能繼續工
作。
人工神經網路是一種非線性的處理單元。只有當神經元對所有的輸入信號的綜合處理結果超
過某一門限值後才輸出一個信號。因此神經網路是一種具有高度非線性的超大規模連續時間
動力學系統。它突破了傳統的以線性處理為基礎的數字電子計算機的局限,標志著人們智能
信息處理能力和模擬人腦智能行為能力的一大飛躍。
Ⅷ 模擬退火法<sup>[1,]</sup>
模擬退火演算法最早在1953年由 Metropolis等人提出。在地球物理中的最早應用是Rothman在1983年利用模擬退火演算法處理地震資料的剩餘靜校正。模擬退火法也是類似於蒙特卡洛法的隨機搜索方法。但是在產生模型的過程中引入一些規則,能有效地加快搜索速度,有時又稱這類方法為啟發式蒙特卡洛法。
模擬退火法概念源於統計物理學,是模擬固體熔化狀態逐漸緩慢冷卻最終達到能量最小的結晶狀態的物理過程。對於一個熔化的金屬,當處於某個溫度的熱平衡狀態時,它的每一個分子都有它可能所處的狀態,有些分子可能能量高一些,有些分子可能能量低一些,分子處於何種狀態的概率由分子所具有的能量決定。設分子所有可能的能級總數為n(微觀粒子的能量都是量子化的,不連續的),則分子處於某種狀態的概率滿足玻爾茲曼概率分布:
地球物理反演教程
其中:Ei為第i個分子的能量;K為玻爾茲曼常數;T為絕對溫度;n為分子所有可能的能級總數,分母稱為配分因子;pi為第i個分子處於能量Ei的概率。
如果把地球物理反演的模型向量看作分子,把目標函數看作分子的能量,把目標函數的極小值看成分子冷卻結晶的最小能量,反演問題(最優化問題)可以模擬式(8.11)金屬退火的過程,通過緩慢地減小溫度進行反演,使目標函數(能量)逐漸達到極小值,這時所對應的模型(分子狀態)就是反演結果。
為了改善於蒙特卡洛法的隨機搜索方法,1953年 Metropolis等人在產生模型的過程中引入Metropolis接受准則,模型產生並不是完全隨機,而是以前一個模型為基礎隨機產生。對能量減小的模型完全接受,對能量增加的模型按一定的概率接受,這樣能有效地加快搜索速度,同時又有可能跳出局部極小值。具體如下:
設原來模型向量為mi,新的模型為mi+1(在mi基礎上隨機修改產生),各自的能量(目標函數)為E(mi)和E(mi+1)。如果E(mi+1)<E(mi),則目標函數在減小,新模型可以接受。如果E(mi+1)>E(mi),則目標函數在增加,按照一定概率來確定是否接受新的模型。具體規則見式(8.12):
E(mi+1)<E(mi) 完全接受mi+1為新模型
地球物理反演教程
式(8.12)就是Metropolis接受准則。它使得反演過程可以接受使目標函數增加的模型,因此也就使得模擬退火法有可能跳出局部極小,收斂於全局極小值點。由於玻爾茲曼常數K只是起到尺度因子的作用,在實際計算中K可取為1來簡化公式。從式(8.12)可以看出,當溫度較低時,pi+1/pi較小,因此接受使能量增加的新模型的可能性較小。而一般溫度較低時,目標函數較小,模型比較靠近真實模型,這時基本上只接受使目標函數減小的模型,使模型盡快收斂於極小值點。
在模擬退火反演中,要求溫度T隨著迭代次數的增加而緩慢降溫。常用的溫度函數有兩種。
(1)指數下降型:
Tk=T0·exp(-ck1/N) (8.13)
式中:k為迭代次數;c為衰減因子;N為模型參數的個數;T0為初始溫度。上式也可以改寫為
地球物理反演教程
通常選擇0.7≤α≤1。在實際應用中可採用0.5或1代替式(8.14)的1/N。圖8.4(a)為指數降溫曲線。採用參數為:T0=200℃,α=0.99,1/N=0.9。
(2)雙曲線下降型:
T=T0αk (8.15)
式中:T0為初始溫度;k為迭代次數;α為衰減因子,通常取0.99。初始溫度T0不能取得太高,否則增加計算時間浪費機時;T0也不能太低,否則模型選取不能遍及整個模型空間,只是在初始模型附近選取,不能進行全局尋優。所以T0的確定只有通過實驗計算得到。圖8.4(b)為雙曲線降溫曲線。採用參數為:T0=200℃,α=0.99。從圖8.4可以看出通過對不同溫度曲線和相關參數進行選擇,可以控制溫度下降的方式和速度。
圖8.4 模擬退火法降溫曲線
模擬退火法主要有三種:
(1)MSA演算法(Metropolis Simulated Annealing);
(2)HBSA演算法(Heat Bath Simulated Annealing);
(3)VFSA演算法(Very Fast Simulated Annealing)。
圖8.5 模擬退火MSA演算法程序流程圖
前面介紹的利用 Metropolis接受准則的演算法就是經典的模擬退火法。圖8.5為模擬退火 MSA演算法的程序流程圖。從中可以看出 MSA演算法有一套模型修改准則,依次改變模型參數,每次改變都是在原來模型基礎上改變一個參數,因此容易保持已有搜索成果,持續不斷地向目標函數最小值點接近,因此搜索效率比蒙特卡洛法高。此外,MSA演算法允許接受使目標函數增加的模型,這樣又易於跳出局部極小,達到全局極小。但 MSA演算法在任何溫度下和蒙特卡洛法一樣都是在模型全空間進行搜索,不能根據當前溫度和模型減小搜索空間,此外由於模型的修改全憑運氣,所以不可能像前面介紹的最小二乘法那樣目標函數基本上持續減小,而是呈不規則振盪在宏觀上逐漸減小,因此效率較低。
HBSA演算法與 MSA演算法的不同之處是在模型的修改上。也是首先隨機選擇一個初始M維模型向量m0(它具有M個參數);然後限制各個模型參數可能的取值范圍,對取值離散化。假設每個模型參數都有N個可能的值,首先固定模型第2個參數m0(2)直到第M個參數m0(M)保持不變,只修改第1個參數m0(1);計算m0(1)的所有取值時的目標函數,然後按式(8.16)計算「概率」,它就是式(8.11)配分因子取1的公式。即
地球物理反演教程
選擇「概率」最大的為模型第1個參數的修改值。照此依次對所有模型參數進行修改完成依次迭代計算。在每次迭代計算中保持溫度不變。隨著迭代次數增加,溫度降低,最終達到穩定狀態,獲得最小能量解。這種方法的計算由於要計算某個參數的所有可能值,所以計算量也是很大的。
1989年Ingber提出了VFSA演算法,由於速度較快,最為常用。它使得模擬退火法從理論走向了實際應用。VFSA演算法在流程上與傳統的模擬退火法相同,但是在模型修改、接受概率以及降溫曲線上有所改進。
(1)模型修改:常規模擬退火法採用高斯隨機分布修改模型,在任何溫度下都是在模型全空間進行搜索。而Ingber提出採用依賴於溫度的似cauchy分布產生新的模型。即
地球物理反演教程
yi=Tsgn(u-0.5)[(1+1/T|2u-1|-1](8.18)
其中:mi為當前模型第i個參數,m'i為修改後的模型參數;u為[0,1]的隨機數;[Ai,Bi]為mi和m'i的取值范圍;sgn( )為符號函數。
採用以上方式能在高溫下進行大范圍的搜索,低溫時在當前模型附近搜索,而且由於似cauchy分布具有平坦的「尾巴」,使其易於迅速跳出局部極值。這一改進大大加快了模擬退火法的收斂速度。
(2)接收概率:當E(mi+1)>E(mi)時,VFSA演算法採用如下概率接受公式:
地球物理反演教程
上式當h→1時變為式(8.12)。h通過實驗獲得。
(3)降溫曲線(退火計劃):Ingber在1989年採用式(8.13)得出指數降溫曲線。從圖8.4可知,溫度下降較快。
總之,VFSA演算法在模型修改、接受概率以及降溫曲線上的改進使得模擬退火演算法收斂速度大大加快。後人在此基礎上還有很多的改進,讀者可以參考相關文獻。
模擬退火法的優點:由於不需要計算偏導數矩陣,不需要解線性方程組(當然正演計算的除外),結構簡單,易於編程;此外,由於它搜索范圍大,能接受較差模型,因此易於達到全局極小。缺點:隨機搜索,計算量巨大,往往要計算成百上千次正演,這與前面的最小二乘法十幾次的正演計算相比反演時間太長,因此一般應用在一維反演之中,在二維、三維等高維反演中應用較少。
Ⅸ 什麼是模擬退火法,誰知道幫我介紹一下
除了概念,還是找一點例子看,才能真正明白
模擬退火演算法來源於固體退火原理,將固體加溫至充分高,再讓其徐徐冷卻,加溫時,固體內部粒子隨溫升變為無序狀,內能增大,而徐徐冷卻時粒子漸趨有序,在每個溫度都達到平衡態,最後在常溫時達到基態,內能減為最小。根據Metropolis准則,粒子在溫度T時趨於平衡的概率為e-ΔE/(kT),其中E為溫度T時的內能,ΔE為其改變數,k為Boltzmann常數。用固體退火模擬組合優化問題,將內能E模擬為目標函數值f,溫度T演化成控制參數t,即得到解組合優化問題的模擬退火演算法:由初始解i和控制參數初值t開始,對當前解重復「產生新解→計算目標函數差→接受或舍棄」的迭代,並逐步衰減t值,演算法終止時的當前解即為所得近似最優解,這是基於蒙特卡羅迭代求解法的一種啟發式隨機搜索過程。退火過程由冷卻進度表(Cooling Schele)控制,包括控制參數的初值t及其衰減因子Δt、每個t值時的迭代次數L和停止條件S。
Ⅹ 求一個模擬退火演算法優化BP神經網路的一個程序(MATLAB)
「模擬退火」演算法是源於對熱力學中退火過程的模擬,在某一給定初溫下,通過緩慢下降溫度參數,使演算法能夠在多項式時間內給出一個近似最優解。退火與冶金學上的『退火』相似,而與冶金學的淬火有很大區別,前者是溫度緩慢下降,後者是溫度迅速下降。
「模擬退火」的原理也和金屬退火的原理近似:我們將熱力學的理論套用到統計學上,將搜尋空間內每一點想像成空氣內的分子;分子的能量,就是它本身的動能;而搜尋空間內的每一點,也像空氣分子一樣帶有「能量」,以表示該點對命題的合適程度。演算法先以搜尋空間內一個任意點作起始:每一步先選擇一個「鄰居」,然後再計算從現有位置到達「鄰居」的概率。
這個演算法已經很多人做過,可以優化BP神經網路初始權值。附件是解決TSP問題的matlab代碼,可供參考。看懂了就可以自己編程與bp代碼結合。