最似然演算法
⑴ 最大似然演算法里的 Euclidian distance metric是什麼意思 怎麼翻譯
以下是英文統計學教科書有關Euclidean Distance的解釋(你題目中的Euclidia跟我這里的Euclidean有一點點拼寫上的差異,你的拼寫與Distance配合時我很少見到,不過意思應該是一樣的)
Euclidean Distance. One can think of the independent variables (in a regression equation) as defining a multidimensional space in which each observation can be plotted. The Euclidean distance is the geometric distance in that multidimensional space. It is computed as:
distance(x,y)={∑i (xi - yi )^2}^1/2
【^代表乘方號,公式中的i應為下標】因此,Euclidean Distance實際上就是指多維空間中任意兩點的「普通」距離。所以,你的Euclidian distance metric應該翻譯為歐幾里得距離度量,簡稱為歐幾里得距離或歐氏距離也是可以的。 公式中的先平方,再開方是為了使歐氏距離具有可加性,避免正負值抵消(這種抵消是不合理的)的情況出現。
補充回答:
在兩維空間中,某一點X的坐標可以表示為(x1, x2) ,另一點Y的的坐標可以表示為 (y1, y2) 。
不難推斷,在n維空間中,某一點X的坐標可以表示為(x1, x2,..., xn) ,另一點Y的的坐標可以表示為 (y1, y2,..., yn) 。要計算X與Y的距離,就要使用上面列出的公式。由於X和Y這兩個點是在n維空間中,因此公式中自然有n個項之和。
⑵ 最大似然法的定義
最大似然估計是一種統計方法,它用來求一個樣本集的相關概率密度函數的參數。這個方法最早是遺傳學家以及統計學家羅納德·費雪爵士在 1912 年至1922 年間開始使用的。
最大似然法明確地使用概率模型, 其目標是尋找能夠以較高概率產生觀察數據的系統發生樹。 最大似然法是一類完全基於統計的系統發生樹重建方法的代表。該方法在每組序列比對中考慮了每個核苷酸替換的概率。
例如,轉換出現的概率大約是顛換的三倍。在一個三條序列的比對中,如果發現其中有一列為一個C,一個 T和一個 G,我們有理由認為,C和 T所在的序列之間的關系很有可能更接近。由於被研究序列的共同祖先序列是未知的,概率的計算變得復雜;又由於可能在一個位點或多個位點發生多次替換,並且不是所有的位點都是相互獨立,概率計算的復雜度進一步加大。盡管如此,還是能用客觀標准來計算每個位點的概率, 計算表示序列關系的每棵可能的樹的概率。 然後,根據定義,概率總和最大的那棵樹最有可能是反映真實情況的系統發生樹。
⑶ 概率論中的最大似然估計法的具體步驟是什麼舉例說明一下
http://..com/question/501531644.html
最大似然估計 是一種統計方法 ,它用來求一個樣本集的相關概率密度函數的參數。這個方法最早是遺傳學家以及統計學家羅納德·費雪 爵士在1912年至1922年間開始使用的。 「似然」是對likelihood 的一種較為貼近文言文的翻譯,「似然」用現代的中文來說即「可能性」。故而,若稱之為「最大可能性估計」則更加通俗易懂。 最大似然估計的原理 給定一個概率分布D ,假定其概率密度函數(連續分布)或概率聚集函數(離散分布)為f D ,以及一個分布參數θ ,我們可以從這個分布中抽出一個具有n 個值的采樣 ,通過利用f D ,我們就能計算出其概率: 但是,我們可能不知道θ 的值,盡管我們知道這些采樣數據來自於分布D 。那麼我們如何才能估計出θ 呢?一個自然的想法是從這個分布中抽出一個具有n 個值的采樣X 1 ,X 2 ,...,X n ,然後用這些采樣數據來估計θ . 一旦我們獲得 ,我們就能從中找到一個關於θ 的估計。最大似然估計會尋找關於 θ 的最可能的值(即,在所有可能的θ 取值中,尋找一個值使這個采樣的「可能性」最大化)。 這種方法正好同一些其他的估計方法不同,如θ 的非偏估計,非偏估計未必會輸出一個最可能的值,而是會輸出一個既不高估也不低估 的θ 值。 要在數學上實現最大似然估計法 ,我們首先要定義可能性 : 並且在θ 的所有取值上,使這個[[函數最大化。這個使可能性最大的值即被稱為θ 的最大似然估計 。 注意 這里的可能性是指不變時,關於θ 的一個函數。 最大似然估計函數不一定是惟一的,甚至不一定存在。
http://..com/question/237077915.html 給出了一個好例子。
⑷ 求幾何分布的最大似然估計值,要詳細過程,求
由題知g(X;p)=p*(1-p)^(X-1)
∴L(p)=p*(1-p)^(X1-1)*p*(1-p)^(X2-1)…p*(1-p)^(Xn-1)=p^n*(1-p)^∑(Xi-1)
ln L(p)=n ln p+∑(Xi-1) ln(1-p)
d ln L(p)/d (p)=n/p-∑(Xi-1)/(1-p)
令d ln L(p)/d (p)=0,即n/p-∑(Xi-1)/(1-p)=0,∴p=1/(!X-1)
即 p=1/(!X-1)為p的最大似,然估計值
註明下 ∑(Xi-1)表示對(X1-1)到(Xn-1)求和
a^b表示a的b次方
(!X)表示X的平均值
p=1/(!X-1)中p的頭上面應該加上^
(4)最似然演算法擴展閱讀:
最大似然法明確地使用概率模型,其目標是尋找能夠以較高概率產生觀察數據的系統發生樹。最大似然法是一類完全基於統計的系統發生樹重建方法的代表。該方法在每組序列比對中考慮了每個核苷酸替換的概率。
一旦獲得,就能從中找到一個關於θ的估計。最大似然估計會尋找關於 θ的最可能的值(即,在所有可能的θ取值中,尋找一個值使這個采樣的「可能性」最大化)。這種方法正好同一些其他的估計方法不同,如θ的非偏估計,非偏估計未必會輸出一個最可能的值,而是會輸出一個既不高估也不低估的θ值。
⑸ 最大似然法的含義
最大似然法是20世紀60年代末期由於對地震波和水聲信號等處理的需要而發展起來的一種非線性譜估計方法。最早由J·凱佩用這種方法對空間陣列接收信號進行頻率波數譜估值,後來推廣到對時間信號序列的功率譜估值。
⑹ 最大似然估計的問題
還需要二階導而負!不過在似然函數面前,大多數情況下,二階導都是負的,你可以試試嘛,正如一樓說的,正因為是exponential family的緣故。
沒錯,是局部最大值,而不一定是global最大值。這還是要看你的似然函數,大多數似然函數都是簡單的,唯一的那個局部最大值就是global最大值,只有當解非線性問題的時候,似然函數會比較復雜!這種情況就需要一些特殊的優化演算法。
⑺ 遙感圖像分類中最大似然法分類的優點
基於參數化密度分布模型的最大似然方法 (MLC)是遙感影像分類最常用手段之一 ,與其他非參數方法 (如神經網路 )相比較 ,它具有清晰的參數解釋能力、易於與先驗知識融合和演算法簡單而易於實施等優點。但是由於遙感信息的統計分布具有高度的復雜性和隨機性 ,當特徵空間中類別的分布比較離散而導致不能服從預先假設的分布 ,或者樣本的選取不具有代表性 ,往往得到的分類結果會偏離實際情況。
⑻ 請教:如何正確理解最大似然估計
通俗的說吧。比如說一個骰子投出10次,點數都是6。你覺得哪種可能性大?
1、骰子是均勻的。
2、骰子不均勻,點數1的那頭灌了鉛
這時我們更願意接受第二種估計,原因是在第二種假設下,「更有可能」出現10個6點。
可以說,這就是最大似然估計。
如果我們面臨的是從多個可選答案中挑選正確答案的決策任務,那麼「使得樣本出現的可能性最大」可以作為決策的准則。這種估計方法就是最大似然法。
⑼ 求最大似然估計
似然函數L=(1-theta)*(theta^2)^2*(theta*(1-theta))
=(1-theta)^2*(theta)^5
log(L)=2log(1-theta)+5log(theta)
令log(L)對theta求導
=
-2/(1-theta)+5/theta=0
得到theta=5/7
即極大似然估計為theta=5/7
希望對你有幫助,望採納,謝謝~