哈希查找演算法

發布時間: 2025-02-04 14:40:36

❶ 數據結構哈希演算法

1，直接定址法：
函數公式：f(key)=a*key+b (a,b為常數)
這種方法的優點是：簡單，均勻，不會產生沖突。但是需要事先知道關鍵字的分布情況，適合查找表較小並且連續的情況。
2，數字分析法：
比如我們的11位手機號碼「136XXXX7887」，其中前三位是接入號，一般對應不同運營公司的子品牌，如130是聯通如意通，136是移動神州行，153是電信等。中間四們是HLR識別號，表示用戶歸屬地。最後四們才是真正的用戶號。
若我們現在要存儲某家公司員工登記表，如果用手機號碼作為關鍵字，那麼極有可能前7位都是相同的，所以我們選擇後面的四們作為哈希地址就是不錯的選擇。
3，平方取中法：
故名思義，比如關鍵字是1234，那麼它的平方就是1522756，再抽取中間的3位就是227作為哈希地址。
4，折疊法：
折疊法是將關鍵字從左到右分割成位數相等的幾個部分(最後一部分位數不夠可以短些)，然後將這幾部分疊加求和，並按哈希表表長，取後幾位作為哈希地址。
比如我們的關鍵字是9876543210，哈希表表長三位，我們將它分為四組，987|654|321|0 ，然後將它們疊加求和987+654+321+0=1962，再求後3位即得到哈希地址為962，哈哈，是不是很有意思。
5，除留余數法：
函數公式：f(key)=key mod p (p<=m)m為哈希表表長。
這種方法是最常用的哈希函數構造方法。
6，隨機數法：
函數公式：f(key)= random(key)。
這里random是隨機函數，當關鍵字的長度不等是，採用這種方法比較合適。
兩種哈希函數沖突解決方法：
我們設計得最好的哈希函數也不可能完全避免沖突，當我們在使用哈希函數後發現兩個關鍵字key1!=key2，但是卻有f(key1)=f(key2)，即發生沖突。

❷ 哈希查找演算法

散列表（Hash table，也叫哈希表），是根據鍵（Key）而直接訪問在內存存儲位置的數據結構。也就是說，它通過計算一個關於鍵值的函數，將所需查詢的數據映射到表中一個位置來訪問記錄，這加快了查找速度。這個映射函數稱做散列函數，存放記錄的數組稱做散列表。

通過某種轉換關系，使關鍵字適度的分散到指定大小的的順序結構中，越分散，則以後查找的時間復雜度越小，空間復雜度越高。

Hash是一種典型以空間換時間的演算法，比如原來一個長度為100的數組，對其查找，只需要遍歷且匹配相應記錄即可，從空間復雜度上來看，假如數組存儲的是byte類型數據，那麼該數組佔用100byte空間。現在我們採用Hash演算法，我們前面說的Hash必須有一個規則，約束鍵與存儲位置的關系，那麼就需要一個固定長度的hash表，此時，仍然是100byte的數組，假設我們需要的100byte用來記錄鍵與位置的關系，那麼總的空間為200byte，而且用於記錄規則的表大小會根據規則，大小可能是不定的。

通過哈希函數，我們可以將鍵轉換為數組的索引(0-M-1)，但是對於兩個或者多個鍵具有相同索引值的情況，我們需要有一種方法來處理這種沖突。

一種比較直接的辦法就是，將大小為M 的數組的每一個元素指向一個鏈表，鏈表中的每一個節點都存儲散列值為該索引的鍵值對，這就是拉鏈法。下圖很清楚的描述了什麼是拉鏈法。

「John Smith」和「Sandra Dee」通過哈希函數都指向了152 這個索引，該索引又指向了一個鏈表，在鏈表中依次存儲了這兩個字元串。

單獨鏈表法：將散列到同一個存儲位置的所有元素保存在一個鏈表中（聚集），該方法的基本思想就是選擇足夠大的M，使得所有的鏈表都盡可能的短小，以保證查找的效率。當鏈表過長、大量的鍵都會映射到相同的索引上，哈希表的順序查找會轉變為鏈表的查找，查找時間將會變大。對於開放定址會造成性能的災難性損失。

實現基於拉鏈表的散列表，目標是選擇適當的數組大小M，使得既不會因為空鏈表而浪費內存空間，也不會因為鏈表太而在查找上浪費太多時間。拉鏈表的優點在於，這種數組大小M的選擇不是關鍵性的，如果存入的鍵多於預期，那麼查找的時間只會比選擇更大的數組稍長。另外，我們也可以使用更高效的結構來代替鏈表存儲。如果存入的鍵少於預期，索然有些浪費空間，但是查找速度就會很快。所以當內存不緊張時，我們可以選擇足夠大的M，可以使得查找時間變為常數，如果內存緊張時，選擇盡量大的M仍能夠將性能提高M倍。

線性探測法是開放定址法解決哈希沖突的一種方法，基本原理為，使用大小為M的數組來保存N個鍵值對，其中M>N，我們需要使用數組中的空位解決碰撞沖突。如下圖所示：

對照前面的拉鏈法，在該圖中，「Ted Baker」是有唯一的哈希值153的，但是由於153被「Sandra Dee」佔用了。而原先「Snadra Dee」和「John Smith」的哈希值都是152的，但是在對「Sandra Dee」進行哈希的時候發現152已經被佔用了，所以往下找發現153沒有被佔用，所以索引加1 把「Sandra Dee」存放在沒有被佔用的153上，然後想把「Ted Baker」哈希到153上，發現已經被佔用了，所以往下找，發現154沒有被佔用，所以值存到了154上。

單純論查找復雜度：對於無沖突的Hash表而言，查找復雜度為O(1)。

原文：哈希查找 - 賣賈筆的小男孩 - 博客園 (cnblogs.com)

❸ 【ALG 演算法】023 | 分塊查找、散列查找（哈希查找）

在查找演算法中，分塊查找和散列查找（哈希查找）是兩種常用的技術。分塊查找將數據按大小分為若干塊，每塊內元素無序，塊間有序，通過索引表確定待查記錄所屬塊，然後在塊內進行順序查找，平均查找長度與塊數和塊內元素數相關。分塊查找在塊內有序的情況下效率較高，但塊間不連續導致查找效率降低。

散列查找通過哈希函數將關鍵字與存儲位置建立聯系，形成散列表。哈希函數將關鍵字映射到特定的存儲位置，解決關鍵字沖突的方式有拉鏈法和開放定址法。拉鏈法通過鏈表解決沖突，開放定址法則通過探測序列尋找下一個空閑位置。開放定址法包括線性探測、平方探測和偽隨機序列探測，其中平方探測法更不易產生聚集問題。散列查找的理想時間復雜度為O(1)，但實際效率受裝填因子（沖突頻率）影響，合理設計哈希函數可以提高查找效率。

對於特定數據集，選擇合適的哈希函數至關重要。例如，對於連續分布的學號，使用取余法生成哈希值較為合適；對於非連續分布的關鍵字，考慮在關鍵字的特定位數上構造哈希函數以提高均勻性。哈希函數的選擇應綜合考慮關鍵字分布和存儲需求，以優化查找效率和空間利用。

此外，沖突處理方式影響查找效率和空間佔用。拉鏈法通過鏈表解決沖突，適合少量沖突情況；開放定址法通過探測序列尋找空位，適於大量沖突場景。線性探測法簡單但可能產生聚集問題，平方探測法和偽隨機探測法則能降低聚集風險。在實際應用中，合理設計沖突處理策略和優化哈希函數，可以有效提高查找演算法的性能。

閱讀全文

熱點內容

編程和技術發布：2025-04-23 14:11:02 瀏覽：640

蘋果游戲部落沖突如何轉安卓發布：2025-04-23 13:26:13 瀏覽：62

計算器的密碼多少發布：2025-04-23 13:21:48 瀏覽：463

哪種腳本發布：2025-04-23 13:11:48 瀏覽：76

java企業發布：2025-04-23 13:11:04 瀏覽：85

秒拍上傳本地視頻發布：2025-04-23 13:05:14 瀏覽：455

吃雞安卓區轉蘋果區需要休息什麼發布：2025-04-23 13:03:12 瀏覽：908

編程速度發布：2025-04-23 13:00:20 瀏覽：353

族譜網源碼發布：2025-04-23 12:47:26 瀏覽：30

rsa演算法演算法c語言實現發布：2025-04-23 12:45:14 瀏覽：936

哈希查找演算法

與哈希查找演算法相關的資訊