分布緩存
1. 什麼是高速緩沖存儲器
高速緩沖存儲器(Cache)實際上是為了把由DRAM組成的大容量內存儲器都看做是高速存儲器而設置的小容量局部存儲器,一般由高速SRAM構成。這種局部存儲器是面向CPU的,引入它是為減小或消除CPU與內存之間的速度差異對系統性能帶來的影響。Cache 通常保存著一份內存儲器中部分內容的副本(拷貝),該內容副本是最近曾被CPU使用過的數據和程序代碼。Cache的有效性是利用了程序對存儲器的訪問在時間上和空間上所具有的局部區域性,即對大多數程序來說,在某個時間片內會集中重復地訪問某一個特定的區域。如PUSH/POP指令的操作都是在棧頂順序執行,變數會重復使用,以及子程序會反復調用等,就是這種局部區域性的實際例證。因此,如果針對某個特定的時間片,用連接在局部匯流排上的Cache代替低速大容量的內存儲器,作為CPU集中重復訪問的區域,系統的性能就會明顯提高。
系統開機或復位時,Cache 中無任何內容。當CPU送出一組地址去訪問內存儲器時,訪問的存儲器的內容才被同時「拷貝」到Cache中。此後,每當CPU訪問存儲器時,Cache 控制器要檢查CPU送出的地址,判斷CPU要訪問的地址單元是否在Cache 中。若在,稱為Cache 命中,CPU可用極快的速度對它進行讀/寫操作;若不在,則稱為Cache未命中,這時就需要從內存中訪問,並把與本次訪問相鄰近的存儲區內容復制到Cache 中。未命中時對內存訪問可能比訪問無Cache 的內存要插入更多的等待周期,反而會降低系統的效率。而程序中的調用和跳轉等指令,會造成非區域性操作,則會使命中率降低。因此,提高命中率是Cache 設計的主要目標。
2. 中庸分布和緩沖分布有什麼區別
中庸分布和緩沖分布的區別:
1、中庸分布是指閑家對於勝平負三個方向的打出可能性處於模稜兩可的位置,也就是閑家無從判斷一個必定的結果,這時候,閑家的投注量基本會和打出的概率相吻合。同時,由於模稜兩可的不確定性,任何一種變盤都會影響投注的方向與投注量。
2、緩沖分布是一類比較隱蔽的分布格局。就是對陣兩隊各有缺點,但是誰的缺點壓過誰的問題,使得分布朝哪個方向傾斜的問題。或者兩隊狀態都好,但是誰的好狀態壓過誰的問題。
【中庸分布和緩沖分布】歐核是指歐賠核心思維,其中對分布的分類有四種,順分布、逆分布、中庸分布、緩沖分布,這四種分布中,順分布和逆分布分別表示投注量的方向,而中庸分布和緩沖分布分別表示信心的強度。
分布的概念在歐核里較為重要的是中庸分布和緩沖分布,需要和人氣可分散的概念相互結合使用。此外,具體使用過程中還需要結合更優解和最優解的理解才能達到較好的效果。
3. 怎麼合理的使用memcache緩存如果緩存數據量過大怎麼部署
這個,你不能這么問的,太籠統了。要看你的具體環境以及需求的。
現在部署方案有兩種對立但是又都比較常用的。jimmyyem1的是一種,另外一種就是提倡不要集中部署memcached,而是分布在不同的機器上的。例如所有的web和db伺服器都分1G出來給memcache,這樣的話,如果down掉一台機器不至於損失所有的緩存效果。而只部署在一台上的話,如果這台伺服器down了,整個memcache就都不工作了。當然,部署在多台伺服器上也會帶來管理不便等方面的問題。
4. 緩存的分布緩存
分布式緩存系統是為了解決資料庫伺服器和web伺服器之間的瓶頸。如果一個網站的流量很大,這個瓶頸將會非常明顯,每次資料庫查詢耗費的時間將會非常可觀。對於更新速度不是很快的網站,我們可以用靜態化來避免過多的資料庫查詢。對於更新速度以秒計的網站,靜態化也不會太理想,可以用緩存系統來構建。如果只是單台伺服器用作緩存,問題不會太復雜,如果有多台伺服器用作緩存,就要考慮緩存伺服器的負載均衡。
使用Memcached分布式緩存服務來達到保存用戶的會話數據,而達到各個功能模塊都能夠跨省份、跨伺服器共享本次會話中的私有數據的目的。每個省份使用一台伺服器來做為Memcached伺服器來存儲用話的會話中的數據,當然也可以多台伺服器,但必須確保每個省份的做Memcached伺服器數量必須一致,這樣才能夠保證Memcached客戶端操作的是同一份數據,保證數據的一致性。
會話數據的添加、刪除、修改
Memcached客戶端,添加、刪除和、修改會話信息數據時,不僅要添加、刪除、修改本省的Memcached伺服器數據,而且同時要對其它省份的Memcahed伺服器做同樣的操作,這樣用戶訪問其它省份的伺服器的功能模塊進也能讀取到相同的會話數據。Memcached客戶端伺服器的列表使用區域網的內網IP(如:192.168.1.179)操作本省的Memcahed伺服器,使用公網的IP((如:202.183.62.210))操作其它省份的Memcahe伺服器。
會話數據的讀取
系統所有模塊讀取會話數據的Memcached客戶端伺服器列表都設為本省Memcached伺服器地址的內網IP來向Memcahed伺服器中讀取會話數據。
同一會話的確認
使用Cookie來保持客戶與服務端的聯系。每一次會話開始就生成一個GUID作為SessionID,保存在客戶端的Cookie中,作用域是頂級域名,這樣二級、三級域名就可以共享到這個Cookie,系統中就使用這個SessionID來確認它是否是同一個會話。
會話數據的唯一ID
會話數據存儲在Memcached伺服器上的唯一鍵Key也就是會話數據數據的唯一ID定義為:SessionID_Name, SessionID就是保存在客戶端Cookie中的SessionID,Name就是會話數據的名稱,同一次會話中各個會話數據的Name必須是唯一的,否則新的會話數據將覆蓋舊的會話數據。
會話的失效時間
會話的失效通過控制Cookie的有效時間來實現,會話的時間設為SessionID或Cookie中的有效時間,且每一次訪問SessionID時都要重新設置一下Cookie的有效時間,這樣就達到的會話的有效時間就是兩次間訪問Cookie中SessionID值的的最長時間,如果兩次訪問的間隔時間超過用效時間,保存在SessionID的Cookie將會失效,並生成新的SessionID存放在Cookie中, SessionID改變啦,會話就結束啦。Memcached伺服器中會話數據的失效,每一次向Memcache伺服器中添加會話數據時,都把有效時間設為一天也就是24小時,讓Memcached服務使用它內部的機制去清除,不必在程序中特別做會話數據的刪除操作。數據在Memcache伺服器中有有效時間只是邏輯上的,就算是過了24 小時,如果分配給Memcached服務的內存還夠用的話,數據還是保存在內存當中的,只是Memcache客戶端讀取不到而已。只有到了分配給Memcached服務的內存不夠用時,它才會清理沒用或者比較舊的數據,也就是懶性清除。
5. 國內有 Oracle Coherence 分布式緩存的成熟應用嗎
Coherence 在可靠的、高度可伸縮的對等集群協議之上提供了復制的、分布式的(分區的)數據管理和緩存服務。
Coherence 不存在單點故障,當某台伺服器無法操作或從網路斷開時,它可以自動且透明地進行故障切換並重新分布它的集群化數據管理服務。
6. 緩存伺服器的緩存概念
這是兩種主要的Web緩存:
直接緩存,將用戶頻繁訪問的來自Internet伺服器的Web對象的拷貝保存在企業本地網路中。
反向緩存,企業內部Web伺服器的Web對象的拷貝保存在企業網路邊緣的代理伺服器上以提高外界訪問企業站點的性能。
Web緩存可以根據不同等級進行配置:
本地緩存:將Web對象緩存的拷貝保存在本地計算機中。大多數流行的Web瀏覽器默認情況下保留一個先前訪問對象的緩存。例如,Internet Explorer稱之為「臨時Internet文件」。本地緩存拷貝只是在用戶頻繁地從同一台機器訪問頁面時有用。
代理緩存:代理伺服器是為公司內的多個用戶/客戶計算機緩存Web對象的單獨機器。它們是位於客戶端和託管的Web伺服器之間的計算機,而且它們比本地緩存效率更高,因為在企業本地網路中的任何用戶或計算機訪問某個Web對象時,緩存拷貝對想訪問該對象的任何其他用戶/計算機是可用的,無需到Internet伺服器上再次下載它。代理緩存可以在網路邊緣與防火牆結合使用。
微軟的ISA Server和BlueCoat的工具一樣,既包括防火牆也包括緩存代理伺服器。緩存伺服器也可以是單獨的機器,運行免費的緩存軟體或商業產品,例如:
Linux版的Squid免費緩存代理
MOWS基於java分布式web和緩存伺服器
Vicomsoft RapidCache Server for Windows或Macintosh
WinProxy for Windows
可升級的緩存解決方案
隨著公司的擴大,單一的Web緩存伺服器可能無法處理所有的通信或存儲足夠的Web對象。在這種情況下,可以擴展緩存解決方案以建立一個緩存陣列——一組共同工作以便在組內分配緩存負載的緩存代理伺服器。萬一某個緩存伺服器停機,還提供預設的容量。
要在陣列中操作,緩存伺服器必須能夠彼此使用協議進行通信,例如:
WCCP(Web緩存協調協議),Cisco緩存產品以及諸如Squid這樣的開源代理使用。
ICP(Internet緩存協議),被Squid和BlueCoat支持。
CARP(緩存陣列路由協議),被ISA Server Enterprise Edition用來管理緩存伺服器陣列的失效轉移和負載平衡。
CARP能夠支持幾乎無限的線性擴展以滿足快速增長型企業的需求。當向某個陣列中添加或移除一台伺服器時,CARP自動調整並再指定URL以有效地分布負載。
緩存陣列能夠以等級的或分布式的架構排列。在分布式緩存中,陣列中所有代理伺服器處在一個「平等地位」而且負載在它們之間進行分配。在分等級的緩存中,代理以鏈式進行配置,它們處在不同的等級,所以伺服器或陣列連接到其它離Internet更近的伺服器或陣列(離Internet最近的那些伺服器或陣列被看作「上游的」,那些最遠的被看作「下游的」)。這樣,緩存內容會盡可能地靠近需要它的用戶。
陣列是高度可升級的,因為可以向陣列添加伺服器,或向分等級的架構增加陣列等級,而無需擾亂目 前的緩存解決方案。
另一個可擴展性問題是使用緩存減少分支機構網路帶寬的能力。分支機構代理可能沒有直接連接到Internet,但是可以使用撥號連接或辦公室到辦公室的WAN連接以便從總公司的上游代理伺服器上請求Web對象。
另一個選擇是為需要向消費者提供基於Web的應用,可使用諸如由Akamai提供的服務。他們的Web Application Accelerator服務通過下列方法優化性能:
向他們的邊緣伺服器動態映射請求,並監視Internet路由以便在最快和最可靠的路由上傳輸。
利用壓縮技術和預取技術(pre-fetching)以最小化帶寬使用率。
用安全套接層(SSL)保護Web傳輸。
緩存支持的有些硬體標准:
目前緩存支持的硬體標准:
內存不超過4G,超過的只識別4G。
硬碟不超過2T,超過的只識別2T
存儲硬碟數量最大支持4塊(如果系統盤是電子盤不包含在內)
另外推薦使用INTEL的機器和網卡。
7. 高速緩存是在硬碟中嗎,他是一個集中的模塊嗎,還是分布在各個軟體的安裝目錄里,他會定期自我清理嗎
它是硬碟與內存之間交換數據的通道 需要處理的數據從硬碟通過高速緩存 再到內存里 ......
由於高速緩存價格較高 所以在硬碟里都不會很大 一般 16 32M左右 數據交換很快 很頻繁的 斷電數據會丟失 當然也就沒有什麼自我清理一說了
8. 分析Memcached客戶端如何把緩存數據分布到多個伺服器上
解決方法1:不同的模塊使用不同memcached客戶端實例,這樣不同模塊就可以配置不同的伺服器列表,這樣不同模塊的數據就緩存到了不同的伺服器中。這樣,當某台伺服器不可用後,只會影響到相應memcached客戶端實例的數據,而不會影響到其它客戶端實例的數據。
解決方法2:修改或添加新的演算法,並在數據唯一鍵中添加命名空間,演算法根據配置和數據唯一鍵中命名空間來選擇不同的Socket連接,也就是伺服器啦。
數據項唯一鍵(key)的定義:命名空間.數據項ID,就跟編程中的」 命名空間」一樣,經如說用戶有一篇日誌的ID是」999999」, 那麼這條篇日誌的唯一鍵就是:Sns.UserLogs.Log.999999,當然我們存貯的時候考慮性能問題,可以用一個短的數值來代替命名空間。這樣在選擇Socket的時候就可以根據數據項中的唯一鍵來選擇啦。
9. 如何使用分布是緩存Hazelcast
在pom.xml中配置對Hazelcast的依賴
<dependencies>
<dependency>
<groupId>com.hazelcast</groupId>
<artifactId>hazelcast</artifactId>
<version>3.5.2</version>
</dependency>
</dependencies>1234567
2.創建hazelcast server端和client端並運行
用hazelcast分布式Map和分布式queue創建一個簡單的hazelcast java 程序
運行我們的程序兩次創建集群中的兩個Member(JVMS)
用hazelcast native java client API連接我們創建的hazelcast集群並訪問分布式數據。