存儲文件分析
㈠ es存儲目錄分析
Elasticsearch中生成的數據文件一般來說主要有三種,分別是state、index和translog。
查看ES存儲目錄,可發現有多個_state目錄,目錄高敗下存放了以.st為後綴的文件。例如
這些st文件內容在ES源碼里被稱之為MetaData,緩存了諸如NodeState,ClusterState,IndexState,ShardState等戚配顫信息
nodes/0/_state/:
這層目錄在節點級別,該目錄下的global-1.st文件存儲的是MetaData中除去IndexMetaData的部分,即一些集群級別的配置和templates。node-0.st中存儲的是NodeId。
nodes/0/indices/2Scrm6nuQOOxUN2ewtrNJw/_state/:
這層目錄在index級別,2Scrm6nuQOOxUN2ewtrNJw是IndexId,該目錄下的state-2.st文件存儲的是IndexMetaData。
nodes/0/indices/2Scrm6nuQOOxUN2ewtrNJw/0/_state/:
這層目錄在shard級別,該目錄下的state-0.st存儲的是ShardStateMetaData,包含是否是primary和allocationId等信息。
可以看到,集群相關的MetaData和Index的MetaData是在不同的目錄中存儲的。另外,集群相關的Meta會賣脊在所有的MasterNode和DataNode上存儲,而Index的Meta會在所有的MasterNode和存儲了該Index數據的DataNode上存儲。
㈡ MB和KB哪個容量更大
對於大部分人來說,MB和KB是平時使用較多的兩個計量單位,尤其是在電腦或手機上瀏覽網頁、存儲文件、下載內容時,這兩個單位的大小直接關系著我們的使用體驗。那麼,mb和kb到底哪個大呢?接下來,我們將從不同角度解答這個問題。
1. 計量單位的定義
MB是「兆位元組」的縮寫,一兆位元組(1MB)等於1024KB或1,048,576個位元組。KB是「千位元組」的縮寫,一千位元組(1KB)等於1024個位元組。由此可以得出,MB比KB大得多。
2. 存儲容量的對比
現在,大部分的存儲設備都是以MB或GB作為單位的,KB已經很少使用了。如果將一個存儲設備的容量比作一個水桶,那麼KB只能算是很小的小桶,而MB則可以算是中等大小的水桶。舉個例子,如果一個文件大小為50KB,那麼在一個200MB的存儲設備上可以存儲4000個這樣的文件,而在只有100MB的設備上,同樣數量的文件就無法儲存了。
3. 下載速度的影響
在下載文件時,因為MB的容量比KB大,所以同樣大小的文件下載速度會更快。以一個2MB的文件為例,如果下載速度為100KB/s,那麼下載這個文件需要20秒,但如果下載速度提高到1MB/s,那麼只需要2秒鍾就能下載完成。這也是為什麼大部分人更傾向於下載較小的文件。
4. 網頁載入速度
在瀏覽網頁時,MB和KB的大小直接關系著網頁載入速度。如果一個網頁的大小為1MB,那麼在網速為1MB/s的情況下,需要1秒鍾才能完全載入,而如果網速只有100KB/s,那麼需要10秒鍾才能完成載入。相比之下,一個500KB大小的網頁在相同網速下,只需要0.5秒完成載入。
5. 結論
從上面的分析來看,MB比KB大得多,不僅在存儲容量、下載速度上有優勢,在網頁載入速度上也更勝一籌。所以,無論是存儲文件還是下載內容,我們都應該盡量選擇MB大小的文件,避免因為文件過大而影響體驗。同時,在日常使用中,我們也應該學會正確理解計量單位,避免因為單位混淆而導致的誤解。
㈢ 什麼是文件存儲模式
文件存儲模式是指在計算機系統中,將數據及有關信息按某種格式以數據文件的方式存儲在磁碟上,通過操作系統來實現對文件的訪問和管理。文件存儲模式或叫文件管理系統的特點是:
(1)數據文件是大量數據的集合形式,每個文件包含有大量的記錄,每個記錄包含若干個數據項,文件和文件名面向用戶並存儲在計算機存儲設備上,可反復利用。
(2)面向用戶的數據文件,用戶可通過它進行查詢、修改、刪除等操作。
(3)數據文件與對應的程序具有一定的獨立性,即程序員可不關心數據的物理存儲狀態,只須考慮數據的邏輯存儲結構,從而可以大量地節省修改和維護程序的工作量。
(4)數據文件的缺點是只能對應一個或幾個應用程序,不能擺脫對程序的依賴性。數據文件之間不能建立關系,呈現出無結構的信息集合狀態,往往冗餘度大,不易擴充、維護和修改。
㈣ 有沒有自動分析電腦上存儲文檔內容的軟體
用一下TuneUp Utilities 2007,挺不錯的,裡面有一個文件管理,看看合適不