主從分離演算法
❶ mysql主從分離是怎麼配置的
1、在主從伺服器上都裝上MySQL資料庫,windows系統鄙人安裝的是mysql_5.5.25.msi版本,Ubuntu安裝的是mysql-5.6.22-linux-glibc2.5-i686.tar
windows安裝mysql就不談了,一般地球人都應該會。鄙人稍微說一下Ubuntu的MySQL安裝,我建議不要在線下載安裝,還是離線安裝的好。大家可以參考 這位不知道大哥還是姐妹,寫的挺好按照這個就能裝上。在安裝的時候可能會出現幾種現象,大家可以參考解決一下:
(1)如果您不是使用root用戶登錄,建議 su - root 切換到Root用戶安裝,那就不用老是 sudo 了。
(2)存放解壓的mysql 文件夾,文件夾名字最好改成mysql
(3)在./support-files/mysql.server start 啟動MySQL的時候,可能會出現一個警告,中文意思是啟動服務運行讀文件時,忽略了my.cnf文件,那是因為my.cnf的文件許可權有問題,mysql會認為該文件有危險不會執行。但是mysql還會啟動成功,但如果下面配置從伺服器參數修改my.cnf文件的時候,你會發現文件改過了,但是重啟服務時,修改過後的配置沒有執行,而且您 list一下mysql的文件夾下會發現很多.my.cnf.swp等中間文件。這都是因為MySQL啟動時沒有讀取my.cnf的原因。這時只要將my.cnf的文件許可權改成my_new.cnf的許可權一樣就Ok,命令:chmod 644 my.cnf就Ok
(4)Ubuntu中修改文檔內容沒有Vim,最好把Vim 裝上,apt-get install vim,不然估計會抓狂。
這時候我相信MySQL應該安裝上去了。
2、配置Master主伺服器
(1)在Master MySQL上創建一個用戶『repl』,並允許其他Slave伺服器可以通過遠程訪問Master,通過該用戶讀取二進制日誌,實現數據同步。
創建用於讀取日誌的資料庫用戶
(2)找到MySQL安裝文件夾修改my.Ini文件。mysql中有好幾種日誌方式,這不是今天的重點。我們只要啟動二進制日誌log-bin就ok。
在[mysqld]下面增加下面幾行代碼
View Code
(3)查看日誌
mysql> SHOW MASTER STATUS;
+-------------------+----------+--------------+------------------+
| File | Position | Binlog_Do_DB | Binlog_Ignore_DB |
+-------------------+----------+--------------+------------------+
| master-bin.000001 | 1285 | | |
+-------------------+----------+--------------+------------------+
1 row in set (0.00 sec)
重啟MySQL服務
3、配置Slave從伺服器(windows)
(1)找到MySQL安裝文件夾修改my.ini文件,在[mysqld]下面增加下面幾行代碼
my.cnf 配置
重啟MySQL服務
(2)連接Master
change master to master_host='192.168.0.104', //Master 伺服器Ip
master_port=3306,
master_user='repl',
master_password='mysql',
master_log_file='master-bin.000001',//Master伺服器產生的日誌
master_log_pos=0;
(3)啟動Slave
start slave;
4、Slave從伺服器(Ubuntu)
(1)找到MySQL安裝文件夾修改my.cnf文件,vim my.cnf
s
(2) ./support-files/myql.server restart 重啟MySQL服務 , ./bin/mysql 進入MySQL命令窗口
(3)連接Master
change master to master_host='192.168.0.104', //Master 伺服器Ip
master_port=3306,
master_user='repl',
master_password='mysql',
master_log_file='master-bin.000001',//Master伺服器產生的日誌
master_log_pos=0;
(4)啟動Slave
start slave;
OK所有配置都完成了,這時候大家可以在Master Mysql 中進行測試了,因為我們監視的時Master mysql 所有操作日誌,所以,你的任何改變主伺服器資料庫的操作,都會同步到從伺服器上。創建個資料庫,表試試吧。。。
❷ Redis早期的主從架構原理分析,早期如何實現讀寫分離的
基於主從復制架構,實現讀寫分離,redis slave node節點只讀,默認開啟配置:slave-read-only yes。開啟了只讀的節點redis slave node,會拒絕所有寫操作,這樣可以強制搭建成讀寫分離的架構。
(1)redis採用非同步方式復制數據到slave節點。
(2)一個master node是可以配置多個slave node的。
(3)slave node也可以連接其他的slave node。
(4)slave node做復制的時候,是不會block master node的正常工作的。
(5)slave node在做復制的時候,也不會block對自己的查詢操作,它會用舊的數據集來提供服務; 但是復制完成的時候,需要刪除舊數據集,載入新數據集,這個時候就會暫停對外服務了。
(6)slave node主要用來進行橫向擴容,做讀寫分離,擴容的slave node可以提高讀的吞吐量。
如果採用了主從架構,那麼建議必須開啟master node的持久化!不建議用slave node作為master node的數據熱備,因為那樣的話,如果你關掉master的持久化,可能在master宕機重啟的時候數據是空的,然後可能一經過復制,salve node數據也丟了。
(1)當啟動一個slave node的時候,它會發送一個 PSYNC 命令給master node。
(2)如果這是slave node 重新連接 master node,那麼master node僅僅會 復制給slave部分缺少的數據 ,否則如果是slave node 第一次連接 master node,那麼會觸發一次 full resynchronization ,master會啟動一個後台線程,開始生成一份RDB快照文件,同時還會將從客戶端收到的所有寫命令 緩存在內存中 。RDB文件生成完畢之後,master會先將這個RDB發送給slave,slave會先寫入本地磁碟,然後再從本地磁碟載入到內存中。然後master會將內存中 緩存的寫命令 發送給slave,slave也會同步這些數據。
(3)slave node如果跟master node有網路故障,斷開了連接,會自動重連。master如果發現有多個slave node都來重新連接,僅僅會啟動一個rdb save操作,用一份數據服務所有slave node。
從redis 2.8開始,就支持主從復制的斷點續傳,如果主從復制過程中,網路連接斷掉了,那麼可以接著上次復制的地方,繼續復制下去,而不是從頭開始復制。master node會在內存中建一個 backlog ,master和slave都會保存一個 replica offset 還有一個 master id(run id) ,offset就是保存在backlog中的。如果master和slave網路連接斷掉了,slave會讓master從上次的replica offset開始繼續復制,但是如果沒有找到對應的offset,那麼就會執行一次full resynchronization全量同步。
master在內存中直接創建rdb,然後發送給slave,不會在自己本地落地磁碟了。
repl-diskless-sync no 改為開啟就可以了
repl-diskless-sync-delay,等待一定時長再開始復制,因為要等更多slave重新連接過來,用一分數據提供服務。
slave node不會過期key,只會等待master過期key。如果master過期了一個key,或者通過LRU淘汰了一個key,那麼會模擬一條del命令發送給slave。
(1)slave node啟動,僅僅保存master node的信息,包括master node的host和ip,但是復制流程沒開始。master host和ip是從哪兒來的?redis.conf裡面的slaveof配置的。
(2)slave node內部有個定時任務,每秒檢查是否有新的master node要連接和復制,如果發現,就跟master node建立socket網路連接。
(3)slave node發送ping命令給master node。
(4)口令認證,如果master設置了requirepass(master上啟用安全認證配置,requirepass 自己取名 ),那麼salve node必須發送masterauth的口令過去進行認證(masterauth 自己取名 )
(5)master node第一次執行全量復制,將所有數據發給slave node。
(6)master node後續持續將寫命令,增量非同步復制給slave node。
指的就是第一次slave連接msater的時候,執行的全量復制,這個過程裡面的一些細節的機制
(1)master和slave都會維護一個offset
master會在自身不斷累加offset,slave也會在自身不斷累加offset。slave每秒都會上報自己的offset給master,同時master也會保存每個slave的offset。這個倒不是說特定就用在全量復制的,主要是master和slave都要知道各自的數據的offset,才能知道互相之間的數據不一致的情況。
(2)backlog
master node有一個backlog,默認是1MB大小,master node給slave node復制數據時,也會將數據在backlog中同步寫一份。backlog主要是用來做全量復制中斷後的增量復制的。
(3)master run id
info server命令,可以看到master run id。如果根據host+ip定位master node,是不靠譜的,如果master node重啟或者數據出現了變化,那麼slave node應該根據不同的run id區分,run id不同就做全量復制。如果需要不更改run id重啟redis,可以使用redis-cli debug reload命令。
(4)psync
從節點使用psync從master node進行復制psync runid offset。master node會根據自身的情況返回響應信息,可能是FULLRESYNC runid offset觸發全量復制,可能是繼續觸發增量復制。
(1)master執行bgsave,在本地生成一份rdb快照文件。
(2)master node將rdb快照文件發送給salve node,如果rdb復制時間超過60秒(repl-timeout),那麼slave node就會認為復制失敗,可以適當調節大這個參數。
(3)對於千兆網卡的機器,一般每秒傳輸100MB,6G文件,很可能超過60s。
(4)master node在生成rdb時,會將所有新的寫命令緩存在內存中,在salve node保存了rdb之後,再將新的寫命令復制給salve node。
(5)client-output-buffer-limit slave 256MB 64MB 60,如果在復制期間,內存緩沖區持續消耗超過64MB,或者一次性超過256MB,或復制時間超過60秒,那麼停止復制,復制失敗。
(6)slave node接收到rdb之後,然後重新載入rdb到自己的內存中,同時基於舊的數據版本對外提供服務,寫入後,清空自己的舊數據,用新的對外提供讀服務。
(7)如果slave node開啟了AOF,那麼會立即執行BGREWRITEAOF,重寫AOF。在這個過程中,rdb生成、rdb通過網路拷貝、slave舊數據的清理、slave node aof rewrite,很耗費時間的。
(1)如果全量復制過程中,master-slave網路連接斷掉,那麼salve重新連接master時,會觸發增量復制。
(2)master直接從自己的backlog中獲取部分丟失的數據,發送給slave node,默認backlog就是1MB。
(3)master就是根據slave發送的psync中的offset來從backlog中獲取數據的。
下節講解哨兵架構,在講之前,你能否處理下面兩個問題呢?
1、非同步復制導致的數據丟失
哨兵可以解決主從架構下,因master宕機後不能接收寫請求而進行選舉salve為新的master,達到高可用的效果。
因為master -> slave的復制是非同步的,所以可能有部分數據還沒復制到slave,master就宕機了,此時這些部分數據就丟失了,此時應該怎麼處理?
2、腦裂導致的數據丟失
腦裂,也就是說,某個master所在機器突然脫離了正常的網路,跟其他slave機器不能連接,但是實際上master還運行著。
此時哨兵可能就會認為master宕機了,然後開啟選舉,將其他slave切換成了master這個時候,集群里就會有兩個master,也就是所謂的腦裂。
此時雖然某個slave被切換成了master,但是可能client還沒來得及切換到新的master,還繼續寫向舊master的數據可能也丟失了,因此舊master再次恢復的時候,會被作為一個slave掛到新的master上去,自己的數據會清空,重新從新的master復制數據,導致數據丟失,怎麼處理腦裂導致的數據丟失呢?
先考慮一下,我們下節進行講解。