本案例是一個朋友的案例他也寫了出來如下:
https://mp.weixin.qq.com/s/XSnFkuYzIlGWMaXIl-oPeQ
但是和他交流后他也準備改因為分析有一些小問題。
其實本案例就是前文第七部分總結中的:
Gtid關閉,simple_recovery=flase 5.7.6以上:這種方式一定得到正確的Gtid集合 重啟Mysql不掃秒全部的binlog,如果是中途打開GTID重啟任然需要掃描多個binlog因為需要找到Gtid event。 purge binlog或者超過參數expire_logs_days參數設置不觸發全binlog掃描,如果是中途打開GTID重啟任然需要掃描多個binlog因為需要找到Gtid event。
從案例中我們得知是中途開啟的Gtid,但是留下了很多未開啟Gtid的binlog,從第六部分源碼bool MYSQL_BIN_LOG::init_gtid_sets()函數的分析,我們知道刪除binlog后也會觸發正向查找來獲取gtid_purged(Gtid_state.lost_gtids)。當讀取到第一個binlog的時候雖然獲取到了PREVIOUS GTID EVENT但是沒有GTID EVENT,而simple_recovery=flase所以需要繼續查找下一個文件,直到找到同時包含PREVIOUS GTID EVENT和GTID EVENT的 那個binlog才會停止,那么顯然這種情況下那些Gtid關閉的時候生成的binlog將會全部掃描一遍,如果量大那么代價將是巨大的。
而案例中每半個小時會觸發一次binlog切換,因為觸發超過expire_logs_days參數設置導致binlog進行刪除,觸發了大量的binlog掃描。
顯然有了前面的基礎這個案例很容易分析。
這個案例非常好模擬。我打算直接使用strace查看。因為不是每位朋友都能方便使用GDB調試。
使用測試版本社區版本5.7.17:
+---------------+-----------+ | Log_name | File_size | +---------------+-----------+ | binlog.000027 | 198 | | binlog.000028 | 198 | | binlog.000029 | 198 | | binlog.000030 | 198 | | binlog.000031 | 198 | | binlog.000032 | 198 | | binlog.000033 | 198 | | binlog.000034 | 198 | | binlog.000035 | 198 | | binlog.000036 | 198 | | binlog.000037 | 198 | | binlog.000038 | 198 | | binlog.000039 | 198 | | binlog.000040 | 198 | | binlog.000041 | 198 | | binlog.000042 | 198 | | binlog.000043 | 154 | +---------------+-----------+ mysql> show variables like '%gtid%'; +----------------------------------+-----------+ | Variable_name | Value | +----------------------------------+-----------+ | binlog_gtid_simple_recovery | OFF | | enforce_gtid_consistency | ON | | gtid_executed_compression_period | 1000 | | gtid_mode | OFF | | gtid_next | AUTOMATIC | | gtid_owned | | | gtid_purged | | | session_track_gtids | OFF | +----------------------------------+-----------+ 8 rows in set (0.02 sec) mysql> show variables like '%expir%'; +--------------------------------+-------+ | Variable_name | Value | +--------------------------------+-------+ | disconnect_on_expired_password | ON | | expire_logs_days | 1 | +--------------------------------+-------+ 2 rows in set (0.06 sec)
然后我修改了系統時間同時Mysql開啟Gtid
[root@test1 ~]# date -s '2017-12-13 10:10:10' Wed Dec 13 10:10:10 CST 2017 mysql> set global gtid_mode=1; Query OK, 0 rows affected (0.02 sec) mysql> set global gtid_mode=2; Query OK, 0 rows affected (0.01 sec) mysql> set global gtid_mode=3; Query OK, 0 rows affected (0.02 sec) mysql> show variables like '%gtid_mode%'; +---------------+-------+ | Variable_name | Value | +---------------+-------+ | gtid_mode | ON | +---------------+-------+ 1 row in set (0.02 sec)
到一步我們已經達到了觸發的標準,只要手動觸發一次flush binary logs,讓binlog刷新就會看到。當然線上是binlog滿了做的切換。
這個時候開始做strace,并且做flush tables,我們觀察到
mysql> flush binary logs; Query OK, 0 rows affected (0.30 sec) strace: [pid 6551] 10:17:15.936738 read(62, "/mysql/mysql5.7.17/binlog.000027"..., 528) = 528 <0.000039> [pid 6551] 10:17:15.936834 stat("/mysql/mysql5.7.17/binlog.000027", {st_mode=S_IFREG|0640, st_size=198, ...}) = 0 <0.000025> [pid 6551] 10:17:15.936925 lseek(3, 0, SEEK_SET) = 0 <0.000017> [pid 6551] 10:17:15.936983 read(3, "/mysql/mysql5.7.17/binlog.000043"..., 165) = 165 <0.000018> [pid 6551] 10:17:15.937076 lstat("/mysql", {st_mode=S_IFDIR|0755, st_size=4096, ...}) = 0 <0.000020> [pid 6551] 10:17:15.937144 lstat("/mysql/mysql5.7.17", {st_mode=S_IFDIR|0755, st_size=4096, ...}) = 0 <0.000586> [pid 6551] 10:17:15.937819 unlink("/mysql/mysql5.7.17/binlog.000027") = 0 <0.000109> [pid 6551] 10:17:15.938009 stat("/mysql/mysql5.7.17/binlog.000028", {st_mode=S_IFREG|0640, st_size=198, ...}) = 0 <0.000021> [pid 6551] 10:17:15.938119 lstat("/mysql", {st_mode=S_IFDIR|0755, st_size=4096, ...}) = 0 <0.000020> [pid 6551] 10:17:15.938228 lstat("/mysql/mysql5.7.17", {st_mode=S_IFDIR|0755, st_size=4096, ...}) = 0 <0.000021> [pid 6551] 10:17:15.938314 unlink("/mysql/mysql5.7.17/binlog.000028") = 0 <0.000073> ..... [pid 6551] 10:17:15.954677 lstat("/mysql/mysql5.7.17", {st_mode=S_IFDIR|0755, st_size=4096, ...}) = 0 <0.000019> [pid 6551] 10:17:15.954756 unlink("/mysql/mysql5.7.17/binlog.000041") = 0 <0.000099> [pid 6551] 10:17:15.954920 stat("/mysql/mysql5.7.17/binlog.000042", {st_mode=S_IFREG|0640, st_size=198, ...}) = 0 <0.000021> [pid 6551] 10:17:15.955022 lstat("/mysql", {st_mode=S_IFDIR|0755, st_size=4096, ...}) = 0 <0.000018> [pid 6551] 10:17:15.955087 lstat("/mysql/mysql5.7.17", {st_mode=S_IFDIR|0755, st_size=4096, ...}) = 0 <0.000018> [pid 6551] 10:17:15.955159 unlink("/mysql/mysql5.7.17/binlog.000042") = 0 <0.000130>
受限篇幅我這里刪除了一些。我們看到很多read/lseek系統調用正是讀取binlog的證據。
至此整個案例模擬完成。
前文已經描述過在5.7.6以上binlog_gtid_simple_recovery應該設置為true,這樣可以避免可能的大量的binlog的掃描。具體分析可以參考第七節和從第六部分源碼bool MYSQL_BIN_LOG::init_gtid_sets()函數的分析。
作者微信:
免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。