溫馨提示×

溫馨提示×

您好，登錄后才能下訂單哦！

密碼登錄×

忘記密碼？

登錄注冊×

獲取短信驗證碼

其他方式登錄

點擊登錄注冊即表示同意《億速云用戶服務條款》

用戶登錄×

賬戶密碼登錄

請使用微信掃描上方二維碼

使用幫助

請求超時！

請點擊重新獲取二維碼

MySQL怎么優化無索引的join

發布時間：2022-01-24 11:12:08 來源：億速云閱讀：254 作者：柒染欄目：開發技術

MySQL怎么優化無索引的join，很多新手對此不是很清楚，為了幫助大家解決這個難題，下面小編將為大家詳細講解，有這方面需求的人可以來學習下，希望你能有所收獲。

前言

MySQL Join 你用過嗎？你知道其中的原理嗎？

現在有張 user 表，這個 user 表很簡單，一個主鍵 id，也就是我們的用戶 id，還有個 name 字段，很明顯就是用戶的姓名。

MySQL怎么優化無索引的join

這時候還有一張 user_info 表，這個 user_info 表存的是用戶的一些其他信息，有 user_id 代表用戶的 id，還有個 account 代表用戶的存款。

MySQL怎么優化無索引的join

遍歷循環查詢

如果要查出所有用戶的姓名和存款，我們可以這樣查：

data = select * from user;
for (i=0;i<len(data);i++) {
  info = select account from user_info where user_id= data[i].user_id
}

這種方式最直觀，先通過 user 表拿到所有的用戶信息，然后根據連接鍵 user_id 去 user_info 表里查詢對應的 account，這樣就能得到想要的數據，但是這種方式幾個問題：

第一次全表掃描 user 表需要一次網絡通信，假設 user 表的數據量是n。
然后循環查詢 user_info 表，這里需要 n 次網絡通信

因此一共需要 n+1 次網絡通信，如果使用的是長連接，還能省去 3 次握手的時間，如果是短連接，整體的開銷會更大。

其次如果 user_id 沒有索引，那么整體更傷，假設 user_info 一共有 m 條數據，那么掃描的次數是怎么算的呢？

首先 user 表是全表掃，一共需要查詢 n 次。
由于 user_info 表的 user_id 沒有索引，那么每次查詢等于都是全表掃，總共需要 n*m 次。

因此這種查詢的方式一共需要掃描 n+n*m 次。當然一般不會出現 user_id 沒有索引的情況，在 user_id 有索引的時候，可以根據索引快速定位到我們的目標數據，并不需要全表掃描，因此總共需要掃描的行數為 n+m 次。

join 查詢

一般對于這種情況的查詢，我們會用 join 來做，于是我們的 sql 或許如下：

select a.name,b.account from user a left join user_info b on a.id=b.user_id

首先從網絡通信上來說，總體只需要一次通信，至于 MySQL 內部怎么處理數據，怎么把我們想要的數據返回回來是它內部的事。

其次我們來看看這種 join 方式的原理：

從 user 表掃描一條數據，然后去 user_info 表中匹配
在連接鍵 user_id 有索引的情況下，可以利用索引快速匹配
然后把 user 表中的 name 和 user_info 表中的 account 作為結果集的一部分返回回去
重復 1-3 步驟，直至 user 表掃描完畢，數據全部返回。

其中第三步驟，每次組合一條數據的時候，并不是立馬返回給客戶端，這樣效率太低，其實是有緩沖區的，也就是先把數據放在緩沖區中，等緩沖區滿了，一次性響應給客戶端可以大大提升效率。

從原理來看和上面的遍歷查詢差不多，主要不同的是，客戶端不需要和服務端多次通信。

join buffer (Block Nested Loop)

以上說的還是連接鍵有索引的，我們來看看連接鍵沒有索引的情況，這時候你通過 explain 來看 MySQL 的執行計劃，你會發現其中 user_info 的 extra 字段中會提示這個：

Using where; Using join buffer (Block Nested Loop)

這是什么意思呢？

因為沒有索引，所以每次去 user 表得到一條數據的時候，肯定是要再到 user_info 表做全表掃描，這個掃描的成本我們上面也提到了，就是 n+n*m=n(1+m)，因此這個時間復雜度是和 n 成正比的，這也是為什么我們一般推薦「小表驅動大表」的方式。

但是如果我們按照這個方式來做 join，未免開銷太大了，太耗時了，于是還是沿用老套路，也就是用個臨時存儲區，也就是 extra 中的 join buffer，有了這個 join buffer 后，首先會把 user 表的數據放進去，然后掃描 user_info 表，每掃描一行數據，就和 join buffer 中的每一行 user 數據匹配，如果匹配上了，也就是我們要的結果，因為 user_info 表有 m 條數據，因此需要判斷 n*m 次，咦！這個也沒減少呀，還是和上面的一樣。其實不一樣，這里的 m 條數據其實每次都是和內存中的 n 條數據做匹配的，并非磁盤，內存的速度不用多說。

聰明的讀者可能會發現，如果 user 表的數據很多，join buffer 能放得下嗎？

+------------------+--------+
| Variable_name    | Value  |
+------------------+--------+
| join_buffer_size | 262144 |
+------------------+--------+

buffer 默認是 256K，多的話確實放不下，放不下的話，怎么辦？其實也很簡單，分段放即可，當讀 user 表的數據占滿 buffer 的時候，就不放了，然后直接和 user_info 做匹配，邏輯還是同上，在 buffer 的數據處理完之后，就清空它，接著上次的位置繼續讀入數據，再次重復同樣的邏輯，直至數據讀完。

雖說連接鍵沒有索引的時候，會通過 join buffer 來優化速度，但是現實中，還是建議大家盡量要保證連接鍵有索引。

附：mysql join查詢沒有走索引的原因

把行數最小的作為主表，然后去join行數多的，這樣對于索引而言掃描的行數會少很多

在join之后On的條件，類型不同是無法走索引的，也就是說如果on A.id = B.id，雖然A表和B表的id都設置了索引，但是A表的id是Int，而B表的id是varchar，則無法走索引

字符編碼也會導致無法走索引。字符編碼常見的是utf8和utf8mb4，utf8mb4是可以兼容utf8的，也就是說如果A表是utf8mb4，B表是utf8，則on A.uinstanceid = B. uinstanceid是可以走索引的，但是如果把B表當作主表，讓B去join A on B.uinstanceid = A. uinstanceid則無法走索引

在我的項目里，就是上面的字符編碼問題導致的join后沒有走索引

改表和字段的字符編碼，統一成ut8mb4

ALTER TABLE visitor DEFAULT CHARSET utf8mb4;
ALTER TABLE visitor CHANGE visitor_id visitor_id varchar(100) CHARACTER SET utf8mb4 NOT NULL DEFAULT '';

看完上述內容是否對您有幫助呢？如果還想對相關知識有進一步的了解或閱讀更多相關文章，請關注億速云行業資訊頻道，感謝您對億速云的支持。

向AI問一下細節

推薦閱讀：

免責聲明：本站發布的內容（圖片、視頻和文字）以原創、轉載和分享為主，文章觀點不代表本網站立場，如果涉及侵權請聯系站長郵箱：is@yisu.com進行舉報，并提供相關證據，一經查實，將立刻刪除涉嫌侵權內容。

上一篇新聞：
Linux系統如何安裝PyQt5
下一篇新聞：
Python?numpy視圖與副本怎么理解

猜你喜歡

AI
助
手

產品服務

地區劃分

專題活動

幫助支持

關于我們

售后咨詢

7*24小時在線電話：400-100-2938

7*24小時在線 QQ：800811969

關注億速云

億速云公眾號

手機網站二維碼

亚洲午夜精品一区二区_中文无码日韩欧免_久久香蕉精品视频_欧美主播一区二区三区美女