天道不一定酬所有勤
但是,天道只酬勤

天津11选5遗漏值:為什么阿里巴巴禁止使用 count(列名)或 count(常量)來替代 count(*)

開發十年,就只剩下這套架構體系了??!

天津11选5蛋托玩法 www.ijudhr.com.cn 數據庫查詢相信很多人都不陌生,所有經常有人調侃程序員就是CRUD專員,這所謂的CRUD指的就是數據庫的增刪改查。

在數據庫的增刪改查操作中,使用最頻繁的就是查詢操作。而在所有查詢操作中,統計數量操作更是經常被用到。

關于數據庫中行數統計,無論是MySQL還是Oracle,都有一個函數可以使用,那就是COUNT。

認識COUNT

關于COUNT函數,在MySQL官網中有詳細介紹:

?

簡單翻譯一下:

1、COUNT(expr) ,返回SELECT語句檢索的行中expr的值不為NULL的數量。結果是一個BIGINT值。

2、如果查詢結果沒有命中任何記錄,則返回0

3、但是,值得注意的是,COUNT(*) 的統計結果中,會包含值為NULL的行數。

即以下表記錄

create table #bla(id int,id2 int)
insert #bla values(null,null)
insert #bla values(1,null)
insert #bla values(null,1)
insert #bla values(1,null)
insert #bla values(null,1)
insert #bla values(1,null)
insert #bla values(null,null)

使用語句count(*),count(id),count(id2)查詢結果如下:

select count(*),count(id),count(id2)
from #bla
results 7 3 2

除了COUNT(id)COUNT(*)以外,還可以使用COUNT(常量)(如COUNT(1))來統計行數,那么這三條SQL語句有什么區別呢?到底哪種效率更高呢?為什么《阿里巴巴Java開發手冊》中強制要求不讓使用 COUNT(列名)COUNT(常量)來替代 COUNT(*)呢?

?

COUNT(列名)、COUNT(常量)和COUNT(*)之間的區別

前面我們提到過COUNT(expr)用于做行數統計,統計的是expr不為NULL的行數,那么COUNT(列名)、 COUNT(常量)COUNT(*)這三種語法中,expr分別是列名、 常量*。

那么列名、 常量*這三個條件中,常量 是一個固定值,肯定不為NULL。*可以理解為查詢整行,所以肯定也不為NULL,那么就只有列名的查詢結果有可能是NULL了。

所以, COUNT(常量)COUNT(*)表示的是直接查詢符合條件的數據庫表的行數。而COUNT(列名)表示的是查詢符合條件的列的值不為NULL的行數。

除了查詢得到結果集有區別之外,COUNT(*)相比COUNT(常量)COUNT(列名)來講,COUNT(*)是SQL92定義的標準統計行數的語法,因為他是標準語法,所以MySQL數據庫對他進行過很多優化。

SQL92,是數據庫的一個ANSI/ISO標準。它定義了一種語言(SQL)以及數據庫的行為(事務、隔離級別等)。

COUNT(*)的優化

前面提到了COUNT(*)是SQL92定義的標準統計行數的語法,所以MySQL數據庫對他進行過很多優化。那么,具體都做過哪些事情呢?

這里的介紹要區分不同的執行引擎。MySQL中比較常用的執行引擎就是InnoDB和MyISAM。

MyISAM和InnoDB有很多區別,其中有一個關鍵的區別和我們接下來要介紹的COUNT(*)有關,那就是MyISAM不支持事務,MyISAM中的鎖是表級鎖;而InnoDB支持事務,并且支持行級鎖。

因為MyISAM的鎖是表級鎖,所以同一張表上面的操作需要串行進行,所以,MyISAM做了一個簡單的優化,那就是它可以把表的總行數單獨記錄下來,如果從一張表中使用COUNT(*)進行查詢的時候,可以直接返回這個記錄下來的數值就可以了,當然,前提是不能有where條件。

MyISAM之所以可以把表中的總行數記錄下來供COUNT(*)查詢使用,那是因為MyISAM數據庫是表級鎖,不會有并發的數據庫行數修改,所以查詢得到的行數是準確的。

但是,對于InnoDB來說,就不能做這種緩存操作了,因為InnoDB支持事務,其中大部分操作都是行級鎖,所以可能表的行數可能會被并發修改,那么緩存記錄下來的總行數就不準確了。

但是,InnoDB還是針對COUNT(*)語句做了些優化的。

在InnoDB中,使用COUNT(*)查詢行數的時候,不可避免的要進行掃表了,那么,就可以在掃表過程中下功夫來優化效率了。

從MySQL 8.0.13開始,針對InnoDB的SELECT COUNT(*) FROM tbl_name語句,確實在掃表的過程中做了一些優化。前提是查詢語句中不包含WHERE或GROUP BY等條件。

我們知道,COUNT(*)的目的只是為了統計總行數,所以,他根本不關心自己查到的具體值,所以,他如果能夠在掃表的過程中,選擇一個成本較低的索引進行的話,那就可以大大節省時間。

我們知道,InnoDB中索引分為聚簇索引(主鍵索引)和非聚簇索引(非主鍵索引),聚簇索引的葉子節點中保存的是整行記錄,而非聚簇索引的葉子節點中保存的是該行記錄的主鍵的值。

所以,相比之下,非聚簇索引要比聚簇索引小很多,所以MySQL會優先選擇最小的非聚簇索引來掃表。所以,當我們建表的時候,除了主鍵索引以外,創建一個非主鍵索引還是有必要的。

至此,我們介紹完了MySQL數據庫對于COUNT(*)的優化,這些優化的前提都是查詢語句中不包含WHERE以及GROUP BY條件。

COUNT(*)和COUNT(1)

介紹完了COUNT(*),接下來看看COUNT(1),對于,這二者到底有沒有區別,網上的說法眾說紛紜。

有的說COUNT(*)執行時會轉換成COUNT(1),所以COUNT(1)少了轉換步驟,所以更快。

還有的說,因為MySQL針對COUNT(*)做了特殊優化,所以COUNT(*)更快。

那么,到底哪種說法是對的呢?看下MySQL官方文檔是怎么說的:

InnoDB handles SELECT COUNT(*) and SELECT COUNT(1) operations in the same way. There is no performance difference.

畫重點:same way , no performance difference。所以,對于COUNT(1)和COUNT(*),MySQL的優化是完全一樣的,根本不存在誰比誰快!

那既然COUNT(*)COUNT(1)一樣,建議用哪個呢?

建議使用COUNT(*)!因為這個是SQL92定義的標準統計行數的語法,而且本文只是基于MySQL做了分析,關于Oracle中的這個問題,也是眾說紛紜的呢。

COUNT(字段)

最后,就是我們一直還沒提到的COUNT(字段),他的查詢就比較簡單粗暴了,就是進行全表掃描,然后判斷指定字段的值是不是為NULL,不為NULL則累加。

相比COUNT(*),COUNT(字段)多了一個步驟就是判斷所查詢的字段是否為NULL,所以他的性能要比COUNT(*)慢。

總結

本文介紹了COUNT函數的用法,主要用于統計表行數。主要用法有COUNT(*)、COUNT(字段)COUNT(1)。

因為COUNT(*)是SQL92定義的標準統計行數的語法,所以MySQL對他進行了很多優化,MyISAM中會直接把表的總行數單獨記錄下來供COUNT(*)查詢,而InnoDB則會在掃表的時候選擇最小的索引來降低成本。當然,這些優化的前提都是沒有進行where和group的條件查詢。

在InnoDB中COUNT(*)COUNT(1)實現上沒有區別,而且效率一樣,但是COUNT(字段)需要進行字段的非NULL判斷,所以效率會低一些。

因為COUNT(*)是SQL92定義的標準統計行數的語法,并且效率低,所以請直接使用COUNT(*)查詢表的行數!

參考資料: https://dev.mysql.com/doc/refman/8.0/en/group-by-functions.html#function_count 《極客時間——MySQL實戰45講》

(全文完) 歡迎關注『Java之道』微信公眾號
贊(3)
如未加特殊說明,此網站文章均為原創,轉載必須注明出處。天津11选5蛋托玩法 » 為什么阿里巴巴禁止使用 count(列名)或 count(常量)來替代 count(*)
分享到: 更多 (0)

評論 1

  • 昵稱 (必填)
  • 郵箱 (必填)
  • 網址
  1. #1

    最后一段是效率高吧

    isysc3周前 (11-11)回復

HollisChuang's Blog

聯系我關于我