關於 count(*) / count(0) / count(1) / count(行列) 效能問題請益

sql count

mike51620 2023-04-17 14:42:26 ‧ 3026 瀏覽

分享至

請教版上各問大大
關於
count(*) / count(0) / count(1) / count(行列) 效能問題請益

小弟平常多數使用 count(*) 進行資料統計

有點不太清楚，以上count 的用法差異效能如何 ?

想請大神指點迷經

目前所使用的版本如下
Microsoft SQL Server Management Studio 14.0.17289.0

柯柯 iT邦新手 1 級 ‧ 2023-04-17 17:15:58 檢舉

https://dotblogs.com.tw/jeff-yeh/2011/01/12/20767

登入發表討論

熱門推薦

{{ item.channelVendor }} | {{ item.webinarstarted }} |

直播中

3 個回答

一級屠豬士

iT邦大師 1 級 ‧ 2023-04-18 00:24:09

最佳解答

https://learn.microsoft.com/zh-tw/sql/t-sql/functions/count-transact-sql?view=sql-server-ver16

https://dev.mysql.com/doc/refman/8.0/en/counting-rows.html

可以看到 count(*) 是特別用來計算number of rows的,優化器會特別處理.
而不是 * 就是展開,取所有欄位. 而是 count(*) 本身與 * 都有各自的處理方式.
所以以前會有人以為用了 count(*) 會展開,要使用 count(1) 來減少,
這是很久以前的看法了,也不盡然.
另外,要比對不同SQL的效能,要注意到 cache, 有時候第二道SQL效能本身並沒有比較好,
但是第一道先跑,資料進了cache,第二道就好像比較快. CPU時間=0,有沒有覺得驚喜.
至於怎樣清理cache,在此就不展開了.

Microsoft SQL Server Management Studio,這只是介面,不是DB. 
要先分清楚.

回應 6
分享
檢舉

看更多先前的回應...收起先前的回應...

海綿寶寶 iT邦大神 1 級 ‧ 2023-04-18 06:40:27 檢舉

海綿寶寶 iT邦大神 1 級 ‧ 2023-04-18 07:20:03 檢舉

Google 到這篇的寫法蠻有趣的
不知道小雨大看法如何
select 10 * count(*) from wsh_exceptions sample block (10)

一級屠豬士 iT邦大師 1 級 ‧ 2023-04-18 07:37:58 檢舉

Oracle 可以使用 Hint , 例如這裡有展示的 /*+ parallel */
或者這個取 sample(10) 這是10%, 然後乘10.
這招不是很好,因為有些資料庫在取 sample 時, 跟預期的數量會差很多,時常會有驚喜.我就不明說是哪一家的產品了.以免破壞了城裡面的祥和.
其實我以前有問過一次怎樣count大的table,不過大家沒什麼反應.
有些情境是不需要絕對精確.我說的大的table當然不會是某些人的
百萬筆balabala,很久沒看到他了.
改天再寫些例如使用布隆過濾器之類的分享.

obarisk iT邦研究生 1 級 ‧ 2023-04-18 09:04:38 檢舉

基本上還是跟 sql 優化器有關吧

海綿寶寶 iT邦大神 1 級 ‧ 2023-04-18 18:46:01 檢舉

因為有些資料庫在取 sample 時, 跟預期的數量會差很多,時常會有驚喜

這讓我聯想起在Google時有人回覆的答案是
我們應該思考為什麼要select count(x) from table 以及為什麼要討論這個問題

一級屠豬士 iT邦大師 1 級 ‧ 2023-04-19 07:47:57 檢舉

https://ithelp.ithome.com.tw/questions/10193112

以前的問答,可以參考一下.

登入發表回應

Ray

iT邦大神 1 級 ‧ 2023-04-17 14:49:33

ChatGPT 這麼說:

這幾個 SQL 指令的主要功能是用來計算符合條件的資料筆數，但它們的使用方式略有不同。

count(*)：會計算資料表中所有的資料筆數，包括重複的和 NULL 值。這個指令通常會比其他三個指令更有效率，因為它不需要對任何欄位進行運算。

count(0) 和 count(1)：這兩個指令會對指定的欄位進行運算，但它們都不是很有效率，因為它們只是在計算值為 0 或 1 的欄位數量而已。

count(行列)：這個指令會對指定的行列進行運算，它會計算指定的行列中所有不是 NULL 值的資料筆數。這個指令會比 count(0) 和 count(1) 更有效率，因為它只是在計算特定欄位中有值的資料筆數而已。

總體而言，count(*) 是最有效率的指令，因為它不需要對任何欄位進行運算，且通常也是最符合需求的指令。但是在特定情況下，使用其他的指令可能會更加合適，例如當只需要計算特定欄位的非 NULL 值的數量時，可以使用 count(行列)。

有待 SQL 大師解惑....

回應 5
分享
檢舉

看更多先前的回應...收起先前的回應...

純真的人 iT邦大師 1 級 ‧ 2023-04-17 18:08:44 檢舉

參考效能~
ChatGPT 說的是錯的~

count(*) = count(0) = count(1) > count(行列)

海綿寶寶 iT邦大神 1 級 ‧ 2023-04-17 22:05:56 檢舉

雷神大也加入chatGPT的愛用者行列了

㊣浩瀚星空㊣ iT邦大神 1 級 ‧ 2023-04-18 00:01:02 檢舉

其實現在我對 chatGPT 又愛又恨。
它有時候的確可以帶給我幫助。但有時候給的答案又很氣，完全抓不到重點。雖然有人說是可能我問不到位。

obarisk iT邦研究生 1 級 ‧ 2023-04-18 08:57:15 檢舉

大錯...

obarisk iT邦研究生 1 級 ‧ 2023-04-18 08:57:30 檢舉

chatgpt 看起來也不會 sql

指引他找一個 db 用 explain 看看

登入發表回應

㊣浩瀚星空㊣

iT邦大神 1 級 ‧ 2023-04-17 23:58:30

之前在MYSQL5的時候。曾經被高手唸過
count(欄位名)算是效率最好的。不過欄位特性也會影響效率。
基本上是主鍵的欄位名是最好。其次是帶索引的。

count(*)是效能比較不好的。

count(1)則聽說是再搭配有JOIN時。會比較差。沒搭配的話會比較好。
不過這個我是沒在用。

但聽說MYSQL8有針對這部份做優化過。我是還沒時間去驗証就是了。

我個人目前都是沒用JOIN的用欄位主鍵。有用JOIN的還是會用星號。
但自從用ORM就沒在理它用啥了。反正count()就出來了。

不過我映像中，ORM好像是用主鍵來COUNT。
不過畢竟ORM不太有JOIN。所以我想用主鍵也是理所當然的。

回應
分享
檢舉

登入發表回應

我要發表回答

立即登入回答

15th鐵人賽 16th鐵人賽 13th鐵人賽 14th鐵人賽 17th鐵人賽 12th鐵人賽 11th鐵人賽鐵人賽 2019鐵人賽 javascript 2018鐵人賽 python 2017鐵人賽 windows php c# linux windows server css react

IT邦幫忙