&

SQL中的三種去重方式：DISTINCT，GROUP BY與ROW_NUMBER()

當(dāng)前位置：點(diǎn)晴教程→知識(shí)管理交流 →『技術(shù)文檔交流』

admin

2024年2月19日 15:16 本文熱度 747

在日常使用SQL統(tǒng)計(jì)數(shù)據(jù)過程中，我們往往會(huì)遇到重復(fù)數(shù)據(jù)的情況，如果不進(jìn)行去重處理了話，那么我們統(tǒng)計(jì)的數(shù)據(jù)偏差會(huì)比較大。那使用SQL如何對(duì)數(shù)據(jù)進(jìn)行去重呢？

今天介紹三種去重方式。

1.使用DISTINCT關(guān)鍵字

這是SQL中最常用的去重方式。DISTINCT 關(guān)鍵字用于返回唯一不同的值。在一個(gè)SELECT語句中，你可以使用 DISTINCT 關(guān)鍵字。例如：

SELECT DISTINCT column_name FROM table_name;

這條語句會(huì)返回table_name中所有不同的column_name值。

2.使用GROUP BY語句

GROUP BY語句用于結(jié)合聚合函數(shù)，根據(jù)一個(gè)或多個(gè)列對(duì)結(jié)果集進(jìn)行分組。在GROUP BY查詢中，如果對(duì)所有列都進(jìn)行分組，那么它的結(jié)果就等同于使用了DISTINCT關(guān)鍵字。例如：

SELECT column_name FROM table_name GROUP BY column_name;

這個(gè)查詢會(huì)返回table_name中所有不同的column_name值。

3.使用 ROW_NUMBER() 函數(shù)

ROW_NUMBER() 是一個(gè)窗口函數(shù)，為每個(gè)分組中的每行分配唯一的行號(hào)，它可以用來刪除重復(fù)行。例如：

WITH CTE AS (SELECT column_name, ROW_NUMBER() OVER(PARTITION BY column_name ORDER BY ( SELECT 0)) RN FROM table_name) SELECT column_name FROM CTE WHERE RN = 1;

這個(gè)查詢將返回table_name中所有不同的column_name值。

在此查詢中，使用 ROW_NUMBER() OVER(PARTITION BY column_name ORDER BY (SELECT 0)) 可以為每個(gè) column_name 分組中的每一行分配一個(gè)唯一的行號(hào)，但這個(gè)行號(hào)的分配并不依賴于任何特定的排序。這樣，你可以選擇每個(gè) column_name 分組中的任意一行，因此 WHERE RN = 1 可以選擇每個(gè)分組的第一行。

如果你不關(guān)心選擇哪一行，或者如果表中的所有行對(duì)于每個(gè) column_name 都是唯一的，那么這樣做是可以的。如果你希望基于某種特定的排序來選擇行（例如，選擇每個(gè)分組中最新或最舊的行），那么你需要使用一個(gè)真正的排序表達(dá)式，而不是 SELECT 0。

比如說，表table_name中有兩列，一列是column_name，一列是create_time，因?yàn)槊總€(gè)column_name下可能有重復(fù)數(shù)據(jù)，且create_time可能不一樣，我們?nèi)ブ氐囊?guī)則是取最近一條column_name的數(shù)據(jù)，那么去重的SQL如下，將(SELECT 0) 替換成create_time desc：

WITH CTE AS (SELECT column_name, ROW_NUMBER() OVER (PARTITION BY column_name ORDER BY create_time DESC) RN FROM table_name) SELECT column_name FROM CTE WHERE RN = 1;

簡(jiǎn)單總結(jié)下今天分享的內(nèi)容。

今天主要分享了SQL中的3種去重方式：使用 DISTINCT 關(guān)鍵字，GROUP BY語句，和 ROW_NUMBER() 函數(shù)。

在實(shí)際使用時(shí)，可以根據(jù)具體的需求和數(shù)據(jù)情況選擇合適的方法。希望本文對(duì)您有所幫助。

該文章在 2024/2/19 15:16:16 編輯過

關(guān)鍵字查詢

方式

sql

去重

相關(guān)文章

正在查詢...

點(diǎn)晴ERP是一款針對(duì)中小制造業(yè)的專業(yè)生產(chǎn)管理軟件系統(tǒng),系統(tǒng)成熟度和易用性得到了國內(nèi)大量中小企業(yè)的青睞。

點(diǎn)晴PMS碼頭管理系統(tǒng)主要針對(duì)港口碼頭集裝箱與散貨日常運(yùn)作、調(diào)度、堆場(chǎng)、車隊(duì)、財(cái)務(wù)費(fèi)用、相關(guān)報(bào)表等業(yè)務(wù)管理，結(jié)合碼頭的業(yè)務(wù)特點(diǎn)，圍繞調(diào)度、堆場(chǎng)作業(yè)而開發(fā)的。集技術(shù)的先進(jìn)性、管理的有效性于一體，是物流碼頭及其他港口類企業(yè)的高效ERP管理信息系統(tǒng)。

點(diǎn)晴WMS倉儲(chǔ)管理系統(tǒng)提供了貨物產(chǎn)品管理,銷售管理,采購管理,倉儲(chǔ)管理,倉庫管理,保質(zhì)期管理,貨位管理,庫位管理,生產(chǎn)管理,WMS管理系統(tǒng),標(biāo)簽打印,條形碼,二維碼管理,批號(hào)管理軟件。

點(diǎn)晴免費(fèi)OA是一款軟件和通用服務(wù)都免費(fèi)，不限功能、不限時(shí)間、不限用戶的免費(fèi)OA協(xié)同辦公管理系統(tǒng)。