溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務條款》

怎么在mysql數據庫中刪除重復的數據

發布時間:2021-03-09 15:58:50 來源:億速云 閱讀:407 作者:Leah 欄目:開發技術

本篇文章為大家展示了怎么在mysql數據庫中刪除重復的數據,內容簡明扼要并且容易理解,絕對能使你眼前一亮,通過這篇文章的詳細介紹希望你能有所收獲。

1.問題引入

假設一個場景,一張用戶表,包含3個字段。id,identity_id,name?,F在身份證號identity_id和姓名name有很多重復的數據,需要刪除只保留一條有效數據。

2.模擬環境

1.登入mysql數據庫,創建一個單獨的測試數據庫mysql_exercise

create database mysql_exercise charset utf8;

2.創建用戶表users

create table users(
					id int auto_increment primary key,
					identity_id varchar(20),
					name varchar(20) not null
     );

怎么在mysql數據庫中刪除重復的數據

3.插入測試數據

insert into users values(0,'620616199409206512','張三'),
						(0,'620616199409206512','張三'),
						(0,'62062619930920651X','李四'),
						(0,'62062619930920651X','李四'),
						(0,'620622199101206211','王五'),
						(0,'620622199101206211','王五'),
						(0,'322235199909116233','趙六');

可以多執行幾次,生成較多重復數據。

怎么在mysql數據庫中刪除重復的數據

4.解決思路

(1)根據身份證號和name進行分組;

(2)取出分組后的最大id(或最小id);

(3)刪除除最大(或最?。﹊d以外的其他字段;

5.第一次嘗試(失敗!!!)

delete from users where id not in (select max(id) from users group by identity_id,name);

報錯:

1093 (HY000): You can't specify target table 'users' for update in FROM clause

怎么在mysql數據庫中刪除重復的數據

因為在MYSQL里,不能先select一個表的記錄,再按此條件進行更新和刪除同一個表的記錄。

解決辦法是,將select得到的結果,再通過中間表select一遍,這樣就規避了錯誤,

這個問題只出現于mysql,mssql和oracle不會出現此問題。

所以我們可以先將括號里面的sql語句先拿出來,先查到最大(或最?。﹊d。

select max_id from (select max(id) as max_id from users group by identity_id,name);

接著,又報錯了?。?!

ERROR 1248 (42000): Every derived table must have its own alias

意思是說:提示說每一個衍生出來的表,必須要有自己的別名!

執行子查詢的時候,外層查詢會將內層的查詢當做一張表來處理,所以我們需要給內層的查詢加上別名

怎么在mysql數據庫中刪除重復的數據

繼續更正:

給查詢到的最大(或最小id)結果當做一張新的表,起別名t,并查詢t.mix_id。

select t.max_id from (select max(id) as max_id from users group by identity_id,name) as t;

可以成功查到最大(或最?。﹊d了,如下圖:

怎么在mysql數據庫中刪除重復的數據

6.第二次嘗試(成功?。。。?/strong>

delete from users where id not in (
		select t.max_id from 
		(select max(id) as max_id from users group by identity_id,name) as t
		);

執行結果:

怎么在mysql數據庫中刪除重復的數據

成功將重復的數據刪除,只保留了最后一次增加的記錄。同理也可以保留第一次添加的記錄(即刪除每個分組里面除最小id以外的其他條記錄)

3.知識拓展一:更新數據

其他場景應用:要將用戶表user_info里名字(name)為空字符串("")的用戶的狀態(status)改成"0"

update user_info set status='0' where user_id in (select user_id from user_info where name='')

同樣報了如下錯誤:

You can't specify target table ‘user_info' for update in FROM clause

因為在MYSQL里,不能先select一個表的記錄,再按此條件進行更新和刪除同一個表的記錄,解決辦法是,將select得到的結果,再通過中間表select一遍,這樣就規避了錯誤。
以下兩種均可?。?!

update user_info set status='0' where user_id in 
	 (select user_id from (select user_id from user_info where name = '') t1);

下面這種也可,細微差別,別名可帶as可不帶,t1.user_id 直接和內層的user_id對應也可以。

update user_info set status='0' where user_id in 
	(select t1.user_id from (select user_id from user_info where name='') as t1);

3.1 分步驟解析

(1)將以下查詢結果作為中間表:

select user_id from user_info where name='';

(2)再查詢一遍中間表作為結果集:

select user_id from (select user_id from user_info where name='') as t;

(3)更新數據

update user_info set status='0' where user_id in 
	(select user_id from (select user_id from user_info where name='') as t1);

4.拓展練習:刪除重復數據

編寫一個 SQL 查詢,來刪除 Person 表中所有重復的電子郵箱,重復的郵箱里只保留 Id 最小 的那個。

+----+------------------+
| Id | Email      |
+----+------------------+
| 1 | john@example.com |
| 2 | bob@example.com |
| 3 | john@example.com |
+----+------------------+

Id 是這個表的主鍵。

例如,在運行你的查詢語句之后,上面的 Person 表應返回以下幾行:

+----+------------------+
| Id | Email      |
+----+------------------+
| 1 | john@example.com |
| 2 | bob@example.com |
+----+------------------+

解答一:

delete from Person where Id not in (
	select t.min_id from (
		select min(Id) as min_id from Person group by Email
		) as t
	);

解答二:

delete p1 from 
	Person as p1,Person as p2 
		where p1.Email=p2.Email and p1.Id > p2.Id;

上述內容就是怎么在mysql數據庫中刪除重復的數據,你們學到知識或技能了嗎?如果還想學到更多技能或者豐富自己的知識儲備,歡迎關注億速云行業資訊頻道。

向AI問一下細節

免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。

AI

亚洲午夜精品一区二区_中文无码日韩欧免_久久香蕉精品视频_欧美主播一区二区三区美女