国产精品电影_久久视频免费_欧美日韩国产激情_成年人视频免费在线播放_日本久久亚洲电影_久久都是精品_66av99_九色精品美女在线_蜜臀a∨国产成人精品_冲田杏梨av在线_欧美精品在线一区二区三区_麻豆mv在线看

一文教你如何利用 Python 進行數據清洗

開發 后端
本文介紹了如何使用 Python 進行數據清洗,通過一個實戰案例,我們詳細展示了如何處理電商用戶數據。

數據清洗是數據分析中非常重要的一步,它可以幫助我們處理不完整、不準確或不一致的數據。今天,我們就來聊聊如何用 Python 進行數據清洗。Python 有強大的庫如 Pandas 和 NumPy,它們提供了豐富的工具來幫助我們高效地完成數據清洗任務。

導入必要的庫

首先,我們需要導入一些常用的庫,比如 Pandas 和 NumPy。Pandas 是一個強大的數據處理庫,NumPy 則主要用于數值計算。

import pandas as pd
import numpy as np

讀取數據

假設我們有一個 CSV 文件 data.csv,我們可以使用 Pandas 的 read_csv 函數來讀取數據。

# 讀取 CSV 文件
df = pd.read_csv('data.csv')

# 查看前 5 行數據
print(df.head())

檢查數據基本信息

在開始清洗數據之前,我們需要了解數據的基本信息,包括數據的形狀、列名、數據類型等。

# 查看數據形狀
print(f"數據形狀: {df.shape}")

# 查看列名
print(f"列名: {df.columns.tolist()}")

# 查看數據類型
print(f"數據類型: \n{df.dtypes}")

處理缺失值

缺失值是數據清洗中常見的問題。我們可以使用 isnull() 和 notnull() 函數來檢查缺失值,并使用 fillna() 或 dropna() 來處理它們。

# 檢查缺失值
print(df.isnull().sum())

# 填充缺失值
df['age'].fillna(df['age'].mean(), inplace=True)  # 用平均值填充年齡列的缺失值
df['income'].fillna(0, inplace=True)  # 用 0 填充收入列的缺失值

# 刪除含有缺失值的行
df.dropna(subset=['address'], inplace=True)  # 刪除地址列中含有缺失值的行

處理重復值

重復值可能會導致分析結果失真。我們可以使用 duplicated() 和 drop_duplicates() 函數來檢測和刪除重復值。

# 檢查重復值
print(df.duplicated().sum())

# 刪除重復值
df.drop_duplicates(inplace=True)

數據類型轉換

有時候,數據的類型可能不符合我們的需求。我們可以使用 astype() 函數來轉換數據類型。

# 將 age 列轉換為整數類型
df['age'] = df['age'].astype(int)

# 將 income 列轉換為浮點數類型
df['income'] = df['income'].astype(float)

處理異常值

異常值可能會對分析結果產生重大影響。我們可以使用統計方法(如 Z-score)或箱線圖來檢測和處理異常值。

# 使用 Z-score 方法檢測異常值
from scipy import stats
z_scores = np.abs(stats.zscore(df['income']))
df = df[z_scores < 3]  # 保留 Z-score 小于 3 的數據

# 使用箱線圖方法檢測異常值
Q1 = df['income'].quantile(0.25)
Q3 = df['income'].quantile(0.75)
IQR = Q3 - Q1
lower_bound = Q1 - 1.5 * IQR
upper_bound = Q3 + 1.5 * IQR
df = df[(df['income'] >= lower_bound) & (df['income'] <= upper_bound)]

標準化和歸一化

在某些情況下,我們可能需要對數據進行標準化或歸一化處理,以便更好地進行模型訓練。

# 標準化
from sklearn.preprocessing import StandardScaler
scaler = StandardScaler()
df[['age', 'income']] = scaler.fit_transform(df[['age', 'income']])

# 歸一化
from sklearn.preprocessing import MinMaxScaler
scaler = MinMaxScaler()
df[['age', 'income']] = scaler.fit_transform(df[['age', 'income']])

保存清洗后的數據

最后,我們將清洗后的數據保存到一個新的 CSV 文件中,以便后續使用。

# 保存清洗后的數據
df.to_csv('cleaned_data.csv', index=False)

實戰案例:處理電商用戶數據

假設我們有一個電商用戶的 CSV 文件 users.csv,包含用戶的年齡、收入、地址等信息。我們需要對其進行數據清洗,以確保數據的質量。

步驟 1:讀取數據

# 讀取 CSV 文件
df = pd.read_csv('users.csv')

# 查看前 5 行數據
print(df.head())

步驟 2:檢查數據基本信息

# 查看數據形狀
print(f"數據形狀: {df.shape}")

# 查看列名
print(f"列名: {df.columns.tolist()}")

# 查看數據類型
print(f"數據類型: \n{df.dtypes}")

步驟 3:處理缺失值

# 檢查缺失值
print(df.isnull().sum())

# 填充缺失值
df['age'].fillna(df['age'].mean(), inplace=True)  # 用平均值填充年齡列的缺失值
df['income'].fillna(0, inplace=True)  # 用 0 填充收入列的缺失值

# 刪除含有缺失值的行
df.dropna(subset=['address'], inplace=True)  # 刪除地址列中含有缺失值的行

步驟 4:處理重復值

# 檢查重復值
print(df.duplicated().sum())

# 刪除重復值
df.drop_duplicates(inplace=True)

步驟 5:數據類型轉換

# 將 age 列轉換為整數類型
df['age'] = df['age'].astype(int)

# 將 income 列轉換為浮點數類型
df['income'] = df['income'].astype(float)

步驟 6:處理異常值

# 使用 Z-score 方法檢測異常值
z_scores = np.abs(stats.zscore(df['income']))
df = df[z_scores < 3]  # 保留 Z-score 小于 3 的數據

# 使用箱線圖方法檢測異常值
Q1 = df['income'].quantile(0.25)
Q3 = df['income'].quantile(0.75)
IQR = Q3 - Q1
lower_bound = Q1 - 1.5 * IQR
upper_bound = Q3 + 1.5 * IQR
df = df[(df['income'] >= lower_bound) & (df['income'] <= upper_bound)]

步驟 7:保存清洗后的數據

# 保存清洗后的數據
df.to_csv('cleaned_users.csv', index=False)

總結

本文介紹了如何使用 Python 進行數據清洗,包括導入必要的庫、讀取數據、檢查數據基本信息、處理缺失值、處理重復值、數據類型轉換、處理異常值、標準化和歸一化,以及保存清洗后的數據。通過一個實戰案例,我們詳細展示了如何處理電商用戶數據。

責任編輯:趙寧寧 來源: 小白PythonAI編程
相關推薦

2024-11-20 16:12:31

Python圖像處理計算機視覺

2024-11-20 16:42:03

Python科學計算

2024-11-18 17:16:18

Python性能優化編程

2023-05-05 19:29:41

2021-12-07 06:02:15

Redis Docker運維

2022-09-05 07:32:46

mock數據Stream

2020-03-23 10:06:05

工具代碼開發

2022-02-20 09:56:28

TCPIP網絡協議

2023-12-27 07:40:43

HTTP服務器負載均衡

2023-07-31 21:56:54

哨兵系統redis

2021-01-15 13:18:39

數據模型領域模型代碼

2019-07-23 07:30:16

2023-05-11 08:26:56

2024-10-28 12:57:36

Pandas數據清洗

2020-12-22 10:02:53

ZabbixMySQL數據庫

2025-05-30 01:00:00

RAG大模型流程

2021-08-10 05:49:10

網絡協議C語言Linux操作

2023-05-05 19:16:22

Python數據清洗

2025-06-20 08:00:00

硬路由軟路由網絡

2022-03-28 14:08:02

Python數據清洗數據集
點贊
收藏

51CTO技術棧公眾號

欧美变态另类刺激| 精品久久sese| 国产视频一区不卡| 久久久久久久激情视频| 97天天综合网| 色偷偷噜噜噜亚洲男人| 欧美精品一卡| 国产盗摄精品一区二区酒店| 亚洲精品一区国产| 在线观看欧美日韩国产| 二区三区在线观看| 欧美高清在线精品一区| 内射国产内射夫妻免费频道| 久久亚洲私人国产精品va | 日韩极品少妇| 欧美国产乱视频| 国产一区二区高清在线| 一本一道久久a久久精品逆3p | 精品福利网址导航| 国产成人亚洲综合| 手机在线观看av网站| 亚洲无亚洲人成网站77777| 久久久精品麻豆| 麻豆导航在线观看| 午夜精品久久久久久久久久| ww国产内射精品后入国产| 国产成人一区二区精品非洲| 精品欧美一区二区久久久伦| 综合av在线| 亚洲精品日产aⅴ| 国产精品1区| 成人精品福利视频| 午夜日韩av| 秋霞在线一区二区| 国产剧情一区在线| 亚洲淫片在线视频| 精品一区二区三区免费看| 亚洲激情中文1区| 免费yellow网站| 国产成人精品一区| 国产视频一区二区三区在线观看 | 久久99成人| 91精品久久久久久蜜臀| 日韩在线观看www| 老司机午夜在线视频| 777xxx欧美| 亚洲精品tv| 欧美激情一区二区三区成人 | 在线观看欧美日韩国产| 女人丝袜激情亚洲| 日本黑人久久| 国产亚洲综合视频| www.欧美精品一二三区| 精品三级久久久久久久电影聊斋| 国产精品片aa在线观看| 亚洲视频一区二区免费在线观看 | 在线观看91视频| 性国产高清在线观看| 这里只有精品99re| 国产精品亚洲综合在线观看| 国产一区二区三区免费观看在线 | 小视频免费在线观看| 日韩中文字幕网址| 国产精品精品| 国产成人精品综合久久久| 日本女优爱爱视频| 午夜精品免费在线观看| 日韩精品卡一| 欧美高跟鞋交xxxxhd| 国产精品红桃| av女优在线播放| 亚洲第一男人天堂| 欧美在线亚洲| 色久视频在线观看| 久久夜精品香蕉| 国产中文一区二区三区| 在线免费黄色| 国产精品久久久久久久av大片| 狠狠色丁香婷婷综合久久片| 天堂av中文在线资源库| 欧美怡春院一区二区三区| 91小视频在线| 黄色漫画在线免费看| 91夜夜揉人人捏人人添红杏| 亚洲欧美日韩国产综合| 久久男人av| 国产情侣av自拍| 国模私拍一区二区三区| 亚洲欧美日韩专区| avtt天堂资源网站| 日韩电影免费观看在线观看| ****av在线网毛片| 亚洲欧美在线磁力| 国产午夜精品一区二区三区欧美| 视频一区视频二区视频三区高 | 精品女同一区二区| 88国产精品视频一区二区三区| av最新地址| 欧美不卡一区二区三区四区| 国产成人高清精品免费5388| 成人午夜一级二级三级| 床上的激情91.| 福利小视频在线观看| 亚洲无av在线中文字幕| 日韩精品福利一区二区三区| 99久久精品免费看国产四区| 美腿丝袜亚洲色图| 中文字幕在线导航| 成人av资源在线| 每日在线更新av| 亚洲男人天堂2019| 日韩夫妻性生活xx| 在线免费观看视频黄| 午夜视频一区二区三区| 国产一级精品aaaaa看| 色av吧综合网| 成人性生交大片免费看96| 最近中文字幕在线| av五月天在线| www.1024| 日韩国产精品一区| 亚洲精品大片www| 成人h动漫精品| 欧美午夜一区| 精品免费一区二区| 国产一区日韩一区| 日本在线观看www| 96sao精品视频在线观看| 色综合色综合色综合 | 怡红院亚洲色图| 国产视频亚洲视频| 福利一区福利二区| 少妇精品视频一区二区免费看| caoporen人人| 一本二本三本亚洲码| 国产精品乡下勾搭老头1| 在线观看中文字幕| 少妇av一区二区三区无码| 日本电影一区二区三区| 国产亚洲欧美一区二区| 99r国产精品视频| 成人资源av| 国产经品一区二区| 国产美女精品久久久| 国产高清精品一区| 久久99精品久久久久久三级| 国产精品亚洲аv天堂网| 91久久精品日日躁夜夜躁国产| 国产成人精品自拍| 欧美激情一区二区三区不卡 | 日韩欧美国产免费播放| 国内精品伊人久久久久av一坑| 国产成人亚洲综合91| 国产精品入口麻豆原神| 久久伦理在线| yiren22综合网成人| 色播久久人人爽人人爽人人片视av| 亚洲人体大胆视频| 日韩影片中文字幕| 成人欧美亚洲| 苍井空浴缸大战猛男120分钟| 国产精品美女www| 在线综合+亚洲+欧美中文字幕| 亚洲欧美日韩国产另类专区| 中文字幕欧美日本乱码一线二线| 天天色综合成人网| 日韩欧美www| 精品国产31久久久久久| 国产欧美91| 视频三区在线观看| 全部孕妇毛片丰满孕妇孕交| 一区二区视频在线播放| 5g国产欧美日韩视频| 国产河南妇女毛片精品久久久| 九九热hot精品视频在线播放| 91精品视频一区二区| 在线观看网站免费入口在线观看国内| 二区中文字幕| 尤物免费看在线视频| 欧美成年人在线观看| 热re99久久精品国99热蜜月| 国产一区二区三区四区五区加勒比| 日韩欧美一区二区三区久久婷婷| 久久久久久www| 精品无人乱码| 国产精品欧美大片| 国内一区二区视频| 一区二区三区在线观看网站| 亚洲欧美一区二区激情| 国产日本欧美一区二区三区| www.国产在线播放| 日本天堂影院在线视频| 天天躁日日躁成人字幕aⅴ| 久久亚洲国产精品一区二区| 99久久久国产精品免费蜜臀| 欧美久久久久久久久久| 91精品国产综合久久久久久蜜臀| 成人免费在线观看视频网站| 日韩成人18| 国产成人精品亚洲午夜麻豆|