国产精品电影_久久视频免费_欧美日韩国产激情_成年人视频免费在线播放_日本久久亚洲电影_久久都是精品_66av99_九色精品美女在线_蜜臀a∨国产成人精品_冲田杏梨av在线_欧美精品在线一区二区三区_麻豆mv在线看

手把手教你使用 Pandas 讀取結構化數據

大數據 數據分析
Pandas是一個基于Numpy庫開發的更高級的結構化數據分析工具,提供了Series、DataFrame、Panel等數據結構,可以很方便地對序列、截面數據(二維表)、面板數據進行處理。

?[[442917]]?

本文轉載自微信公眾號「大數據DT」,作者張秋劍 張浩 等。轉載本文請聯系大數據DT公眾號。

  • DataFrame是我們常見的二維數據表,包含多個變量(列)和樣本(行),通常被稱為數據框。
  • Series是一個一維結構的序列,包含指定的索引信息,可以被視作DataFrame中的一列或一行。其操作方法與DataFrame十分相似。
  • Panel是包含序列及截面信息的三維結構,通常被稱為面板數據。

我們可通過限定時間ID和樣本ID獲得對應的Series和DataFrame。

由于這些對象的常用操作方法十分相似,因此本文主要使用DataFrame進行演示。

1 讀取文件

Pandas庫提供了便捷讀取本地結構化數據的方法。這里主要以csv數據為例,read_csv函數可以讀取csv數據,代碼如下:

import pandas as pd
csv = pd.read_csv('data/sample.csv')
csv
id name   scores
0 1 小明 78.0
1 2 小紅 87.0
2 3 小白 99.0
3 4 小青 99999.0
4 5 小蘭 NaN

按照慣例,Pandas會以pd為別名,以read_csv函數讀取指定路徑下的文件,然后返回一個DataFrame對象。如果在命令行中打印DataFrame對象,可讀性可能會略差一些;如果在Jupyter Notebook中打印的話,可讀性會大幅提升。

打印出來的DataFrame包含索引(第一列),列名(第一行)及數據內容(除第一行和第一列之外的部分)。

此外,read_csv函數有很多參數可以設置,如下所示。

  • filepath_or_buffer csv文件的路徑
  • sep = ',' 分隔符,默認為逗號
  • header = 0 int類型,0代表第一行為列名,若設定為None將使用數值列名
  • names = [] list,重新定義列名,默認為None
  • usecols = [] list,定義讀取的列,設定后將縮短讀取數據的時間,并減小內存消耗,適合讀取大量數據,默認為None
  • dtype = {} dict,定義讀取列的數據類型,默認為None
  • nrows = None int類型,指定讀取數據的前n行,默認為None
  • na_values = ... str類型,list或dict,指定缺失值的填充值
  • na_filter = True bool類型,自動發現數據中的缺失值,默認值為True,若確定數據無缺失,可以設定值為False,以提高數據載入的速度
  • chunksize = 1000 int類型,分塊讀取,當數據量較大時,可以設定分塊讀取的行數,默認為None
  • encoding = 'utf-8' str類型,數據的編碼,Python3默認編碼為UTF-8,Python2默認編碼為ASCII
  • Pandas除了可以直接讀取csv、excel、json、html等文件生成的DataFrame,也可以在列表、元組、字典等數據結構中創建DataFrame。

2 讀取指定行和指定列

使用參數usecol和nrows讀取指定的列和前n行,這樣可以加快數據讀取速度。讀取原數據的兩列、兩行示例如下。

csv = pd.read_csv('data/sample.csv',\
usecols=['id','name'],\
nrows=2) #讀取'id'和'name'兩列,僅讀取前兩行
csv
id name
0 1 小明
1 2 小紅

3 分塊讀取

參數chunksize可以指定分塊讀取的行數,并返回一個可迭代對象。這里,big.csv是一個4500行、4列的csv數據,設定chunksize=900,分5塊讀取數據,每塊900行,4個變量,如下所示:

csvs = pd.read_csv('data/big.csv',chunksize=900)
for i in csvs:
print (i.shape)
(900, 4)
(900, 4)
(900, 4)
(900, 4)
(900, 4)

可以使用pd.concat函數讀取全部數據:

csvs = pd.read_csv('data/big.csv',chunksize=900)
dat = pd.concat(csvs,ignore_index=True)
dat.shape
(4500, 4)

4 將不合理數據讀取為缺失值

在數據sample.csv中,“小青”的分數中有的取值為99999,這里令其讀取為缺失值,操作如下:

csv = pd.read_csv('data/sample.csv',
na_values='99999')
csv
id name  scores
0 1 小明 78.0
1 2 小紅 87.0
2 3 小白 99.0
3 4 小青 NaN
4 5 小蘭 NaN

5 以指定編碼方式讀取

讀取數據時,亂碼情況經常出現。這里需要先弄清楚原始數據的編碼形式,再以指定的編碼形式讀取,例如sample.csv編碼為UTF-8,這里以指定編碼(參數encoding)方式讀取。

csv = pd.read_csv('data/sample.csv',
encoding='utf-8')
csv
id name   scores
0 1 小明 78.0
1 2 小紅 87.0
2 3 小白 99.0
3 4 小青 99999.0
4 5 小蘭 NaN

關于作者:張秋劍,就職于騰訊云金融拓展中心,從事微信財富營銷管理、數據中臺、AI應用等解決方案拓展工作,研究方向包括數字化轉型、創新實踐等。

張浩,曾任騰訊云金融首席架構師和星環科技金融行業技術總監,主要從事大數據、人工智能、云計算、區塊鏈、聯邦學習等相關技術研發與產品設計,具有豐富的企業架構設計、企業數字化戰略轉型運營與業務咨詢經驗。

周大川,就職于某中央金融企業金融科技研發中心,主要從事企業級數據平臺開發、核心業務平臺建設、AI賦能金融科技創新等工作,具有豐富的新一代金融業務系統建設經驗。

常國珍,曾任畢馬威咨詢大數據總監,具有近20年數據挖掘、精益數據治理、數字化運營咨詢經驗,是金融信用風險、反欺詐和反洗錢算法領域的專家。


本文摘編自《金融商業數據分析:基于Python和SAS》,經出版方授權發布。(ISBN:9787111695837)


責任編輯:武曉燕 來源: 大數據DT
相關推薦

2022-04-01 20:29:26

Pandas數據存儲

2021-07-14 09:00:00

JavaFX開發應用

2025-05-07 00:31:30

2022-12-07 08:42:35

2021-02-06 14:55:05

大數據pandas數據分析

2021-08-09 13:31:25

PythonExcel代碼

2021-08-02 07:35:19

Nacos配置中心namespace

2021-08-02 23:15:20

Pandas數據采集

2011-01-10 14:41:26

2011-05-03 15:59:00

黑盒打印機

2021-09-30 18:27:38

數據倉庫ETL

2021-01-19 09:06:21

MysqlDjango數據庫

2023-04-26 12:46:43

DockerSpringKubernetes

2022-01-08 20:04:20

攔截系統調用

2022-07-27 08:16:22

搜索引擎Lucene

2022-03-14 14:47:21

HarmonyOS操作系統鴻蒙

2021-03-12 10:01:24

JavaScript 前端表單驗證

2020-05-15 08:07:33

JWT登錄單點

2022-07-22 12:45:39

GNU

2022-10-30 10:31:42

i2ccpuftrace
點贊
收藏

51CTO技術棧公眾號

免费网站成人| 四虎成人精品一区二区免费网站| 日本aⅴ亚洲精品中文乱码| 一本色道久久综合狠狠躁篇怎么玩 | 日韩中文首页| 中文在线资源观看视频网站免费不卡| 在线免费激情视频| 99精品视频一区二区| 国产一区二区黄色| 色老板在线视频一区二区| 亚洲精品一区在线观看| 免费在线看污| 国产性色一区二区| 中文字幕av日韩精品| 亚洲最新色图| 日本免费一区二区三区视频观看| 亚洲第一影院| 日韩一区二区免费高清| 在线观看av每日更新免费| 国产欧美一区二区精品性色超碰| 一区二区欧美日韩| 国产一区二区高清| 91在线中文字幕| 亚洲精品aaaaa| 欧美人与性动交a欧美精品| 国产色播av在线| 欧美日韩国产bt| 午夜cr在线观看高清在线视频完整版| 国产欧美日韩精品在线| 永久免费网站视频在线观看| 国内精品久久久久久久影视蜜臀 | 国产精品毛片| 国产精品久久久久久久久免费看| 四虎地址8848精品| 亚洲女同精品视频| а√天堂中文资源在线bt| 欧美一区二区三区四区五区| 久久电影视频| 欧美性jizz18性欧美| 一级毛片免费视频| 亚洲综合色在线| 激情视频免费观看在线| 亚洲综合av网| 中国动漫在线观看完整版免费| 亚洲欧美怡红院| 激情综合在线观看| 久久婷婷国产综合精品青草| 日本精品久久久久久久久久| 精品一区在线看| 男女激烈动态图| 国产真实乱偷精品视频免| 97超碰人人爱| 国产成人午夜精品影院观看视频 | 老色鬼在线视频| 亚洲第一精品夜夜躁人人爽| 亚洲区欧洲区| 精品欧美一区二区三区精品久久| www.在线视频| 亚洲欧美日韩久久久久久| 日韩欧美少妇| 久久99精品久久久久久青青91| 国产一区二区| 欧美亚洲成人精品| 99久久.com| 好看的日韩精品视频在线| 日韩中文字幕一区二区三区| 91看片淫黄大片91| 日本一区二区综合亚洲| 成人观看视频| 日韩欧美在线一区| 女子免费在线观看视频www| 亚洲精品视频久久| 中文字幕亚洲在线观看| 国产精品免费看久久久香蕉| 日韩一区二区免费看| 国产精品夜夜夜爽张柏芝| 2021国产精品久久精品| 玖玖在线免费视频| 欧美日本在线播放| 97精品国产99久久久久久免费| 69精品小视频| 在线视频精品| 日本www在线视频| 亚洲一卡二卡三卡四卡 | 91麻豆福利精品推荐| 18av.com视频| 欧美日韩卡一卡二| 台湾佬成人网| 日本久久精品视频| 日日噜噜夜夜狠狠视频欧美人| 国产伦精品一区二区三区四区视频_| 亚洲日本一区二区| 综合久久2019| 久久久免费观看| 亚洲毛片在线| www..com日韩| 日韩欧美在线中文字幕| 麻豆免费在线| 国产成人精彩在线视频九色| 日韩av一区二| 黄色免费看网站| 精品第一国产综合精品aⅴ| 欧美在线关看| 亚洲一区影院| 午夜欧美2019年伦理| 欧美大片高清| 亚洲最大福利视频| 91视视频在线直接观看在线看网页在线看 | 一区二区成人在线观看| √8天堂资源地址中文在线| 2023亚洲男人天堂| 喷白浆一区二区| 美女视频黄a视频全免费观看| 欧美视频日韩视频| 蜜桃av一区二区三区| av女优在线| 欧美年轻男男videosbes| 波多野结衣在线观看一区二区三区| 中文字幕日韩在线播放| 欧美理论视频| 日韩一级性生活片| 91高清在线观看| 99香蕉久久| 五月天男人天堂| 欧美视频不卡中文| 97成人在线| 91嫩草国产丨精品入口麻豆| 欧美日韩国产影院| av在线成人| 亚洲人成网站在线播放2019| 欧美性黄网官网| 成人直播在线观看| 中文字幕日韩精品无码内射| 在线中文字幕一区| 女厕嘘嘘一区二区在线播放 | 成人观看网站a| 亚洲国产另类久久精品| 91嫩草亚洲精品| 中文字幕第36页| 亚洲精品日韩丝袜精品| 麻豆久久精品| 国产天堂在线| 国产乱肥老妇国产一区二 | 日本在线观看a| 日韩精品在线免费播放| 1024日韩| 欧美成熟毛茸茸| 国产精品大陆在线观看| 国产精品人成在线观看免费| 国产91在线播放精品| 亚洲午夜精品久久| 欧美一区二区三区性视频| 亚洲激情视频| 91sp网站在线观看入口| 国产精品一区二区av| 一本大道久久a久久精品综合| 精品久久电影| 男人午夜天堂| 国产精品黄色av| 亚洲一区二区精品3399| 久久av超碰| www.aqdy爱情电影网| 97久久精品在线| 亚洲精品视频在线| 精品国产欧美日韩| 在线看你懂得| 国产精品免费看一区二区三区| 91福利在线导航| 99精品国产一区二区青青牛奶| 免费福利在线观看| 国产成人精品日本亚洲11 | av在线第一页| 国产精品一区二区av| 欧美精品一二三| 久久精品卡一| 天堂√中文最新版在线| www.男人天堂网| 欧美精品制服第一页| 亚洲欧美电影一区二区| 色琪琪久久se色| 久久经典视频| 日本精品一区| 亚洲欧洲在线免费| 91麻豆视频网站| 精品一区欧美| 国产精品秘入口| 一区二区三区四区在线视频| 日韩一区二区福利| 综合久久国产九一剧情麻豆| 日韩毛片视频| av电影高清在线观看| 日韩不卡一二区| 久久成人免费视频| 亚洲色欲色欲www在线观看| 99久久99久久精品国产片桃花| 免费黄色在线网站| 亚洲不卡中文字幕无码| 国产精品国产三级国产aⅴ9色| 在线观看日韩电影| 国产一本一道久久香蕉|