国产精品电影_久久视频免费_欧美日韩国产激情_成年人视频免费在线播放_日本久久亚洲电影_久久都是精品_66av99_九色精品美女在线_蜜臀a∨国产成人精品_冲田杏梨av在线_欧美精品在线一区二区三区_麻豆mv在线看

常用的時間序列分析方法總結和代碼示例

大數據 數據分析
時間序列是最流行的數據類型之一。視頻,圖像,像素,信號,任何有時間成分的東西都可以轉化為時間序列。

時間序列是最流行的數據類型之一。視頻,圖像,像素,信號,任何有時間成分的東西都可以轉化為時間序列。

在本文中將在分析時間序列時使用的常見的處理方法。這些方法可以幫助你獲得有關數據本身的見解,為建模做好準備并且可以得出一些初步結論。

我們將分析一個氣象時間序列。利用逐時ERA5 Land[1]研究2023年西伯利亞東南部點的2 m氣溫、總降水量、地表凈太陽輻射和地表壓力。

首先我們導入相關的庫:

import pandas as pd
 import seaborn as sns
 import numpy as np
 
 import matplotlib.pyplot as plt
 import xarray as xr
 
 import statsmodels.api as sm
 from statsmodels.graphics.tsaplots import plot_acf, plot_pacf
 from scipy import stats

matplotlib是可以設置不同的風格的,這里我們使用 opinionated和 ambivalent來進行風格的設置

from ambivalent import STYLES
 import opinionated
 plt.style.use(STYLES['ambivalent'])
 plt.style.use("dark_background")

折線圖

要觀察一個時間序列,最簡單的方法就是折線圖。為了處理地理空間多維數組,我們將使用xarray庫。

data = xr.open_dataset('Medium_data.nc')
 data

現在我們需要針對所選位置對數據進行切片,并將其轉換為pandas DF,并創建一個線形圖:

df = data.sel(latitude=52.53, lnotallow=101.63, method='pad').to_pandas().drop(['latitude', 'longitude'], axis=1)
 fig, ax = plt.subplots(ncols = 2, nrows = 2, figsize=(16,9))
 df['t2m'].plot(ax=ax[0,0])
 ax[0,0].set_title('Air Temperature')
 df['ssr'].plot(ax=ax[0,1])
 ax[0,1].set_title('Surface Net Solar Radiation')
 df['sp'].plot(ax=ax[1,0])
 ax[1,0].set_title('Surface Pressure')
 df['tp'].plot(ax=ax[1,1])
 ax[1,1].set_title('Total Precipitation')
 plt.tight_layout()
 plt.show()

從線形圖中可以清楚地看出,所有四個時間序列都有不同的特征,下面讓我們使用數學工具來研究它們。

分解與平穩性

任何時間序列都有三個重要屬性需要考慮:

1、趨勢是時間序列中平穩的長期變化;

2、季節性指的是一個時間序列的平均值有規律的周期性變化;

3、噪聲(殘差),它是均值為零的信號的隨機成分。

為了分別得到這些成分,可以使用經典分解(加性或乘法)。該操作是通過應用卷積濾波器產生的,因此每個時間序列分量被定義為

或者

這里的y為時間序列的值,S為季節分量,T為趨勢分量,n為噪聲。

為了進行分解,除了選擇分解類之外,還需要設置一個季節周期(例如,p=1表示年度數據,p=4表示季度數據,p=12表示月度數據等)。

前面提到的經典分解是一種非常幼稚和簡單的方法。它具有明顯的局限性,如線性,無法捕捉動態季節性和難以處理時間序列中的非平穩性,但是就本文作為演示,這種方法是可以的。

為了進行經典的分解,我們將使用statmodels庫中的seasonal_decomposition函數,周期等于24,因為我們處理的是每小時的數據:

vars = {'t2m': 'Air Temperature', 'tp': 'Total Precipitation', 'sp': 'Surface Pressure', 'ssr': 'Surface Net Solar Radiation'}
 for var in df.columns:
  result = sm.tsa.seasonal_decompose(df[var], model='additive', period = 24)
  results_df = pd.DataFrame({'trend': result.trend, 'seasonal': result.seasonal, 'resid': result.resid, 'observed': result.observed})
  fig, ax = plt.subplots(ncols = 2, nrows = 2,figsize=(16,9))
  ax[0,0].plot(df.index, results_df.trend)
  ax[0,0].set_title('Trend')
  ax[0,0].set_ylabel('Value')
 
  ax[0,1].plot(df.index, results_df.seasonal)
  ax[0,1].set_title('Seasonal')
 
  ax[1,0].plot(df.index, results_df.resid)
  ax[1,0].set_title('Residual')
  ax[1,0].set_ylabel('Value')
  ax[1,0].set_xlabel('time')
 
  ax[1,1].plot(df.index, results_df.observed)
  ax[1,1].set_title('Observed')
  ax[1,1].set_xlabel('time')
 
  opinionated.set_title_and_suptitle(vars[var], f"Dickey-Fuller test: {round(sm.tsa.stattools.adfuller(df[var])[1],5)}", position_title=[0.45,1],
                                      position_sub_title=[0.95, 1])
  plt.tight_layout()
  plt.savefig(f'Seasonal_{var}.png')
  plt.show()

圖片

你可以看到,對于所有的變量,季節性因素看起來都很混亂。這是因為我們分析的是每小時的數據,這些季節變化是在一天內觀察到的,并沒有直接的關聯。所以我們可以嘗試將數據重新采樣到每日間隔,并在一天的時間段內進行分解。

df_d = df.resample('1d').mean()

請注意到圖表右上角的Dickey-Fuller(ADF) 。這是一個平穩性測試,使用的是adfuller函數。對于時間序列,平穩性意味著時間序列的屬性不隨時間變化。我們這里說的屬性是指:方差、季節性、趨勢和自相關性。

Dickey-Fuller (ADF)檢驗的流程是:提出時間序列是非平穩的零假設。然后我們選擇顯著性水平α,通常為5%。α是錯誤地拒絕零假設的概率,而零假設實際上是正確的。所以在我們的例子中,α=5%有5%的風險得出時間序列是平穩的,而實際上不是。

測試結果會給出一個p值。如果小于0.05,我們可以拒絕零假設??梢钥吹?,根據ADF檢驗所有4個變量都是平穩的。

一般情況下要應用時間序列預測模型,如ARIMA等,平穩性是必須的。這也是我們選擇氣象數據的原因,因為它們在大多數情況下是平穩的,所以才會出現在不同的時間序列相關的學習材料中進行分析。

分布

在得出所有時間序列都是平穩的結論之后,讓我們來看看它們是如何分布的。我們將使用著名的seaborn庫及其函數pairplot,該函數允許使用歷史和kde創建信息豐富的圖。

ax = sns.pairplot(df, diag_kind='kde')
 ax.map_upper(sns.histplot, bins=20)
 ax.map_lower(sns.kdeplot, levels=5, color='.1')
 plt.show()

讓我們考慮t2m(1行1列)的示例。在分析核密度估計(kde)圖時,很明顯這個變量的分布是多模態的,這意味著它由2個或更多的“鐘形”組成。在本文的后續階段中,我們將嘗試將變量轉換為類似于正態分布的形式。

第一列和第一行中的其他圖是相同的,但它們的可視化方式不同。這些是散點圖,可以確定兩個變量是如何相關的。所以一個點的顏色越深,或者離中心圓越近,這個區域內點的密度就越高。

Box-Cox轉換

由于我們已經發現氣溫時間序列是平穩的,但不是正態分布,所以可以嘗試使用Box-Cox變換來修復它。這里使用scipy包及其函數boxcox。

df_d['t2m_box'], _ = stats.boxcox(df_d.t2m)
 fig, ax = plt.subplots(nrows=1, ncols=2, figsize=(15,7))
 sns.histplot(df_d.t2m_box, kde=True, ax=ax[0])
 sns.histplot(df_d.t2m, kde=True, ax=ax[1])

圖的左邊部分是經過BoxCox變換后的時間序列分布,可以看到,它還遠遠不能被稱為“正態”分布。但是如果我們把它和右邊的比較,我們可以說的確更接近于“正態”。

我們還可以做的另一件事是確保執行的轉換是有用的,可以創建一個概率圖:繪制理論分布的分位數(在我們的情況下是正態)與經驗數據的樣本(即我們考慮的時間序列)。越靠近白線的點越好。

fig = plt.figure()
 
 ax1 = fig.add_subplot(211)
 prob = stats.probplot(df_d.t2m, dist=stats.norm, plot=ax1)
 ax1.get_lines()[1].set_color('w')
 ax1.get_lines()[0].set_color('#8dd3c7')
 ax1.set_title('Probplot against normal distribution')
 
 ax2 = fig.add_subplot(212)
 prob = stats.probplot(df_d.t2m_box, dist=stats.norm, plot=ax2)
 ax2.get_lines()[1].set_color('w')
 ax2.get_lines()[0].set_color('#8dd3c7')
 ax2.set_title('Probplot after Box-Cox transformation')
 plt.tight_layout()fig = plt.figure()
 
 ax1 = fig.add_subplot(211)
 prob = stats.probplot(df_d.t2m, dist=stats.norm, plot=ax1)
 ax1.set_title('Probplot against normal distribution')
 
 ax2 = fig.add_subplot(212)
 prob = stats.probplot(df_d.t2m_box, dist=stats.norm, plot=ax2)
 ax2.set_title('Probplot after Box-Cox transformation')
 plt.tight_layout()

這個概率圖還有一個更常見的名字QQ圖

另外需要說明的是,如果打算使用轉換后的時間序列進行ML建模,不要忘記應用反向BoxCox轉換,這樣才能的到最終的正確結果。

自相關

時間序列分析的最后一步是自相關。自相關函數(ACF)估計時間序列和滯后版本之間的相關性?;蛘邠Q句話說,時間序列的特定值如何與不同時間間隔內的其他先驗值相關聯。繪制部分自相關函數(PACF)也可能有所幫助,它與自相關相同,但刪除了較短滯后的相關性。它估計某個時間戳內值之間的相關性,但控制其他值的影響。

for var in df.columns[:-1]:
  fig, (ax1, ax2) = plt.subplots(2,1,figsize=(10,8))
  plot_acf(df_d.t2m, ax = ax1)
  plot_pacf(df_d.t2m, ax = ax2)
  opinionated.set_title_and_suptitle(vars[var], '',position_title=[0.38,1],
                                      position_sub_title=[0.95, 1])
  plt.tight_layout()
  plt.show()

可以看到在地表壓力時間序列中有一個非常強的部分自相關,有1天的滯后。然后明顯減弱,3天后幾乎消失。這樣的分析可以幫助我們更好地理解正在處理的數據的性質,從而得出更有意義的結論。

總結

以上就是在處理時間序列時進行探索性數據分析時常用的方法,通過上面這些方法可以很好的了解到時間序列的信息,為我們后面的建模提供數據的支持。

責任編輯:華軒 來源: DeepHub IMBA
相關推薦

2023-04-09 15:57:39

時間序列分析Python開發

2023-03-30 15:12:47

2024-02-21 14:32:09

2023-01-24 17:14:59

2024-01-30 01:12:37

自然語言時間序列預測Pytorch

2025-03-28 10:10:30

機器學習PythonMSET

2024-04-22 13:42:32

大型語言模型人工智能

2023-09-20 11:42:52

2022-11-14 14:36:59

數據集Python自相關

2023-01-05 16:36:55

2010-04-21 13:31:11

Oracle時間

2017-07-10 09:21:17

Oracle構造序列

2024-06-17 16:02:58

2024-06-03 11:05:11

2023-12-25 15:51:07

探索性數據分析數據可視化

2009-12-17 11:27:31

Ruby時間方法

2009-09-09 13:31:15

C# TextBox

2016-10-08 22:33:54

相關分析數據

2011-08-18 16:42:04

Oracle數據庫維護SQL代碼示例

2009-12-01 14:33:06

PHP生成html文件
點贊
收藏

51CTO技術棧公眾號

久久av中文| 亚洲精品国产一区二区三区四区在线| 成人激情久久| 国产成人影院| av在线播放成人| 亚洲午夜久久久久久久久电影院 | 亚洲国产一成人久久精品| 国产一区二区精品久久99| 亚洲国产天堂久久综合| 日本大片免费看| 不卡中文字幕| 国产一区二区日韩| 无人视频在线观看免费| 国产三级精品三级在线专区| 欧美视频免费在线| 一区二区三区四区五区精品| 九色porny丨入口在线| 人人香蕉久久| 亚洲国产精品va在线观看黑人| 欧美一区二区三区啪啪| 国产精品自产拍在线观看中文| 在线综合视频网站| 亚洲人成网www| 国产精品福利片| 97超碰在线公开在线看免费| 色屁屁一区二区| 最新精品视频在线| 亚洲成人免费视频| 在线理论视频| 日韩欧美第一页| 日本中文字幕一区二区有码在线| 福利微拍一区二区| 91欧美在线视频| 欧美成人三级在线| 亚洲精品动漫| 久久国产天堂福利天堂| 国产精品45p| 国产在线精品播放| 日韩香蕉视频| 伊人精品久久久久7777| 97精品视频在线观看自产线路二 | 日韩av黄色| 97久久精品国产| 91精品啪在线观看国产18| 精品国产aⅴ麻豆| 九九久久精品视频| 男人亚洲天堂网| 亚洲三级电影全部在线观看高清| 一级在线观看| 精品粉嫩超白一线天av| 国产精品亚洲四区在线观看| 思思99re6国产在线播放| 欧美日韩一区二区国产| 视频在线观看一区二区三区| 亚洲自拍偷拍一区二区三区| 99久久综合狠狠综合久久止 | 亚洲国产美女精品久久久久∴| 99蜜月精品久久91| 欧美在线视频观看| 在线亚洲免费| 男人添女人下部视频免费| 国产精品久久久久久亚洲伦| 成人免费视频| 日韩在线观看免费全集电视剧网站| 网友自拍一区| 亚洲精品第一区二区三区| 欧美激情一区二区三区全黄| 国产香蕉在线| 久久精品国产成人精品| 欧美99在线视频观看| 精品嫩模一区二区三区| 亚洲蜜臀av乱码久久精品| 成人看av片| 欧美一区二区三区免费观看 | 国产社区精品视频| 国产精品18久久久久久首页狼| 亚洲一区中文| 精品久久久久久无码国产| 欧美日韩国产一二三| 日本午夜免费一区二区| 成人在线观看91| 久久精品一区二区三区四区| 成人在线二区| 久久久女女女女999久久| 久久久青草婷婷精品综合日韩| 中文字幕2019第三页| 亚洲美女av电影| 欧美不卡在线| 日本wwwwww| 一本色道久久88精品综合| 伊人久久综合| 成人a视频在线| 久久久国产一区二区三区| 翔田千里一区二区| 超碰在线中文| 欧美激情奇米色| 国产精品一区二区男女羞羞无遮挡| 亚洲mv在线| 97国产一区二区精品久久呦| 国产精品夜夜嗨| aa在线视频| 国产精品成人一区二区三区 | 亚洲国产美女| 日本精品二区| www.26天天久久天堂| 日韩成人中文字幕在线观看| 欧美6一10sex性hd| 日韩一区二区在线播放| 成人羞羞国产免费网站| 国产精品996| 日本a在线天堂| 自拍av在线| 日本久久精品视频| 日韩欧美aⅴ综合网站发布| 91tv官网精品成人亚洲| 波多野结衣亚洲| 国产午夜精品一区| 国产视频一区三区| 国产在线无码精品| 丁香婷婷深情五月亚洲| 国产卡一卡二在线| 日本不卡一区二区三区| 性色av一区二区| 欧美精品v日韩精品v国产精品| 亚洲精品视频一区二区三区| 99精品在线免费视频| 在线播放三级网站| 香蕉成人在线| 日韩精品一级中文字幕精品视频免费观看 | 制服.丝袜.亚洲.中文.综合| 免费成人三级| 性xxxx欧美老肥妇牲乱| 成人午夜伦理影院| 精品国产不卡| 五月亚洲婷婷| 欧美大片aaaa| 日本午夜精品久久久久| 欧美18一12sex性处hd| 狠狠色噜噜狠狠狠狠色吗综合| 亚洲精品免费一区二区三区| 久久精品日韩| 色综合咪咪久久| 动漫一区二区三区| 一本色道久久综合亚洲二区三区 | av今日在线| 亚洲视频在线二区| xx欧美撒尿嘘撒尿xx| 国产在线一二三| 日韩精品免费一区二区在线观看 | 日韩欧美a级成人黄色| 91短视频在线观看| 亚洲性生活视频| 蜜桃一区二区三区在线观看| 992tv在线| 这里精品视频免费| 在线亚洲伦理| 国模雨婷捆绑高清在线| 另类视频在线观看+1080p| 日韩av最新在线观看| 中文字幕五月欧美| 国产精品久久777777| 欧美日韩久久一区| 成人高清在线观看| 免费毛片在线| 老司机亚洲精品一区二区| 欧美videossex另类| 色999五月色| 一二三四区精品视频| 91精品观看| 国产视频福利在线| 欧美精品一区二区三区在线四季| 欧美性一二三区| 男女性色大片免费观看一区二区 | 日韩激情电影| 国产一区二区高清视频| 色综合中文字幕| 天天操天天干天天玩| 欧美精品久久久久久久久老牛影院| 亚洲精品男同| 韩国三级成人在线| 91麻豆国产福利在线观看宅福利| 亚洲欧美丝袜| 日韩极品精品视频免费观看| 成人欧美一区二区三区| 中国av一区| 亚洲国产天堂| 碰碰在线视频| av高清资源| 精品一区二区三区自拍图片区| 777xxx欧美| 国产精品影音先锋| 亚洲午夜极品| 欧美日韩一本| 美女一区二区在线观看| 欧美在线极品| 欧美视频精品| 日本一区二区三区视频在线| 日本欧美韩国国产| 久久综合亚州| 久久久99久久|