pandasの便利メモ・1
pandasの細かなノウハウ、テクニック、便利な機能があります。 自分用メモ
pd.to_datetimeで日時を揃える。
日時文字列を高速にパース。C Parser → 正規表現 → tateutil
format引数でフォーマットを指定して柔軟なパースも可能。
欠損値の補完
resample
データのサンプリング周期を変える。
ダウンサンプリングは移動平均的に荒く。
df.resample('resample_time').mean()
(移動平均はdf.rolling(3).mean()
など)
アップサンプリングは細かく。
df.resample('resample_time').interpolate()
補完
上記のアップサンプリングは補完の一種。データ欠損のところを埋めている。
df.interpolate()
plotは便利
df.plot()
で時系列データの周期を自動で調整してプロットしてくれる。
こちらに詳しい。