【4 weeks challenge – Python】Day 24 欠損値を含む行列を除去

daily_trial

こんにちは、しらすです。

24日目です。本日の習得スキルは「欠損値を含む行列を除去」です!

欠損値を含む行列を除去でできること

読み込んだデータの内、欠損値を含む行や列を指定して除去することができます。また、除去を複数回組み合わせることで柔軟に形を整形することができます。

使い方

import pandas as pd

csv_input = pd.read_csv("./day24/sample_pandas_normal_nan.csv")

#NAを含む列を除去
result1 = csv_input.dropna(how = 'any',axis=1)

#NAを含む行を除去
result2 = csv_input.dropna(how = 'any')

#先にAll NAの列を除去して、NAを含む行を除去
result3 = csv_input.dropna(how='all',axis=1).dropna(how='any',axis=0)

読み込むデータは以下です。

結果

おためし編

使い方の組み合わせを以下にまとめておきます。

result4 = csv_input.dropna()           #NAを一つでも含む行列を除去
result5 = csv_input.dropna(how = 'any')     #NAを一つでも含む行列を除去
result6 = csv_input.dropna(how = 'any',axis=1) #NAを一つでも含む列を除去
result7 = csv_input.dropna(how = 'all')     #全てがNAの行を除去
result8 = csv_input.dropna(how = 'all',axis=1) #全てがNAの列を除去

参考

pandasで欠損値NaNを除外(削除)・置換(穴埋め)・抽出 | note.nkmk.me
例えばCSVファイルをpandasで読み込んだとき、要素が空白だったりすると欠損値だとみなされNaN(Not a Number: 非数)で表される。 欠損値を除外(削除)するにはdropna()メソッド、欠損値を他の値に置換(穴埋め) ...

コメント