【4 weeks challenge – Python】Day 21 DataFrameの列指定とスライスを同時に行う

daily_trial

こんにちは、しらすです。

21日目です。本日の習得スキルは「DataFrameの列指定とスライスを同時に行う」です!

DataFrameの列指定とスライスを同時に行うでできること

実はそもそもDataFrameはこの使い方ができます。そのため、今回は列指定とスライスの順番を入れ替えても同じように出力されるかを検証しました。

使い方

import pandas as pd

#pandasでcsvから読み込む
csv_input = pd.read_csv("./day21_house/train.csv")

#列指定とスライスを同時に行う
result1 = csv_input[:50]['SalePrice']  #先にスライス
result2 = csv_input['SalePrice'][:50]  #先に列指定

#結果の出力(result1, result2, 2つの差分の3列を出力)
output = 'result1,result2,diff\n'
for i in range(len(result1)):
    diff = abs(result1[i] - result2[i])
    output = output + str(result1[i]) +','+ str(result2[i]) + ','+ str(diff) +'\n'

with open('./day21_house/temp.csv','w') as file:
    file.write(output)

結果

50行分出力しましたが全て差分がないことがわかりました。やはりcsvデータの処理は標準のcsvライブラリよりpandasのほうが圧倒的に使いやすいです。

コメント