このカテゴリでは、Pandasを使ったデータ抽出やフィルタリング、欠損値処理、重複データの削除など、分析前の前処理に関する操作を解説します。loc・iloc・isin・dropなどの具体的なサンプルコードを用いて、実務での活用方法を学びます。
抽出・前処理 pandas apply()の使い方|axis=1で行ごとに処理・lambda・mapとの違いを解説
pandasのapply()で列や行に関数を適用する方法を初心者向けに解説。axis=1で行ごとに処理する考え方、lambdaや自作関数、map・replace・astype・np.whereとの違いも整理します。
抽出・前処理 pandas duplicated()の使い方|重複行の確認・subset・keepを初心者向けに解説
pandasのduplicated()で重複行を確認する方法を初心者向けに解説。True/Falseの意味、subset、keepの違い、drop_duplicates()との使い分けまで、削除前に安全に確認する流れで紹介します。
抽出・前処理 pandas map()の使い方|辞書で値を変換・新しい列を作る方法を初心者向けに解説
pandasのmap()を使って、辞書で値を変換する方法を初心者向けに解説。数値コードや文字列コードをラベルに変換する例、新しい列を作る方法、辞書にない値がNaNになる原因、replace()・astype()・merge()との違いまで整理します。
抽出・前処理 pandas cut()の使い方|bins・labelsで数値を区間分けする方法を解説
pandasのcut()を使って、年齢・点数・購入金額などの数値を区間分けする方法を初心者向けに解説します。bins・labelsの指定、include_lowest、right、retbins、precision、qcutとの違い、NaNが出る原因まで具体例で学べます。
抽出・前処理 pandasで新しい列を追加する方法|df[‘列名’]・assign・条件付き列追加を初心者向けに解説
pandasで新しい列を追加する方法を初心者向けに解説。df['列名']での基本、assign()、loc、insert()、np.where()を使った条件付き列追加、反映されない原因まで具体例で紹介します。