このカテゴリでは、Pythonの代表的なデータ分析ライブラリ「Pandas」を使って、データの読み込み、整形、集計、可視化までを体系的に解説します。実務で役立つDataFrame操作やMatplotlibによるグラフ作成など、初心者から実務者まで幅広く活用できる内容をまとめています。
集計・変形 pandas resample()の使い方|日付データを月別・週別に集計する方法
pandasのresample()で日付データを月別・週別・日別に集計する方法を初心者向けに解説。to_datetime()で日付型に変換し、set_index()やon引数を使って売上合計・件数・平均を集計する流れ、groupby()やasfreq()との違いも紹介します。
集計・変形 pandas crosstab()の使い方|2つの列をクロス集計・割合表示する方法
pandasのcrosstab()を使って、2つの列の組み合わせをクロス集計する方法を初心者向けに解説。value_counts()との違い、合計行・合計列、normalizeによる割合表示、欠損値の注意点までわかります。
抽出・前処理 pandas between()の使い方|数値・日付を範囲で抽出する方法
pandasのbetween()で数値や日付を範囲抽出する方法を初心者向けに解説。判定から行抽出までの流れ、inclusive、欠損値、query()やcut()との違いも整理します。パーマリンク案
抽出・前処理 pandas select_dtypes()の使い方|データ型で列を選ぶ方法を初心者向けに解説
pandasのselect_dtypes()を使って、数値列・文字列列・日付列などをデータ型で選ぶ方法を初心者向けに解説します。dtypesで型を確認し、to_numeric()やto_datetime()で型を整えてから、必要な列だけを抽出する流れまでわかります。
抽出・前処理 pandas to_numeric()の使い方|文字列の数字を数値に変換する方法
pandasのto_numeric()で文字列の数字を数値に変換する方法を初心者向けに解説。object型で計算できない原因、errors="coerce"でNaNにする使い方、astype()との違い、カンマ・円付き金額の前処理まで具体例で紹介します。