Pandasデータ分析

集計・変形

Pandas groupby×aggの使い方|基本の集計とaggの書き方を例で解説【第16回】

groupbyは「グループごとに集計する」ための基本機能です。このページではgroupbyの基本から、aggでの集計、filterの使い方まで例で解説します。pre { margin: 0 !important; padding: 1em;...
抽出・前処理

Pandas dropna()・drop_duplicates()の使い方|欠損/重複の削除とdrop()基本【第15回】

欠損や重複を処理せずに進めると、集計や可視化の結果がズレやすくなります。このページではdrop/dropna/drop_duplicatesの使い分けを、例でまとめて解説します。Pandasでデータ前処理を行う際に欠かせないのが、drop(...
抽出・前処理

欠損値を可視化して攻略!Pandas isnullとヒートマップ活用術【第14回】

PandasでNaN(欠損値)に悩んだことはありませんか?本記事ではisnull()とisnull().sum()の基本的な使い方を初心者向けに解説し、欠損値の位置や数を確認する方法を紹介します。seabornやmissingnoを使った可...
抽出・前処理

pandas isinの使い方と仕組み|リスト・複数条件・not isin・処理速度まで徹底解説【第13回】

pandas isin()メソッドを詳しく解説。リスト形式での抽出、複数条件やnot isin()による除外、==との違い、処理速度比較まで図解付きで紹介します。 /* ここだけに効く最小リセット */ .pdl-series-nav p ...
集計・変形

pandas mergeの使い方|DataFrame結合(inner, left, outer)の違いと実例【第12回】

pandasのmerge関数をわかりやすく解説。inner/left/outer結合の違い、複数キー結合、suffixesでの重複列対策まで実例付きで紹介。 /* ここだけに効く最小リセット */ .pdl-series-nav p { m...