あれもPython,これもPython

Pythonメモ※本サイトはアフィリエイトを利用しています

SQLの分析でよく使うウィンドウ関数、その中の累系の再現です。

sum(col) over(order by sort_col rows between unbounded preceding and current row

みたいなやつです。
sort_colで並べて、そのカラムまでの累積を上では出しています。

df.col.cumsum()

で行けますが、その前にソートしておく必要があります。
また、sqlのignore nullsの代わりとしてskipna = Trueを渡すことで、nullを飛ばせます。

一度groupbyする感じですね。

df.groupby('group カラム').col.cumsum()