您好,
想請教,我有個 df1 長這樣,想計算每種「concated','兩可','異體字'」組合的個數:
兩可 次數 異體字 concated
n 1 FALSE 一並一併
n 1 FALSE 一並一併
n 1 FALSE 一並一併
n 1 FALSE 一並一併
n 1 FALSE 一並一併
NaN 1 FALSE 一並一併
n 1 FALSE 一並一併
n 1 FALSE 一並一併
n 1 FALSE 一並一併
n 1 FALSE 一並一併
n 1 FALSE 穏定穩定
n 1 FALSE 穏定穩定
n 2 FALSE 穏定穩定
於是這樣寫:
df2=df1.groupby(['concated','兩可','異體字']).
agg({'次數':'sum'}).reset_index()
Output 如下,想請教為何它的「一並一併」次數為何不是 9、「穏定穩定」次數不是 4 呢?
concated 兩可 異體字 次數
一並一併 n FALSE 2
一並一併 n FALSE 7
穏定穩定 n FALSE 1
穏定穩定 n FALSE 3
我已丟 Jupyter 確認過第1、2 列的「concated 兩可 異體字」確實相同,3、4列也是
謝謝大大!:D
樓主的原始資料做成excel後,在jupyter notebook中執行的結果: