iT邦幫忙

0

groupby 沒把長的一樣的group 在一起?!

  • 分享至 

  • xImage

您好,

想請教,我有個 df1 長這樣,想計算每種「concated','兩可','異體字'」組合的個數:

兩可 次數 異體字 concated
n 1 FALSE 一並一併
n 1 FALSE 一並一併
n 1 FALSE 一並一併
n 1 FALSE 一並一併
n 1 FALSE 一並一併
NaN 1 FALSE 一並一併
n 1 FALSE 一並一併
n 1 FALSE 一並一併
n 1 FALSE 一並一併
n 1 FALSE 一並一併
n 1 FALSE 穏定穩定
n 1 FALSE 穏定穩定
n 2 FALSE 穏定穩定

於是這樣寫:

df2=df1.groupby(['concated','兩可','異體字']).
agg({'次數':'sum'}).reset_index()

Output 如下,想請教為何它的「一並一併」次數為何不是 9、「穏定穩定」次數不是 4 呢?

concated 兩可 異體字 次數
一並一併 n FALSE 2
一並一併 n FALSE 7
穏定穩定 n FALSE 1
穏定穩定 n FALSE 3

我已丟 Jupyter 確認過第1、2 列的「concated 兩可 異體字」確實相同,3、4列也是

謝謝大大!:D

看更多先前的討論...收起先前的討論...
wdchiang iT邦新手 2 級 ‧ 2023-09-21 11:17:10 檢舉
df1['次數'] = df1['次數'].fillna(0) # 將NaN值替換為0
emyschung iT邦新手 5 級 ‧ 2023-09-21 16:43:26 檢舉
感謝!我將所有 df1 的欄位的 NaN 都替換成0,結果 df2:
185 一並一併 0 False 1
186 一並一併 n False 2
187 一並一併 n False 7
9656 穏定穩定 n False 1
9657 穏定穩定 n False 3

好像仍不是我想要的「一並一併」次數 9、「穏定穩定」次數4 耶 XDD
obarisk iT邦研究生 2 級 ‧ 2023-09-22 10:40:13 檢舉
我無法理解丟 jupyter 相同是什麼意思

你指的是
```
df["concated"] == "一並一併"
```

長度要等於 9 ?
那不用 groupby 就可以驗證了
emyschung iT邦新手 5 級 ‧ 2023-09-22 11:17:24 檢舉
謝謝回覆:),我想得到的是,將 unique的「concate-異體字-兩可」對應的「次數」加總,生成一包含「concate-異體字-兩可-次數」4個欄位的 df

所謂 unique,下方 #186、#187 由於「concate-兩可-異體字」一模一樣,就希望它合成一 unique row,次數相加(2+7)

185 一並一併 0 False 1
186 一並一併 n False 2
187 一並一併 n False 7

我用 Jupyter 驗證過 #185~#187 的「一並一併」真的是相同的詞

然後澄清一下,「次數」欄不是 concate 的 count,我不是要算 concate 的 value counts。:)
圖片
  直播研討會
圖片
{{ item.channelVendor }} {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

1 個回答

0
mackuo
iT邦研究生 2 級 ‧ 2023-09-22 11:01:08

樓主的原始資料做成excel後,在jupyter notebook中執行的結果:
https://ithelp.ithome.com.tw/upload/images/20230922/20122335o5fywUYzpS.jpg

emyschung iT邦新手 5 級 ‧ 2023-09-22 14:32:29 檢舉

貼 Excel 再 load 奏效了,感謝您:D
我再想想為何會這樣@@
再次感謝各位大大~~

我要發表回答

立即登入回答