iT邦幫忙

0

請問 DataFrame 合併 or Dataframe

該如何合併不要有NAN
apply 可以直接加速資料就不用合併嘛!

sectors = re2s.groupby("twok")
scscs=sectors.get_group(2)
print(scscs)

https://ithelp.ithome.com.tw/upload/images/20181121/20110224Q3swF68NCe.png

from difflib import SequenceMatcher       #可以不用理會
onee =scscs['onek'].tolist()              #讓他變list
poi1=[]                                   #可以不用理會
s1 =('221')                               #可以不用理會
s2 =(onee)                                #可以不用理會
for i in s2:                              #可以不用理會
 a=SequenceMatcher(None, s1, i).ratio()   #可以不用理會
 poi1.append(a)                         #可以不用理會
A_1=pd.DataFrame(poi1,columns=['A_1'])                    #新增一個  columns
scscs=pd.concat([scscs,A_1],axis=1,ignore_index=True)         #跟前面的dataframe合併
print(scscs)

https://ithelp.ithome.com.tw/upload/images/20181121/20110224qhRUrRQvKv.png

我要如何不要出現NAN 直接加在後面 可以用apply示範一次給我看看嘛!!

看更多先前的討論...收起先前的討論...
應該是row['length'] = (a) 這行錯了,
這樣會一次改變所有的值
而且每一次迴圈都會覆蓋之前的值
所有你都只會出現最後一個比對的值
chien005 iT邦新手 5 級 ‧ 2018-11-21 06:48:06 檢舉
row['length'] = (a) 如果沒有這行 就不能加進去了 要往哪方面下手去查找修改的方法!!
froce iT邦高手 1 級 ‧ 2018-11-21 09:12:55 檢舉
或許根本不用這麼辛苦,用apply就能直接處理,用不到迴圈。
https://blog.csdn.net/qq_19528953/article/details/79348929

用迴圈速度應該會比用apply慢很多。
pd.fillna()這可以把nan替換成0

尚未有邦友回答

立即登入回答