iT邦幫忙

2024 iThome 鐵人賽

DAY 2
0
生成式 AI

30天掌握生成式AI的未來應用系列 第 17

Day17:實作第七天-醫療文本的摘要生成與優化(python)

  • 分享至 

  • xImage
  •  

一、前言及目標
學習如何使用生成式AI生成醫療文本的簡短摘要。
實作調用預訓練的語言模型來自動生成摘要,提升醫療文本處理效率。

二、程式碼與結果
https://ithelp.ithome.com.tw/upload/images/20241010/20169264Ibk1qcHlnl.png
https://ithelp.ithome.com.tw/upload/images/20241010/20169264UPBKMpw5sk.png

三、嘗試
中間其實不停修改程式,最後才有了上面這個版本,輸出我想要的內容。以下是錯誤的結果:
https://ithelp.ithome.com.tw/upload/images/20241010/201692641TsUpdhWBh.png
句子沒頭沒尾,且字與字的間距有問題。

https://ithelp.ithome.com.tw/upload/images/20241010/20169264AyANQYq7E4.png
內容有錯字也太簡短不符合我的預期。

總之就在不停修改程式碼,針對問題去解決,才有了「二」的結果。

四、分析
max_length=100:將最大長度調整為100,這樣模型有足夠的空間生成完整的句子,避免截斷。
清理空格:cleaned_summary = summary[0]['summary_text'].replace(' ', '') 用於移除每個中文字之間的多餘空格,這應該能夠解決字之間被拆開的問題。
中文模型:繼續使用 fnlp/bart-base-chinese 來處理中文文本,以確保生成結果更適合中文語境。

五、小結反思
今天的實作內容是醫療文本的摘要生成。通過嘗試不同的模型與參數設定,最終選擇了適合中文文本的BART模型來生成摘要。因為一開始程式其實問題滿多的,結果根本不符合預期,所以有請chatGPT做修改,算是一起齊心完成最終版。我的內容當然只是簡單整理摘要,如果這種技術用在長篇且大量的文本一定可以很省時間,不僅僅是在醫療方面,各個面向都會很實用。


上一篇
Day16:實作第六天-醫療文本處理(python)
下一篇
Day18:實作第八天-情感及狀態分析(python)
系列文
30天掌握生成式AI的未來應用30
圖片
  直播研討會
圖片
{{ item.channelVendor }} {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

尚未有邦友留言

立即登入留言