iT邦幫忙

2024 iThome 鐵人賽

DAY 12
0
自我挑戰組

與 AI 共舞:打造更高效的日常系列 第 12

AI 驅動的 Podcast 摘要系統(3)

  • 分享至 

  • xImage
  •  

引言

在上一篇文章,我分享了使用 n8n 平台設計自動化流程的經驗,還透過 Spotify for Podcasters 的 meta data 抓出音檔 URL,讓整個流程變得更加簡潔。本來想繼續挑戰 n8n 或是 Divy.ai 平台,但在使用他們的 Python 功能模組時遇到了不少困難,最後決定改用 Serverless 的混合解法,成功部署了一個可以活用外部套件的 Python 腳本,完成從 Podcast 集數 URL 到逐字稿轉錄的完整流程。接下來,我會專注在 AI 摘要的生成上,實際上,我已經在 n8n 上把整套流程串起來了。

轉錄流程簡介

https://ithelp.ithome.com.tw/upload/images/20240922/201682885ME8hH3mXT.png

我的轉錄流程主要依賴 Replicate 平台。每個 Prediction 任務都有一個獨特的 ID,當我提交 Podcast 集數的逐字稿轉錄任務後,就會得到一個 Prediction ID,之後可以透過這個 ID 來取回轉錄結果。在 n8n 的第一步,我會先獲取這個 Prediction ID,然後向 Replicate 平台請求轉錄內容。整理好格式後,接下來就可以開始進行 AI 摘要的工作了。這樣的流程不僅自動化程度高,也讓整個過程變得更加順暢。

測試與摘要生成

為了有個比較基準來評估 Podcast AI 摘要的效果,我特別選了 EP144 此處應有本 by 台灣通勤第一品牌 來做測試,使用 Podwise 這個 AI Podcast 平台來處理看看,想了解一下市面上的商業方案會怎麼做摘要。Podwise 幫這集 Podcast 摘要出了三大重點:

  • 維力炸醬麵推出湯麵的事件
  • 友情的脆弱與道歉的藝術
  • 延伸到愛情方面,坦誠溝通的重要性

完整內容請詳閱:EP144 此處應有本 | Podwise

## Summary
這一期播客節目深入探討了維力炸醬麵的湯麵事件及其背後的情感與消費者反應,並藉由主持人和嘉賓們的故事與分享,展現了友情的脆弱和道歉的藝術,讓我們明白在生活中溝通與理解的重要性,尤其是在面對愛情和友誼的誤解時。此外,節目也帶來了新音樂的推薦,豐富了節目的討論層面,讓聽眾不僅能獲得經驗,也能享受音樂的魅力。

## Takeaways
- 維力炸醬麵推出湯麵引發熱烈討論,強調消費者理解與品牌策略之間的關係。
- 朋友之間的衝突和矛盾是友情的考驗,重要的是彼此的理解和溝通。
- 完美的道歉需要真心的表達,而非僅僅是形式上的對不起。
- 在愛情中,誤解常常起源於溝通不良,應重視坦誠與理解。
- 音樂是情感表達的重要方式,可以推薦和分享新的曲目來豐富生活。

## Q & A
Q: 為什麼有人會認為湯麵的出現是正義的伸張?
A: 人們認為湯麵的出現是對過去未被重視的需求的回應,也認為它可以合法化之前使用湯麵的行為,正是因為這樣,當他們終於推出湯麵時,就代表他們承認過去的使用習慣,這使得消費者感到被重新接納和滿足。

Q: 為什麼公司會出湯麵?
A: 我當然要問他們為什麼要出湯麵。我一旦不滿意他們的答案,就會反問他們是不是用乾麵的包裝放到湯麵裡,這會不會欺騙消費者呢?我需要他們的官方回應,證明這個整個過程的合理性。

Q: 他們的友誼中,是否經歷過困難?
A: 是的,他們的友誼中經歷了許多挑戰,包括遲到、道歉等讓人感到不悅的情境。在一次遲到事件中,其中一位朋友用一瓶水象徵性地表達他們的友誼已經如覆水難收,令人感到感傷,但最終他們都意識到,友誼是一種無法完全控制的關係,充滿了情感與回憶。

Q: 為什麼在友情中不直接溝通反而選擇沉默或戲謔?
A: 在友情中,「沉默」或「戲謔」往往會被解讀為一種情緒表達,因為一方可能認為對方已經了解情況,或不願意面對直接的對峙。這種行為反映了友情的複雜性和對彼此關係的重視。然而,最終還是需要透過開誠布公的溝通來解決問題,以避免無意中造成誤會或傷害。

Q: 道歉的真正意義是什麼?
A: 道歉的真正意義在於約定好之後如何避免再次犯錯,只有這樣才能使誠意得以展現。單純地說 “對不起” 並不能解決問題。只有在說出真相以後,才能消除彼此的誤解,這樣的道歉才是有效的,否則會變得毫無意義。

Q: 為什麼在情感交流中要避免給予伴侶隱瞞的感覺?
A: 因為這樣的問法會摧毀信任基礎,並且對方可能會感受到壓力與攻擊性,男性往往難以提供滿意的答案。因此,建議直接溝通,以避免誤解和不必要的衝突。

Q: 這首歌的主題是什麼?
A: 這首歌的歌詞探討了貧困與絕望,表達了對社會的批判,歌者表達了自己很窮,甚至連夢想都被剝奪的感受,重複提到的 Desperado 表示他內心的絕望,因此歌詞在社會現實中有著強烈的反映。

在撰寫 Podcast 內容摘要的 Prompt 時,我參考了 Podwise 的分析結果,並利用 Anthropic Console 來產生與優化 Prompt。主要目標放在三個方面:

  • 生成 3 ~ 5句的核心大綱,精煉地概括節目主要討論的議題。
  • 萃取出 4 ~ 6 組關鍵重點,抓出節目中最重要、最值得聽眾注意的資訊。
  • 根據內容設計 5 ~ 7 個問答,涵蓋節目中的重要主題,並提供更深入的觀點和思考。

透過這樣的設計,Podcast 摘要不僅簡潔易懂,更能深入探討節目的核心內容,幫助聽眾快速掌握節目精華。

You are tasked with analyzing a podcast transcript and creating a structured summary. The transcript is in 臺灣正體中文, so you'll need to understand and process Chinese text. Your output should be in 臺灣正體中文 as well. Here's what you need to do:

First, read through the following podcast transcript:

<transcribe>
"{text}"
</transcribe>

Now, based on the content of the transcript, create a structured summary with the following components:

1. Summary:
Write a concise summary of the main topics discussed in the podcast. This should be about 3-5 sentences long. Begin this section with the tag <Summary> and end it with </Summary>.

2. Key Takeaways:
List 4-6 key points or insights from the podcast. These should be brief and capture the most important ideas discussed. Begin this section with the tag <Takeaways> and end it with </Takeaways>.

3. Q&A:
Create a set of 5-7 questions and answers based on the content of the podcast. These should cover important topics discussed and provide additional insight or clarification. Each question should be followed by a detailed answer. Begin this section with the tag <Q & A> and end it with </Q & A>.

Format your entire output as follows:

<output>
## Summary
<Summary>
[Your summary here]
</Summary>

## Takeaways
<Takeaways>
- [Takeaway 1]
- [Takeaway 2]
- [Takeaway 3]
- [Takeaway 4]
- [Takeaway 5 (if applicable)]
- [Takeaway 6 (if applicable)]
</Takeaways>

## Q & A
<Q & A>
Q: [Question 1]
A: [Answer 1]

Q: [Question 2]
A: [Answer 2]

[Continue with remaining questions and answers]
</Q & A>
</output>

Remember to write all content in Chinese, matching the language of the original transcript. Ensure that your summary, takeaways, and Q&A accurately reflect the content and main ideas discussed in the podcast.

不同 AI 模型的比較

一開始,我嘗試使用 GPT-4o mini 模型來做摘要,但發現它產出的結果大多都集中在前面的業配內容。我猜想可能是因為轉錄的文字內容太長,小模型沒辦法處理好。所以,我接著試了 GPT-4o、Gemini 1.5 Pro 和 Claude 3.5 Sonnet 這三個大型語言模型(LLM)。

  • GPT-4o:處理成本大概 0.4 美元,但效果不太理想,摘要內容大多都只抓到業配的部分。
  • Claude 3.5 Sonnet:效果三者中最好,成本大概 0.32 美元,雖然沒有完整涵蓋到情感延伸的部分,但摘要的重點算清楚。
  • Gemini 1.5 Pro:結果介於兩者之間,成本大概 0.43 美元,也有一樣把摘要內容集中在業配部分的問題。

另外,我在 Replicate 平台上用 NVIDIA A40 GPU 做轉錄,這集花了 359 秒處理,成本大概 0.2 美元。這樣算下來,整個處理流程的成本大概落在 0.52 到 0.63 美元之間。考量到成本效益,我覺得對私人用途的業餘專案來說,使用雲端方案不太划算,或許用自己的顯示卡搭配 OpenAI 的 Whisper 模型來做轉錄會比較好,然後再用本機的 Llama 3.1 模型拆分 chunk 後批次生成摘要。

總結與未來展望

整體來說,這次的嘗試讓我學習到如何運用 n8n 的 AI 功能模組,自動產生 Podcast 的摘要。雖然目前產生摘要的成本有點高,大概落在 0.5 到 0.6 美元之間,而且效果還沒有完全符合我的期待。相比之下,Podwise 這個 AI Podcast 平台如果加購額度的話,每集 Podcast 的摘要處理費用只要 0.4 美元,現在想想這 0.4 美元好像也沒那麼貴了。如果有機會的話,我會想試試看用本地的解決方案來整合看看。

以上就是我的小小嘗試和分享,希望對同樣在探索自動化流程的您有所幫助。如果您有任何問題或建議,歡迎在下面留言一起討論!


不同 AI 模型的比較:測試結果

Model:OpenAI gpt-4o

  • Prompt: 76747 Tokens
  • Completion: 780 Tokens
  • Price: $0.3954
## Summary
本集節目主要討論了單品咖啡的特點和盲飲測試,其中介紹了全家Let's咖啡最新推出的烏干達月亮山以及經典美式咖啡。主講者分享了對單品咖啡風味的認識,並未聽眾介紹了烏干達月亮山咖啡的產地和特色。此外,談論了唯利早醬麵推出湯麵與乾麵的趣事以及朋友之間有趣的互動。

## Takeaways
- 單品咖啡與經典咖啡的差異在於風味的獨特性,單品咖啡突出單一品種的豆子特性。
- 烏干達月亮山咖啡有著熱帶水果味,該產地位於赤道附近,山頂終年積雪不化。
- 喝單品咖啡能讓人感受到一種"單品感",較難以具體描述但可以明顯區分咖啡品質。
- 主講者分享了唯利早醬麵先推出乾麵後再推出湯麵的內幕趣事。
- 朋友之間的小爭執,經常因為誤解導致,但透過溝通可以解決。

## Q & A
Q: 什麼是單品咖啡,與經典咖啡有何不同?
A: 單品咖啡指的是使用單一品種的咖啡豆來展現其獨特風味,而經典咖啡則是混合多種咖啡豆以達到大眾較喜歡的風味效果。

Q: 全家Let's咖啡最新推出的單品咖啡是哪款?
A: 全家Let's咖啡最新推出的單品咖啡是烏干達月亮山咖啡。

Q: 烏干達月亮山咖啡的特色是什麼?
A: 烏干達月亮山咖啡有著熱帶水果味,該產地位於赤道附近的魯汶佐里山,山頂終年積雪不化。

Q: 為什麼選擇在便利商店購買較貴的單品咖啡?
A: 主講者認為,單品咖啡既可以滿足日常的咖啡因攝取需求,也可以在工作時提供一種享受和愉悅感,因此在便利商店購買較貴的單品咖啡是值得的。

Q: 唯利早醬麵的乾麵和湯麵有什麼故事?
A: 唯利早醬麵原本只提供乾麵,但因消費者經常將乾麵泡成湯麵,最終公司順應需求推出了正式的湯麵版本,引發了不少趣味討論。

Q: 主講者對朋友之間的小爭執有什麼看法?
A: 主講者認為,朋友之間的小爭執多半源自於誤解和溝通不良,及時溝通和坦誠表達才能有效解決問題,維持友誼。

Model:Claude 3.5 Sonnet (20240620)

  • Prompt: 98253 Tokens
  • Completion: 1362 Tokens
  • Price: $0.3152
## Summary
本集播客主要討論了幾個話題:全家便利商店的單品咖啡、維力炸醬麵推出湯麵版的爭議、以及主持人們之間的友情故事。他們品嚐了全家的烏干達月亮山單品咖啡,並討論了單品咖啡的特點。關於維力炸醬麵,他們爭論了新推出的湯麵版是否意味著原本的乾麵也可以泡湯。最後,他們分享了一些關於友情的有趣經歷和看法,包括一個關於"覆水難收"的有趣故事。

## Takeaways
- 單品咖啡具有獨特的風味特性,全家便利商店推出的烏干達月亮山咖啡是其中一例
- 維力炸醬麵推出湯麵版引發了關於原版是否也適合泡湯的討論
- 友情中的溝通和理解對維持長久關係很重要
- 有時候,朋友之間的爭執可能源於一些意想不到的原因
- 道歉不僅僅是說"對不起",更重要的是理解問題所在並承諾改變
- 在關係中,直接溝通比猜測對方想法更有效

## Q & A
Q: 全家便利商店推出的烏干達月亮山咖啡有什麼特點?
A: 烏干達月亮山咖啡是全家與UCC合作推出的第六波單品咖啡。它來自非洲烏干達的魯汶佐里山(月亮山)地區,具有獨特的風味層次,被描述為帶有熱帶水果味。這款咖啡展現了單品咖啡的特性,讓消費者能在便利商店享受高品質的咖啡體驗。

Q: 維力炸醬麵推出湯麵版引發了什麼爭議?
A: 維力炸醬麵推出湯麵版引發了關於原版乾麵是否也適合泡湯的討論。有人認為這是"正義得到伸張",因為之前一直有人將乾麵泡湯食用。然而,也有人認為這可能只是一種行銷策略,實際上新推出的湯麵版可能與原版並無太大區別。這個話題引發了主持人之間的熱烈辯論。

Q: 播客中提到的"覆水難收"故事是什麼?
A: 這個故事講述了主持人之一在國中時期與朋友之間的一次爭執。因為主持人遲到50分鐘,他的朋友感到非常生氣。朋友拿出一瓶礦泉水,將水倒在花圃裡,說"覆水難收,我們的友情就到此為止"。然而,主持人覺得這個行為很可笑,把空瓶子扔回給朋友。這個故事展示了青少年時期友情中的戲劇性和幽默。

Q: 播客中如何描述真正的道歉?
A: 根據討論,真正的道歉不僅僅是說"對不起"。真正的道歉包括以下幾個要素:1) 理解並承認自己的錯誤;2) 說出真相,暴露自己在意的點;3) 約定以後如何改正;4) 承諾不再犯同樣的錯誤。僅僅說"對不起"而不理解問題所在,往往被認為是敷衍和沒有誠意的。

Q: 播客中提到了哪些維持良好友誼的建議?
A: 播客中提到了幾個維持良好友誼的建議:1) 直接溝通,有不滿就直接說出來,不要悶在心裡;2) 理解朋友的行為可能有意想不到的原因,不要輕易下結論;3) 即使發生爭執,也要相信友情可以克服困難;4) 每次見面都要認真對待,讓相聚時光變得愉快;5) 理解並接受朋友的缺點,包容對方的小毛病。總的來說,開放、誠實的溝通和相互理解是維持長久友誼的關鍵。

Model:Gemini 1.5 pro experimental (20240827)

  • Prompt: ~117509 Tokens
  • Completion: ~1492 Tokens
  • Price: $0.4269
## Summary
這集 podcast 主要圍繞著兩個主題展開。首先,主持人們進行了全家 Let's Café 單品咖啡的盲測,討論了單品咖啡和經典咖啡的區別,並介紹了新推出的烏干達月亮山咖啡的產地特色和風味。接著,他們從一則聽眾留言「唯利炸醬麵終於推出湯麵了,正義終將伸張」展開了熱烈的討論,從泡麵的乾濕吃法,延伸到行銷策略、人際關係和溝通方式等話題,過程中充滿了幽默和趣味。

## Takeaways
- 單品咖啡豆在風味層次上與一般咖啡豆不同,能呈現更獨特的風味。
- 便利商店的單品咖啡提供消費者在日常生活中輕鬆享受高品質咖啡的選擇。
- 朋友之間的相處模式各有不同,溝通和理解是維繫友誼的重要關鍵。
- 真誠地表達感受和需求,避免猜忌和誤解,才能建立健康的溝通模式。
- 說出真相本身就具有接近道歉的效果,比單純說「對不起」更有意義。

## Q & A
Q: 主持人們盲測了哪兩款咖啡?他們對單品咖啡有什麼看法?
A: 主持人們盲測了全家 Let's Café 的經典美式和烏干達月亮山咖啡。他們認為單品咖啡豆在風味層次上與一般咖啡豆不同,能呈現更獨特的風味,讓人在品嚐咖啡的過程中獲得更多享受。

Q: 烏干達月亮山咖啡有什麼特別之處?
A: 烏干達月亮山咖啡的產區位於非洲東部赤道上的魯汶佐里山附近,因其終年積雪不化的山頂景觀,被烏干達人視為聖山,也因此得名。這款咖啡帶有熱帶水果風味,是全家 Let's Café 與 UCC 合作推出的第六波單品咖啡。

Q: 唯利炸醬麵推出湯麵為什麼會被主持人說成是「正義伸張」?
A: 其中一位主持人何景民一直以來都堅持唯利炸醬麵只能做成乾麵,不能泡成湯麵來吃。唯利公司推出湯麵版本,等於是承認了湯麵吃法的正當性,因此被何景民戲稱為「正義伸張」。

Q: 何景民打算如何證明唯利炸醬麵的乾麵和湯麵版本其實是一樣的?
A: 他計畫購買乾麵和湯麵版本,並仔細秤重比較其中的調味包,甚至還打算邀請律師和朋友來進行盲測,以證明他的觀點。

Q: 主持人分享了哪些關於友情的看法?
A: 他們認為朋友之間相處模式各有不同,像何景民和他的朋友老葉,雖然彼此個性差異很大,但長久以來互相扶持,建立了深厚的友誼。他們也強調溝通和理解的重要性,坦誠地表達感受和需求,才能避免猜忌和誤解,讓友情更加穩固。

Q: 主持人認為在與伴侶相處時,什麼樣的溝通方式是不可取的?
A: 他們認為用質問的語氣詢問伴侶「你是不是有什麼事瞞著我」,會給對方造成很大的壓力,並且是在摧毀彼此的信任基礎。

Model:ChatGPT o1 preview

看起來您貼上的文字是一段多位講者之間的對話記錄,內容涵蓋了友情、禮物交換、生日傳統以及人際互動中的衝突與和解等主題。以下是這段對話的摘要:

### **對話摘要**

1. **友情與禮物交換**:
   - **卡片與禮物**:討論到在生日或節日時送卡片與禮物的選擇。某位講者認為送卡片已經足夠,因為送禮物可能會讓對方感到壓力或不知如何回應。
   - **友情的經營**:提到有些人會刻意經營自己的社交圈,追求更多的卡片或禮物,但這種行為被認為是虛榮的表現。

2. **人際衝突與和解**:
   - **遲到事件**:一位朋友因遲到50分鐘而引發的衝突,對方用倒水來象徵友情的破裂,最終以丟瓶子的方式表達不滿。
   - **溝通的重要性**:強調在友情中直接溝通的重要性,而不是通過暗示或間接方式來表達不滿。

3. **單品咖啡與盲飲**:
   - **盲飲體驗**:合作夥伴全家Let's咖啡贊助,兩位講者進行盲飲比較經典美式咖啡與烏干達月亮山單品咖啡,討論其風味差異。
   - **咖啡產地介紹**:介紹烏干達月亮山咖啡的產地背景及其獨特風味,強調單品咖啡的獨特性。

4. **即食麵行銷策略**:
   - **乾麵與湯麵**:討論某品牌推出乾濕兩用的即食麵,並探討其行銷策略及消費者的反應。
   - **行銷挑戰**:分析公司在推出新產品時遇到的挑戰,如消費者混淆乾麵與湯麵的使用方式。

5. **幽默與互動**:
   - **輕鬆幽默**:整段對話中穿插了許多幽默和玩笑,如對某些行銷策略的吐槽、對朋友行為的調侃等,增添了對話的輕鬆氛圍。

### **總結**
這段對話主要圍繞著如何在友情中維持健康的互動方式,避免虛榮與不必要的壓力,同時也涉及到日常生活中的小衝突及其解決方法。此外,講者們還分享了對單品咖啡的品鑑體驗以及對即食麵行銷策略的見解,展現出他們對飲食文化和消費行為的關注。

如果您有特定的需求,如需要更詳細的翻譯、分析或其他幫助,請隨時告訴我!

上一篇
AI 驅動的 Podcast 摘要系統(2)
下一篇
AI 驅動的 Podcast 摘要革命:我的 Podwise 探索之旅
系列文
與 AI 共舞:打造更高效的日常30
圖片
  直播研討會
圖片
{{ item.channelVendor }} {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

尚未有邦友留言

立即登入留言