iT邦幫忙

2025 iThome 鐵人賽

DAY 19
2

2025 Gemini 八大模組最全解析

AI × Data 的實戰工作流:從讀檔、調研到多模態生成,一站到位

2025 Gemini 八大模組重點
1️⃣ Flash / Pro 雙模式:快 vs 深
2️⃣ 100萬 token:上千頁長文也能吃
3️⃣ 全家桶互聯:@ Gmail/日曆/YouTube
4️⃣ Canvas 畫布:左問右寫,共創文件
5️⃣ Deep Research:連網查證+結構化研究
6️⃣ AI Studio:對話 / 直播練習 / SOP / 播客
7️⃣ 多模態:圖片理解、影像生成、VO3 影片
8️⃣ Workspace 助理:Docs / Sheets / Slides 一條龍

✨Gemini 已是「資料中樞+內容工廠」,從研究、分析到簡報影音,AI × Data 全面打通。


目錄

  1. 模組一|雙模型思考:Flash vs. Pro 的任務分工

  2. 模組二|超長文件與上下文:100 萬 token 的研究力

  3. 模組三|全家桶互聯:@ 召喚 Gmail / 日曆 / 地圖 / YouTube

  4. 模組四|Canvas 協作畫布:左問右寫的共創工作台

  5. 模組五|Deep Research:連網查證+結構化研究稿

  6. 模組六|AI Studio 專業模式:Chat / Stream / Generate Media / Build

  7. 模組七|多模態能力:圖像理解、圖生圖、音訊與 VO3 影片

  8. 模組八|一站式辦公助理:Docs / Sheets / Slides 的 AI 增壓

  9. AI × Data 實戰範本:三條高效工作流

  10. 風險與最佳實務:授權、引用、隱私、版本差異

  11. 結語:把 Gemini 變成你的「資料中樞與內容工廠」

  12. 專有名詞大整理(附舉例)


模組一|雙模型思考:Flash vs. Pro 的任務分工

定位:

Gemini 2.5 Flash(快速):查資料、簡單問答、即時回覆。優點快,深度有限。

Gemini 2.5 Pro(深度):長文寫作、結構化分析、邏輯推理、資料整合。

AI × Data 提示(Prompt)策略:

快速檢索 → Flash:「列出近三個月電動車品牌 A/B 的新聞要點(列出來源)」

深度比較 → Pro:「從市場定位/供應鏈/軟體能力/用戶社群四維度,建立 A vs. B 的比較矩陣,附新聞引用。」

影片重點也提到:一般用戶可切到 Pro 做深度任務(以影片示範為準),這讓長文分析的入門門檻更低。


模組二|超長文件與上下文:100 萬 token 的研究力

能力亮點:

100 萬 token 上下文=一次處理「上千頁 PDF / 多文件跨比對」。

能「理解 → 對比 → 重組 → 給建議」,不是僅做摘要。

多輪記憶:在閱讀過程持續追加任務(如:根據第 N 份 PDF 第 X 段自動出表/圖)。

實戰場景(Data Research):

  1. 同時上傳 10 份行業報告(>1000 頁)

  2. 指令:「歸納五大趨勢,標註每一點的來源段落,並標出彼此差異。」

  3. 追加:「以第 3 份報告的 ’User Growth’ 段落為準,繪製 2023–2025 成長曲線(假設缺值做線性補)」


模組三|全家桶互聯:@ 召喚 Gmail / 日曆 / 地圖 / YouTube

一鍵召喚(在對話框輸入 @):

Gmail:「列出本週未回覆郵件,摘要重點,生成回信草稿。」

Calendar:「掃描本週會議空檔並推薦排程,直接寫入日曆。」

YouTube:「抓字幕 → 提煉要點 → 生成演講稿/教案大綱。」

Maps / Flights / Hotels:旅遊/差旅的一條龍規劃。

注意:需要登入 Google 帳號與授權;部分(如 Gmail)需 Workspace 或 Pro 會員(以影片描述為準)。

Google 全家桶服務對照表(Gemini 功能)

服務 Gemini 能做的事例
Gmail 總結未讀郵件、標記重點、草擬回覆
Calendar 掃描行程、推薦會議時間、直接新增排程
Drive 搜尋文件、讀取內容、生成摘要
Docs 自動生成大綱/草稿、逐段改寫、延伸內容
Sheets 讀取表格數據、計算平均/同比/環比、繪製圖表
Slides 快速生成封面頁、提案骨架、逐頁下載簡報
Maps 查詢地點、規劃路線、標記旅遊計劃
Flights 搜索航班資訊、整理出行方案
Hotels 查詢住宿選項、整合成行程建議
YouTube 抓取字幕、總結影片觀點、轉成演講稿或教案

模組四|Canvas 協作畫布:左問右寫的共創工作台

核心價值:

左側「對話/指令」,右側即時出稿、可直接編輯。

支援段落替換、擴寫、語氣變換;內容可持續編修而不必重啟對話。

能生成旅遊計畫(含飯店/餐廳/交通/地圖標註)、產品頁、課綱,甚至一鍵出網頁預覽。

Data 協作方式:

在 Canvas 右側貼入統計表/圖,左側下指令:「改寫成 5 個洞察+對應建議」、「把結尾換成問句」。

把 Canvas 當成**資料敘事(Data Storytelling)**的共同白板。


模組五|Deep Research:連網查證+結構化研究稿

使用流程:

  1. 進入 Deep Research → 輸入問題(可含背景、目標、輸出格式)。

  2. 自動聯網檢索、交叉驗證、引用標註。

  3. 產出結構化研究文稿(可轉圖表/網頁/語音)。

  4. 「研究的研究」功能:再對剛產出的 18 頁研究稿做「專家級摘要」,幫你在 5–10 分鐘讀完精華。

範例:

「調研『AI 在東南亞中小企業』的應用趨勢:請分產業痛點、AI 解法、成本效益、風險合規,並附來源。」


模組六|AI Studio 專業模式:Chat / Stream / Generate Media / Build

四大板塊:

Chat:對話+長上下文。

Stream:即時語音/視頻互動;可投屏請教軟體操作、練習演講並得到即時口條/邏輯反饋。

Generate Media:生成/編輯圖片、音訊、影片;可產生單人或雙人播客。

Build:更偏應用構建的工作流(比純聊天更像可配置 App)。

高階用法(影片示範要點全部保留):

  1. 雙角色對比分析:

左:財務保守派;右:市場樂觀派 → 並排輸出、列分歧點、形成折衷方案。

  1. Stream 練直播/簡報:即時糾正語速、停頓、邏輯。

  2. 自動生成播客:上傳稿件 → 生成節目(可選語速/風格;也可雙人對話版)。

  3. 自動生成 SOP:上傳操作影片 → 解析步驟 → 產出帶截圖的教學文件,甚至語音導覽。

影片另提到「AS-69」將 Gemini 推到「專業戰鬥型態」——可理解為強化模組/配置檔的比喻,用於提升整體作戰力(依影片說法納入)。


模組七|多模態能力:圖像理解、圖生圖、音訊與 VO3 影片

範圍:

影像理解:上傳產品照→辨識要素→生成文案。

影像生成:依提示詞產商業圖(如賽博龐克風)。

音訊合成:播客旁白、課程配音。

影片生成:網頁端可用 VO3 生成影片(自然度高,帶聲音;依影片示範)。

Data 應用:

把數據洞察快速轉為視覺素材/短影片,用於簡報、社群擴散與品牌溝通。


模組八|一站式辦公助理:Docs / Sheets / Slides 的 AI 增壓

四大高頻場景:

Gmail:摘要未讀→一鍵草擬禮貌回覆。

Docs:輸入主題→自動出章節大綱/草稿→逐段改寫。

Sheets:讀表+分析;同比/環比、平均值、自動畫圖(折線、長條)。

Slides:快速建立封面頁與標題,循序下載成多頁提案。

團隊價值:

Gemini 嵌在 Workspace 的右側欄,隨叫隨到,像一位懂資料、會寫作、會畫圖的全能助理。


AI × Data 實戰範本:三條高效工作流

流程 A|「多報告 → 趨勢藍皮書」

  1. 模組二:上傳 8–12 份行業 PDF → 指令:歸納 5 大趨勢+來源段落標註。

  2. 模組五:用 Deep Research 連網補齊當月新聞與學術快訊,強化外部佐證。

  3. 模組四:在 Canvas 右欄將圖表與結論編排成藍皮書,一鍵出網頁預覽。

  4. 模組八:Slides 生成封面+章節骨架,整理成對外簡報。

流程 B|「銷售資料 → 行動建議」

  1. 模組八(Sheets):匯入銷售月報→要求計算「品類/大區/渠道」三維同比。

  2. 模組一(Pro):生成洞察+優先級矩陣(Impact × Effort)。

  3. 模組四(Canvas):把洞察轉為行動手冊;一鍵變更段落語氣給不同角色(業務/經理)。

  4. 模組六(Generate Media):輸出 2 分鐘語音 Briefing,每日例會播放。

流程 C|「教學影片 → SOP/播客」

  1. 模組六(SOP):上傳操作錄影→輸出圖文步驟+截圖。

  2. 模組六(Podcast):同主題雙人播客腳本+合成,供學員複習。

  3. 模組七(VO3):生成 30–45 秒教學短影片,社群宣傳導流。


風險與最佳實務

授權與隱私:啟用 Gmail/Calendar/Drive 前確認組織政策;避免把敏感客戶資料丟入公共工作區。

引用管理:Deep Research 內容要保留來源連結與時間戳;內部報告加註「以某日期檢索」。

版本差異:功能、模型名與可用性會隨地區/帳號等級/時間變動(本文依據影片示範,不等同官方最終條款)。

事實校準:長文歸納後,建議以抽樣驗證(spot-check)審核關鍵結論。


結語:把 Gemini 變成你的「資料中樞與內容工廠」

Gemini 不只是一個回答問題的聊天機器人,而是一個跨模組、跨資料型態、跨應用場景的「AI × Data 生產線」。它能讀懂巨量文件、把零散資訊縫合成邏輯結構、再把結論輸出成文案、圖表、音訊與影片,最後透過 Workspace 直接進入協作與執行。
掌握本文八大模組與三條工作流,你就能把 Gemini 變成專屬的研究助理、資料分析師、內容編輯與簡報設計師——真正站上資料驅動決策的第一梯隊。


專有名詞大整理(附生活化舉例)

名詞 定義 重要性 生活化舉例
上下文視窗 模型一次可讀與記住的文字長度(約100萬token) 決定可處理資料量 像超大書桌,一次攤開十幾本厚書
Flash / Pro 快速回覆 / 深度分析兩種模式 任務匹配 即時回訊用 Flash;長文用 Pro
Deep Research 連網檢索+交叉驗證+結構化輸出 降低幻覺 3天蒐集→濃縮成 18 頁研究稿
Canvas 左側對話右側出稿的共創畫布 可持續編修 聊天同時排版,不換視窗
多模態 文字/圖像/音訊/影片跨型態處理 全鏈路輸出 數據洞察→短影片+旁白
VO3 高品質影片生成模型(可含聲音) 快速製片 30秒生成開箱/教學短片
Stream 即時語音/視頻互動與投屏 練習與指導 練簡報,AI 即時糾正口條
雙角色對比分析 設兩種人設並排輸出觀點與分歧 多觀點決策 財務保守 vs 市場樂觀
SOP 生成 讀操作影片→產出圖文步驟(可含截圖/語音) 知識落地 把高手手感變成文件教程
Workspace 整合 Gmail/Docs/Sheets/Slides 右欄隨叫隨到 流水線作業 收信→摘要→回覆→簡報封面

參考資料

影片:2025 Gemini 最新最全功能讲解!八大模块讲解
https://youtu.be/tJ3UePiNe50?si=JvfeUQENDJR5jmBn


上一篇
🍽️ 從高價菜單到醫療長照:AI 與統計的機器學習方法總覽
下一篇
🌊 堰塞湖的危機與 AI Big Data 的預警力量
系列文
AI 與統計在醫療與長照的應用:連結教育、收入、婚姻與居住,建構健康與照護決策支持23
圖片
  熱門推薦
圖片
{{ item.channelVendor }} | {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

尚未有邦友留言

立即登入留言