iT邦幫忙

2025 iThome 鐵人賽

DAY 2
0

說好的整裝待發🎒,於是,我決定動手把腦袋裡的藍圖畫出來。就像冒險前要先在地圖上標出地標,不然出發後一定會迷路。

想了又想,又多了一些靈感,決定來拆解成三個pipeline:

  • Arxiv Pipeline — 把論文抓進來
  • RAG Pipeline — 把論文知識變成可檢索的智慧
  • Email Subscription Pipeline — 把資訊推送給使用者

這樣實作上比較務實,也能階段性交付 (還可以優雅地幫自己找藉口 🤭

https://ithelp.ithome.com.tw/upload/images/20250909/20136781eyq1etqblV.png

用白話來說,就是 一條存資料,兩條撈資料來分析。

看了前輩們第一天就能承諾接下來 30 天的完整規劃,我卻選擇隨心寫,一天算一天。 如果非要我在這專案加上一個期限,我希望一萬年 (X

好啦,其實我還是可以規劃的 👇

第一階段:認識裝備 🪓

  • 認識工具與基建
  • Storage / API / LLM 的第一次登場

第二階段:組合裝備 ⚔️

  • 把單點工具串起來,形成三大 pipeline(arxiv、rag、subscription)
  • 三大 pipeline 初步完成。
  • 前後端互動、容器化、任務排程

第三階段:踏上冒險之路 🏔️

  • 系統監控
  • 測試、自動化
  • 系統進入穩定與優化階段

明天真的要來寫點東西了~~


上一篇
Day 1 | 為什麼做 Arxiv Knowledge Assistant?—啟程與夢想 🚀
下一篇
Day 3 | 攻略第一個據點 — Arxiv Pipeline 技術拆解(上):Metadata 抓取與 PDF 處理
系列文
論文流浪記:我與AI 探索工具、組合流程、挑戰完整平台4
圖片
  熱門推薦
圖片
{{ item.channelVendor }} | {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

尚未有邦友留言

立即登入留言