極度暴力簡單的圖片轉 PDF 介面功能
寫個簡單網頁介面,可以批次上傳圖片,然後按照圖片拍攝時間順序,排序並轉檔為 PDF 可下載
Agent 提供的規格:
主要功能:
使用方式:
原以為大概 1 分鐘搞定,但出乎意料 Claude 可上傳圖片跟預覽,但只要點擊下載按鈕,畫面一片空白。修正幾之後還是失敗,覺得太詭異,所以將相同 prompt 丟到 cursor,畫面跟功能是一次成功,但功能做出來根本不意外,是更好奇為什麼會失敗。關鍵差異點是什麼?
失敗跟成功兩邊程式碼丟給 GPT分析為什麼?結果的確少講了一些讓模型能理解執行環境與輸出需求,像是:
以上是 GPT 列出來的,有些的確可事先規範,但有些並不是我的常識範圍內。所以真正挑戰應該是:如何把這些實作邊界基本規則說完整。現階段所有技術細節沒有辦法一次描述到位,但至少最基本也要能做到正確場景描述。至少是:
「似乎」知道了些什麼之後,暴力結論是的確我要的功能有了
介面 (預設色系真的是萬年不變,看到膩)
批次上傳
我做了什麼
AI 幫了我什麼
今天的重點完全不是擺在這個功能有沒有完成,完成是必然。但想到最近一直看到的 SDD 關鍵字。開發規格有可能一直都在改,Code 也不是我本人生,那跟 Agent 協作的核心:的確也剩開需求本人有義務說清楚「功能在什麼環境、要怎樣被使用、怎樣算成功」了。 (應該吧