為什麼AI寫程式會「發瘋」?看AI大神直播3小時,揭開與AI協作的殘酷真相

為什麼AI寫程式會「發瘋」?看AI大神直播3小時,揭開與AI協作的殘酷真相

知名 AI 開發者與 YouTuber Cole Medin 最近進行了一場長達三小時的直播,挑戰從零開始,現場打造一個全端 AI 助理。這個 ambitious 的計畫旨在創建一個以他所有 YouTube 影片內容為知識庫的個人化 AI 教練。然而,這場直播並非一帆風順,反而意外地揭示了與 AI 協作時光鮮亮麗表象下的殘酷現實:即使是頂尖高手,也必須面對 AI 助理「失控」與「遺忘」的挑戰。這不僅是一場程式碼的展演,更是一堂關於如何駕馭 AI 的實戰大師課。

Cole Medin 的目標是建立一個先進的 RAG (Retrieval-Augmented Generation) 代理,專精於 AI 代理和 AI 編碼兩大領域。這個 AI 的知識來源,正是他頻道上所有影片的逐字稿。

整個技術架構涵蓋: - 後端語言:Python - AI 框架:Pydantic AI - 資料庫與向量儲存:Superbase - 資料處理與分塊:Dockling 函式庫

運作流程是先建立一個 RAG 管線 (Pipeline),自動抓取 YouTube 影片逐字稿,透過「混合分塊 (Hybrid Chunking)」策略進行處理,最後將這些知識碎片嵌入並儲存在 Superbase 知識庫中。最終目標是提供一個類似 ChatGPT 的聊天介面,讓使用者能針對他的影片內容提出深入問題,並獲得精確、附有來源的回答。

核心方法論:PIV 循環與消除AI的「假設」

Cole Medin 強調,與 AI 高效協作的關鍵不在於盲目地丟出指令,而是建立一套系統化的流程。他將自己的方法論稱為「PIV 循環」:

  1. Planning (規劃):在動手寫任何程式碼前,進行深度規劃。
  2. Implementing (執行):將編碼任務完全委託給 AI 助理。
  3. Validating (驗證):由人類專家進行程式碼審查與手動測試。

他指出,整個流程中最關鍵、也最常被忽略的就是「規劃」階段。其核心價值在於: 「規劃階段的主要目標,就是盡可能減少 AI 編碼助理在執行時需要做出的『假設』。」

一個模糊的指令會迫使 AI 填補大量細節,導致結果難以預測。因此,他的規劃階段極其細緻,包含從「非結構化對話 (Vibe Planning)」到最終產出「結構化計畫 (Structured Plan)」,明確定義所有技術選擇、功能邊界與預期行為,不留下任何模糊空間。

當AI開始失控:一場2500行的計畫災難

直播中最具戲劇性的轉折,完美印證了深度規劃的重要性。當 Cole Medin 要求 AI 編碼助理 (Claude Code) 根據討論生成一份結構化計畫時,他明確指示計畫的長度應介於 500 到 1000 行之間。

然而,AI 卻完全無視了這個關鍵限制,產出了一份長達 2500 行 的超長文件。

這個看似微小的失誤,卻引發了災難性的後果。這份過於冗長和複雜的計畫,導致 AI 在後續的執行階段出現了嚴重的「注意力渙散」與「指令遺忘」。最致命的錯誤是: AI 完全忘記了使用核心技術之一的「Dockling」函式庫來進行混合分塊。

這意味著整個 RAG 管線中最關鍵的資料處理步驟被徹底跳過,AI 選擇用自己拼湊的、不甚理想的方法來替代。這場「AI 發瘋」的插曲,生動地展示了當人類的系統化約束失效時,AI 協作是多麼脆弱。

修正與救贖:從錯誤中學習並進化系統

面對 AI 的失控,Cole Medin 並沒有選擇手動修正程式碼,而是回歸到他的 PIV 循環。他意識到問題的根源在於「計畫」本身,因此他重新與 AI 溝通,強制其生成一份更簡潔、更聚焦的計畫。

這個過程體現了他另一個核心理念: 「每一次的錯誤,都是一個進化你系統的機會。」

與其進行一次性的修補,不如優化整個工作流程,確保同樣的錯誤不再發生。經過幾輪迭代與修正,新的、簡潔的計畫終於讓 AI 回到正軌。直播的最後,這個 AI 助理成功地被打造出來,不僅能夠運作,還能:

  • 在聊天介面中流暢對話。
  • 準確地從 Superbase 知識庫中檢索相關資訊。
  • 提供附有 可點擊 YouTube 時間戳 的引用來源,將使用者直接導向影片中的特定片段。

儘管答案的流暢度仍有待改進,但核心功能已經完美實現,證明了這套方法的最終有效性。

結論:與AI協作的真實面貌

Cole Medin 的這場直播,撕開了 AI 寫程式的神秘面紗。它告訴我們,與 AI 的高效協作並非一場輕鬆的對話,而是一門嚴謹的工程科學。人類的角色不再是單純的「程式設計師」,而更像是「系統架構師」——負責設計流程、定義規則、驗證結果,並在 AI 偏離軌道時將其拉回。

PIV 循環這樣的框架,正是為了應對 AI 的不確定性而生。這場直播的價值,不在於展示了一個完美的 AI,而在於揭示了通往成功路上所有真實的混亂、挫折與最終的突破。這才是未來人機協作最真實的樣貌。

參考資料: https://www.youtube.com/watch?v=ZHcXavLTA5s

Read more

流量三溫層:為什麼你辛苦引進的人潮,最後都留不住?

流量本身不是目的,讓流量「回來」才是 這幾個月在做產品推廣,我終於搞懂一件事:流量本身不是目的,讓流量「回來」才是。 很多人以為只要有人潮湧進來就成功了,但事實上,那些衝著某篇爆文或某個推薦進來的訪客,絕大多數都是一次性的。 他們來了、看了、走了,然後再也找不到回來的路。 流量的三個溫度 在開始談怎麼留住人之前,先理解一下流量的本質。 我把流量分成三種溫度。 第一種是「冷流量」,這群人完全不認識你,撬動他們通常要靠廣告,而且花費不小。 第二種是「溫流量」,他們可能看過你的內容、聽過你的名字,有點興趣願意點進來看看。 第三種是「熱流量」,他們已經對你有信任、有意圖,這群人最值錢。 社群爆發帶來的是「溫流量」 如果你在社群上某篇內容突然爆了,帶進來的通常是溫流量。 這群人品質其實不錯,他們是被內容吸引、主動點進來的。 但問題是,他們只是「路過」,還沒有建立任何連結。 如果你是靠廣告獲取流量,狀況又不一樣了。

By andy