Google 最新 AI 模型 Nano Banana Pro 實測:9 大神級功能顛覆影像編輯,Midjourney 地位不保?
繼 Gemini 3 推出後,Google 再次無預警投下震撼彈,發布了全新的 AI 影像模型「Nano Banana Pro」。知名科技 YouTuber Matt Wolfe 獲得了為期一週的獨家早期測試權,並深入剖析了這款模型的驚人能力。這不只是一款單純的圖像生成工具,而是一個整合了設計、編輯、風格轉換於一身的「全能創意引擎」,其強大的編輯功能,可能將徹底改變 AI 影像領域的遊戲規則。
「Nano Banana Pro」實際上是建立在 Google 最頂尖的 Gemini 3 Pro 影像模型之上,旨在將 AI 影像創作的品質、可控性與易用性提升到全新層次。Google 正以前所未有的規模將其部署到旗下所有平台:
- 一般使用者: Gemini App 中將直接內建 Nano Banana Pro。
- 專業用戶與企業: Google Slides、Google Ads、Gemini API、AI Studio、Vertex AI 等專業工具都將獲得升級。
- 開發者: 可透過 Gemini API 和全新的 IDE「Anti-gravity」使用其強大功能。
此外,Google 還推出一項關鍵技術「SynthID」,這是一種隱形浮水印。使用者可以上傳任何圖片到 Gemini App,詢問「這張圖是 Google AI 生成的嗎?」,系統能立即辨識。對於 Google AI Ultra 付費使用者,可見的浮水印將被移除,只留下隱形的 SynthID,確保了圖片的真實性與可追溯性,同時保持畫面的乾淨。
不只是畫圖!9 大實測功能展現驚人實力
Matt Wolfe 透過一系列實測,展示了 Nano Banana Pro 的九大核心能力,證明了它遠超「畫一張漂亮圖片」的範疇。
1. 精準的多語言文字渲染 過去 AI 算圖最弱的環節就是文字,但 Nano Banana Pro 徹底解決了這個痛點。在測試中,它不僅能生成包含金屬、毛皮、玻璃等超擬真材質的「WOLF」多國語言 Logo,更能製作出排版精美、日英雙語並存的咖啡館菜單。Matt Wolfe 驚訝地表示:「即使是描述成分的極小字體,也完全清晰可讀,沒有任何拼寫錯誤。」
2. 資訊圖表與圖像標註 使用者只需上傳一張照片,例如聖地牙哥教士隊主場 Petco Park 的空拍圖,並下達指令:「將這張照片變成一張詳細的教育海報,解釋這個地點的歷史、地質和有趣的事實。」模型便能自動研究並生成一張包含精確文字標註的資訊圖表。雖然偶爾箭頭指向會有些許誤差,但其整合圖像理解與資訊檢索的能力已相當驚人。
3. 塗鴉即指令的直觀編輯 這項功能讓影像編輯變得像在畫布上塗鴉一樣簡單。使用者可以直接在圖片上圈選區域、畫出草圖,並用文字指令要求 AI 進行修改。例如,在照片背景畫一個火柴人,AI 就能生成一個逼真的綠髮巨人;或是在 Apple Vision Pro 的產品圖上畫出犄角,AI 就能生成一張看起來像官方出品的「惡魔角」版行銷圖。
4. 高達 6 張圖片的無縫融合 模型能將最多 6 張風格迥異的圖片融合成一張具有單一主題的全新創作。測試中,Matt Wolfe 結合了狗、衝浪板、城市夜景、霓虹燈招牌和沙漠公路等五張圖片,成功創造出一張充滿科幻公路電影風格的電影海報,所有元素都自然地融合在一起。
5. 從草圖到擬真產品的快速原型 AI 能先根據指令生成一張未來科技產品的鉛筆素描,例如一款名為「Agus」的健康環境監測器。接著,使用者能將這張草圖回傳給 AI,並要求:「將這張草圖轉換為一張照片般逼真的 3D 渲染圖。」AI 隨即生成了一張包含材質、光影都極為真實的產品圖,大幅縮短了概念設計的流程。
6. 一鍵生成完整品牌指南 對於行銷人員和設計師來說,這項功能極具價值。只要給予一個虛構的公司名稱,例如「SkySip」,AI 就能在幾秒內生成一套完整的迷你品牌指南,包含:Logo 設計、主色調色票、推薦字體,以及多款瓶身包裝的樣品模型。
7. 保持構圖一致的任意長寬比 Nano Banana Pro 在處理不同長寬比的圖片時,能完美保持主體構圖的一致性。無論是生成 16:9、9:16 還是 1:1 的風景照,或是將現有照片從 9:16 拓展為 16:9,AI 都能智慧補完畫面,且主體不會變形。
8. 驚豔的藝術風格轉移 使用者可以上傳一張風格獨特的圖片(如水彩畫)和一張普通照片,指令 AI 將前者的藝術風格應用於後者。實測中,AI 成功將水彩畫的筆觸、紋理甚至色調(藍色與橘色)完美複製到一張科技會議的照片上,同時保持了人物臉部細節的清晰可辨。
9. 跨時空的照片風格重塑 這項功能可以將一張普通的團體照,重塑成特定時代或風格的樣貌。Matt Wolfe 將一張與朋友們的合照,成功轉換成一張「80 年代復古合成器流行樂團」的專輯封面,從服裝、髮型到霓虹燈光,都充滿了時代感。
編輯之王:Nano Banana Pro 的真正優勢與挑戰
經過全面測試,Matt Wolfe 得出結論:「這絕對是我見過市場上最強大的『影像編輯』模型。」他認為,雖然在純粹的圖像生成方面,市面上或許還有其他強大的競爭者,但在整合文字、塗鴉、多圖像融合等複雜編輯任務上,Nano Banana Pro 目前無人能及。
然而,模型也並非完美無缺。在處理人數過多的團體照進行風格重塑時,AI 會隨機選擇幾個人進行改造,無法兼顧到所有人。但瑕不掩瑜,Google 這次的發布,顯然是將 AI 影像的戰場從「生成」推向了更具實用價值的「編輯與整合」層次,這將對 Adobe Photoshop 等傳統編輯軟體和 Midjourney 等生成工具構成巨大挑戰。
參考資料: https://www.youtube.com/watch?v=2jkpEGk6hDE