Google 最新 AI 模型 Nano Banana Pro 實測:9 大神級功能顛覆影像編輯,Midjourney 地位不保?

Google 最新 AI 模型 Nano Banana Pro 實測:9 大神級功能顛覆影像編輯,Midjourney 地位不保?

繼 Gemini 3 推出後,Google 再次無預警投下震撼彈,發布了全新的 AI 影像模型「Nano Banana Pro」。知名科技 YouTuber Matt Wolfe 獲得了為期一週的獨家早期測試權,並深入剖析了這款模型的驚人能力。這不只是一款單純的圖像生成工具,而是一個整合了設計、編輯、風格轉換於一身的「全能創意引擎」,其強大的編輯功能,可能將徹底改變 AI 影像領域的遊戲規則。

「Nano Banana Pro」實際上是建立在 Google 最頂尖的 Gemini 3 Pro 影像模型之上,旨在將 AI 影像創作的品質、可控性與易用性提升到全新層次。Google 正以前所未有的規模將其部署到旗下所有平台:

  • 一般使用者: Gemini App 中將直接內建 Nano Banana Pro。
  • 專業用戶與企業: Google Slides、Google Ads、Gemini API、AI Studio、Vertex AI 等專業工具都將獲得升級。
  • 開發者: 可透過 Gemini API 和全新的 IDE「Anti-gravity」使用其強大功能。

此外,Google 還推出一項關鍵技術「SynthID」,這是一種隱形浮水印。使用者可以上傳任何圖片到 Gemini App,詢問「這張圖是 Google AI 生成的嗎?」,系統能立即辨識。對於 Google AI Ultra 付費使用者,可見的浮水印將被移除,只留下隱形的 SynthID,確保了圖片的真實性與可追溯性,同時保持畫面的乾淨。

不只是畫圖!9 大實測功能展現驚人實力

Matt Wolfe 透過一系列實測,展示了 Nano Banana Pro 的九大核心能力,證明了它遠超「畫一張漂亮圖片」的範疇。

1. 精準的多語言文字渲染 過去 AI 算圖最弱的環節就是文字,但 Nano Banana Pro 徹底解決了這個痛點。在測試中,它不僅能生成包含金屬、毛皮、玻璃等超擬真材質的「WOLF」多國語言 Logo,更能製作出排版精美、日英雙語並存的咖啡館菜單。Matt Wolfe 驚訝地表示:「即使是描述成分的極小字體,也完全清晰可讀,沒有任何拼寫錯誤。」

2. 資訊圖表與圖像標註 使用者只需上傳一張照片,例如聖地牙哥教士隊主場 Petco Park 的空拍圖,並下達指令:「將這張照片變成一張詳細的教育海報,解釋這個地點的歷史、地質和有趣的事實。」模型便能自動研究並生成一張包含精確文字標註的資訊圖表。雖然偶爾箭頭指向會有些許誤差,但其整合圖像理解與資訊檢索的能力已相當驚人。

3. 塗鴉即指令的直觀編輯 這項功能讓影像編輯變得像在畫布上塗鴉一樣簡單。使用者可以直接在圖片上圈選區域、畫出草圖,並用文字指令要求 AI 進行修改。例如,在照片背景畫一個火柴人,AI 就能生成一個逼真的綠髮巨人;或是在 Apple Vision Pro 的產品圖上畫出犄角,AI 就能生成一張看起來像官方出品的「惡魔角」版行銷圖。

4. 高達 6 張圖片的無縫融合 模型能將最多 6 張風格迥異的圖片融合成一張具有單一主題的全新創作。測試中,Matt Wolfe 結合了狗、衝浪板、城市夜景、霓虹燈招牌和沙漠公路等五張圖片,成功創造出一張充滿科幻公路電影風格的電影海報,所有元素都自然地融合在一起。

5. 從草圖到擬真產品的快速原型 AI 能先根據指令生成一張未來科技產品的鉛筆素描,例如一款名為「Agus」的健康環境監測器。接著,使用者能將這張草圖回傳給 AI,並要求:「將這張草圖轉換為一張照片般逼真的 3D 渲染圖。」AI 隨即生成了一張包含材質、光影都極為真實的產品圖,大幅縮短了概念設計的流程。

6. 一鍵生成完整品牌指南 對於行銷人員和設計師來說,這項功能極具價值。只要給予一個虛構的公司名稱,例如「SkySip」,AI 就能在幾秒內生成一套完整的迷你品牌指南,包含:Logo 設計、主色調色票、推薦字體,以及多款瓶身包裝的樣品模型。

7. 保持構圖一致的任意長寬比 Nano Banana Pro 在處理不同長寬比的圖片時,能完美保持主體構圖的一致性。無論是生成 16:9、9:16 還是 1:1 的風景照,或是將現有照片從 9:16 拓展為 16:9,AI 都能智慧補完畫面,且主體不會變形。

8. 驚豔的藝術風格轉移 使用者可以上傳一張風格獨特的圖片(如水彩畫)和一張普通照片,指令 AI 將前者的藝術風格應用於後者。實測中,AI 成功將水彩畫的筆觸、紋理甚至色調(藍色與橘色)完美複製到一張科技會議的照片上,同時保持了人物臉部細節的清晰可辨。

9. 跨時空的照片風格重塑 這項功能可以將一張普通的團體照,重塑成特定時代或風格的樣貌。Matt Wolfe 將一張與朋友們的合照,成功轉換成一張「80 年代復古合成器流行樂團」的專輯封面,從服裝、髮型到霓虹燈光,都充滿了時代感。

編輯之王:Nano Banana Pro 的真正優勢與挑戰

經過全面測試,Matt Wolfe 得出結論:「這絕對是我見過市場上最強大的『影像編輯』模型。」他認為,雖然在純粹的圖像生成方面,市面上或許還有其他強大的競爭者,但在整合文字、塗鴉、多圖像融合等複雜編輯任務上,Nano Banana Pro 目前無人能及。

然而,模型也並非完美無缺。在處理人數過多的團體照進行風格重塑時,AI 會隨機選擇幾個人進行改造,無法兼顧到所有人。但瑕不掩瑜,Google 這次的發布,顯然是將 AI 影像的戰場從「生成」推向了更具實用價值的「編輯與整合」層次,這將對 Adobe Photoshop 等傳統編輯軟體和 Midjourney 等生成工具構成巨大挑戰。

參考資料: https://www.youtube.com/watch?v=2jkpEGk6hDE

Read more

長春藤名校只收百萬富翁?AI 將淘汰 80% 的不適任教師?三位專家的震撼預言

長春藤名校只收百萬富翁?AI 將淘汰 80% 的不適任教師?三位專家的震撼預言

在一場關於 AI 與教育未來的深度對談中,Minerva 大學創辦人 Ben Nelson、史丹佛大學未來實驗室的 Isabelle Hau,以及資深教育家 Esther Wojcicki 揭示了教育體系面臨的巨大挑戰與變革。他們不僅探討了 AI 作為個人化導師的潛力,更毫不留情地揭露了現行教育系統中的「魔鬼交易」,並預言在 AI 時代,傳統學位價值將崩潰,甚至高達 80% 的教師可能面臨被淘汰的殘酷現實。 Esther Wojcicki 興奮地指出 AI 的最大潛力在於成為「每個學生的專屬家教」。她說:「學生可以反覆提問,不必擔心自己看起來很笨,並且能立刻得到答案。我認為所有老師都應該在課堂上使用 AI 作為輔助導師。」 然而,Ben Nelson 提出了截然不同的警告,他稱之為教育界的「魔鬼交易」。他一針見血地指出:「老師或教授與學生之間存在一種心照不宣的默契,那就是雙方做得越少,彼此就越開心。而

By andy
Spotify收購的男人揭露:AI正讓那些「不可能」的消費型創業起死回生

Spotify收購的男人揭露:AI正讓那些「不可能」的消費型創業起死回生

前Lightspeed Ventures合夥人、Podcast平台Anchor創辦人Mike McNano,在Y Combinator的最新訪談中,深入剖析了AI如何徹底顛覆消費性新創的遊戲規則。McNano不僅是將Anchor成功出售給Spotify的創業家,更是投資了Neurolink、xAI、Suno等傳奇公司的頂尖投資人。他指出,過去十年,許多消費性產品的創業點子因技術限制、發行困難而被判了死刑,但AI的出現,正讓這些「不可能」的機會起死回生。 McNano以他投資的爆紅AI音樂生成應用Suno為例,闡述了AI如何打破創意產業的舊有壁壘。他回憶道:「在AI出現之前,沒有任何技術能真正降低音樂創作的門檻。相機讓攝影普及,麥克風讓Podcasting普及,但音樂創作始終是專業人士的領域。」 Suno的核心理念,就如同當年的Instagram之於攝影。Instagram不僅讓人們能輕鬆拍出好看的照片,更提供了一個發行渠道。Suno則利用AI達成了同樣的目標:「現在有了AI,任何人都能創作音樂。」 McNano觀察到一個前所未見的用戶行為:「人們正在為自己創作音樂,然後自己

By andy
Google AI產品主管親身示範:如何在20分鐘內,用AI完成市場研究、規格書、原型到行銷影片!

Google AI產品主管親身示範:如何在20分鐘內,用AI完成市場研究、規格書、原型到行銷影片!

Google AI 產品主管 Marilyn Nika,一位在AI領域深耕多年的專家,親身揭示了一套顛覆傳統的產品管理工作流程。當眾多AI工具如雨後春筍般湧現時,她思考的不是AI是否會取代PM,而是「如何成為一名『AI賦能的產品經理』?」她利用一個「智慧冰箱」的 hypothetical 案例,展示如何在短短20分鐘內,完成過去需要數週才能完成的市場研究、產品規格書(PRD)、互動原型,甚至是行銷影片的完整流程,徹底改變了產品開發的遊戲規則。 傳統上,產品經理進行市場研究,需要依賴公司的用戶研究部門(UXR)或聘請外部機構,過程耗時且成本高昂。然而,Nika展示了如何利用 AI 工具 Perplexity 在幾分鐘內洞察全球用戶的想法。 她分享了一個獨特的技巧:不僅僅是搜尋網路,而是專門篩選「Reddit」上的討論與意見。她下的指令是:「家庭用戶會對智慧冰箱感興趣嗎?」AI迅速整理出正反兩方的觀點、常見疑慮和採用的障礙。 但真正的精髓在於下一步。Nika 指示 AI:「創造兩個代理人,

By andy
馬斯克驚天預言:3年後通縮,20年內工作消失,金錢將被「能源」取代!

馬斯克驚天預言:3年後通縮,20年內工作消失,金錢將被「能源」取代!

伊隆·馬斯克 (Elon Musk) 在一場深度訪談中,再次拋出了足以顛覆我們對未來所有想像的震撼觀點。這場對話不僅僅是關於科技,更是對人類文明未來走向的全面預測。從人工智慧(AI)將如何終結傳統工作,到金錢體系的徹底瓦解,再到我們可能身處的「模擬現實」,馬斯克描繪了一幅既令人興奮又充滿挑戰的未來藍圖。 當被問及社會從週休二日走向三日的趨勢時,馬斯克的回答遠超於此。他斷言,這場變革將是根本性的:「我的預測是,在不到20年的時間裡,工作將成為一種選擇(optional)。」他甚至認為,這個時間點可能縮短至10到15年。 這背後的核心驅動力是AI與機器人技術的指數級發展。馬斯克形容這是一場「超音速海嘯」(supersonic tsunami),其帶來的生產力提升將達到前所未有的高度。未來社會將不再是我們熟悉的「全民基本收入」(UBI),而是「全民高收入」(UHI, Universal High Income)。 他解釋道:「未來,工作將會像一種嗜好。就像今天你可以選擇在自家花園種菜,也可以去商店購買一樣。這將是一種選擇。」在這個世界裡,AI和機器人將滿足人類所有的商品和服務需求

By andy