Google 發表史上最狂 AI 繪圖模型:實測 6 張照片融合、塗鴉變傑作,Photoshop 要緊張了?

Google 發表史上最狂 AI 繪圖模型:實測 6 張照片融合、塗鴉變傑作,Photoshop 要緊張了?

Google 再次震撼了 AI 領域,在 Gemini 3 剛推出不久,又無預警地發表了一款全新的 AI 圖像模型,內部代號為「Nano Banana Pro」(基於 Gemini 3 Pro image 技術打造)。這款模型不僅僅是生成漂亮圖片的工具,更像是一個全能的創意引擎,旨在讓 AI 圖像的生成、編輯與控制能力提升到前所未有的高度。從海報設計、產品原型到風格轉移,Google 的野心是將這項技術全面融入其生態系統的每一個角落。

Google 正計畫將這款強大的新模型部署到旗下幾乎所有平台,這是一次史無前例的全面升級。

對於一般消費者和學生,它將內建於 Gemini App 中,免費用戶可享有限額的 Pro 級生成次數。 對於美國的 Google AI Pro 和 Ultra 訂閱者,它將直接強化搜尋功能的 AI 模式。 對於 Workspace 客戶,它將直接整合進 Google Slides,大幅提升簡報製作效率。 對於廣告商,Google Ads 內的圖像生成工具也將全面升級,讓廣告素材製作更即時、更具創意。 對於開發者和企業,新模型將透過 Gemini API、AI Studio 及全新的 IDE「Anti-gravity」提供,讓大型組織能建立大規模的自動化創意工作流程。

精準文字與圖表生成:不只是裝飾,更是資訊的載體

過去 AI 生成圖像中的文字經常出現拼寫錯誤或胡言亂語,但新模型徹底解決了這個痛點。在實測中,它能完美生成多語言的 Logo 設計,例如將「狼」這個詞以俄文、日文漢字和義大利文,並分別用金屬、狼毛和玻璃等超現實材質呈現。

更驚人的是,在生成一張英日雙語的咖啡館菜單時,它不僅排版極簡優美,連最細微的成分說明文字都拼寫得一字不差。測試者表示:「過去在 AI 圖片中,這麼小的文字通常只是亂碼,但這次,即使是描述成分的微小文字也都非常連貫清晰。」

此外,它還能將現有照片轉化為資訊圖表。測試者上傳一張聖地牙哥教士隊主場 Petco Park 的照片,要求 AI 將其轉變為一張解釋其歷史、地質和趣聞的教育海報。AI 不僅準確標示了建築、地標,還自行研究並添加了相關的歷史和地質資訊,雖然部分箭頭指向稍有偏差,但其資訊整合與生成能力已令人讚嘆。

從塗鴉到現實:直接在圖片上實現你的瘋狂點子

新模型最有趣的突破之一,是允許用戶直接在圖片上塗鴉,並將這些潦草的筆跡轉化為逼真的圖像元素。測試者在一張活動照片的背景隨手畫了一個巨大的火柴人,並下指令「讓這個巨人看起來更逼真」。AI 隨即生成了一個有著綠色頭髮、表情生動的巨大人物,完美融入背景,效果令人捧腹又印象深刻。

這項功能在產品設計上同樣強大。測試者在一張 Apple Vision Pro 的照片上畫了犄角和更突出的眼睛,並要求 AI「根據我的塗鴉重新設計這款產品,讓它看起來像一張精美的行銷圖」,結果 AI 完美實現了這個天馬行空的設計。

革命性的圖像融合:一次混合六張圖片,創造全新世界

新模型的圖像融合能力達到了新的高度,最多可以一次性混合六張不同的圖片,創造出一個全新的、風格統一的場景。測試者將狗、衝浪板、聖地牙哥天際線、霓虹燈招牌和一條荒涼公路共五張照片丟給 AI,指令是「將這五張照片融合成一張具有科幻公路電影感的電影海報」。

結果令人驚豔,AI 產出了一張極具故事感的海報,不僅完美融合了所有元素——狗坐在致敬《回到未來》的車上,車頂綁著衝浪板,背景是城市天際線和公路——甚至還自動生成了電影標題《The Long Ride Home》和上映年份「Summer 2050」。

風格無縫轉移:一鍵複製藝術風格與電影色調

風格轉移是另一個重大升級。用戶可以上傳一張具有特定藝術風格的圖片(如水彩畫),再上傳一張自己的照片,要求 AI 將前者的風格應用於後者。實測中,AI 成功地將水彩畫的筆觸、紋理甚至色調(如藍色和橘色)完美複製到一張科技會議的照片上,同時保持了人物臉部特徵的清晰可辨。

測試者評價道:「這真的太令人印象深刻了。它不僅複製了風格,甚至連色調都一併轉移,效果好得驚人。」同樣的技術也適用於電影色調,AI 能夠提取《駭客任務》經典的綠色濾鏡風格,並將其應用於一張城市風景照,使其看起來就像電影中的一個場景。

結論:AI 圖像「編輯」的王者誕生

總結來說,Google 這款由 Gemini 驅動的新圖像模型,雖然在純粹的圖像「生成」品質上或許還有其他競爭者,但在「編輯」與「整合創意」方面,它無疑是目前市場上最強大的工具。它將圖像生成的門檻從「詠唱咒語(Prompt)」降低到了「直覺操作(塗鴉、融合)」。

隨著這項技術逐步部署到 Google 的各大平台,從學生做報告、行銷人員做廣告,到設計師發想創意,都將迎來一場效率革命。可以預見,不久的將來,這項技術也將被整合到 Adobe Photoshop、Canva 等主流創意軟體中,屆時,不懂複雜軟體操作的普通人,也能僅靠文字和簡單的塗鴉,完成專業級的圖像編輯工作。

參考資料:https://www.youtube.com/watch?v=2jkpEGk6hDE

Read more

長春藤名校只收百萬富翁?AI 將淘汰 80% 的不適任教師?三位專家的震撼預言

長春藤名校只收百萬富翁?AI 將淘汰 80% 的不適任教師?三位專家的震撼預言

在一場關於 AI 與教育未來的深度對談中,Minerva 大學創辦人 Ben Nelson、史丹佛大學未來實驗室的 Isabelle Hau,以及資深教育家 Esther Wojcicki 揭示了教育體系面臨的巨大挑戰與變革。他們不僅探討了 AI 作為個人化導師的潛力,更毫不留情地揭露了現行教育系統中的「魔鬼交易」,並預言在 AI 時代,傳統學位價值將崩潰,甚至高達 80% 的教師可能面臨被淘汰的殘酷現實。 Esther Wojcicki 興奮地指出 AI 的最大潛力在於成為「每個學生的專屬家教」。她說:「學生可以反覆提問,不必擔心自己看起來很笨,並且能立刻得到答案。我認為所有老師都應該在課堂上使用 AI 作為輔助導師。」 然而,Ben Nelson 提出了截然不同的警告,他稱之為教育界的「魔鬼交易」。他一針見血地指出:「老師或教授與學生之間存在一種心照不宣的默契,那就是雙方做得越少,彼此就越開心。而

By andy
Spotify收購的男人揭露:AI正讓那些「不可能」的消費型創業起死回生

Spotify收購的男人揭露:AI正讓那些「不可能」的消費型創業起死回生

前Lightspeed Ventures合夥人、Podcast平台Anchor創辦人Mike McNano,在Y Combinator的最新訪談中,深入剖析了AI如何徹底顛覆消費性新創的遊戲規則。McNano不僅是將Anchor成功出售給Spotify的創業家,更是投資了Neurolink、xAI、Suno等傳奇公司的頂尖投資人。他指出,過去十年,許多消費性產品的創業點子因技術限制、發行困難而被判了死刑,但AI的出現,正讓這些「不可能」的機會起死回生。 McNano以他投資的爆紅AI音樂生成應用Suno為例,闡述了AI如何打破創意產業的舊有壁壘。他回憶道:「在AI出現之前,沒有任何技術能真正降低音樂創作的門檻。相機讓攝影普及,麥克風讓Podcasting普及,但音樂創作始終是專業人士的領域。」 Suno的核心理念,就如同當年的Instagram之於攝影。Instagram不僅讓人們能輕鬆拍出好看的照片,更提供了一個發行渠道。Suno則利用AI達成了同樣的目標:「現在有了AI,任何人都能創作音樂。」 McNano觀察到一個前所未見的用戶行為:「人們正在為自己創作音樂,然後自己

By andy
Google AI產品主管親身示範:如何在20分鐘內,用AI完成市場研究、規格書、原型到行銷影片!

Google AI產品主管親身示範:如何在20分鐘內,用AI完成市場研究、規格書、原型到行銷影片!

Google AI 產品主管 Marilyn Nika,一位在AI領域深耕多年的專家,親身揭示了一套顛覆傳統的產品管理工作流程。當眾多AI工具如雨後春筍般湧現時,她思考的不是AI是否會取代PM,而是「如何成為一名『AI賦能的產品經理』?」她利用一個「智慧冰箱」的 hypothetical 案例,展示如何在短短20分鐘內,完成過去需要數週才能完成的市場研究、產品規格書(PRD)、互動原型,甚至是行銷影片的完整流程,徹底改變了產品開發的遊戲規則。 傳統上,產品經理進行市場研究,需要依賴公司的用戶研究部門(UXR)或聘請外部機構,過程耗時且成本高昂。然而,Nika展示了如何利用 AI 工具 Perplexity 在幾分鐘內洞察全球用戶的想法。 她分享了一個獨特的技巧:不僅僅是搜尋網路,而是專門篩選「Reddit」上的討論與意見。她下的指令是:「家庭用戶會對智慧冰箱感興趣嗎?」AI迅速整理出正反兩方的觀點、常見疑慮和採用的障礙。 但真正的精髓在於下一步。Nika 指示 AI:「創造兩個代理人,

By andy
馬斯克驚天預言:3年後通縮,20年內工作消失,金錢將被「能源」取代!

馬斯克驚天預言:3年後通縮,20年內工作消失,金錢將被「能源」取代!

伊隆·馬斯克 (Elon Musk) 在一場深度訪談中,再次拋出了足以顛覆我們對未來所有想像的震撼觀點。這場對話不僅僅是關於科技,更是對人類文明未來走向的全面預測。從人工智慧(AI)將如何終結傳統工作,到金錢體系的徹底瓦解,再到我們可能身處的「模擬現實」,馬斯克描繪了一幅既令人興奮又充滿挑戰的未來藍圖。 當被問及社會從週休二日走向三日的趨勢時,馬斯克的回答遠超於此。他斷言,這場變革將是根本性的:「我的預測是,在不到20年的時間裡,工作將成為一種選擇(optional)。」他甚至認為,這個時間點可能縮短至10到15年。 這背後的核心驅動力是AI與機器人技術的指數級發展。馬斯克形容這是一場「超音速海嘯」(supersonic tsunami),其帶來的生產力提升將達到前所未有的高度。未來社會將不再是我們熟悉的「全民基本收入」(UBI),而是「全民高收入」(UHI, Universal High Income)。 他解釋道:「未來,工作將會像一種嗜好。就像今天你可以選擇在自家花園種菜,也可以去商店購買一樣。這將是一種選擇。」在這個世界裡,AI和機器人將滿足人類所有的商品和服務需求

By andy