至少就我而言,自從今年3月添加了本地圖像生成功能以來,Chatgpt一直在AI中統治圖像生成的棲息地,例如,像Studio Ghibili One一樣引發各種病毒圖像瘋狂。
從那時起,Google已經退後一步,但一直在慢慢地為自己的競爭對手(名為Nano Banana)工作。上週,它將其新的圖像編輯器添加到雙子座,並將其提供給所有人,現在我認為它已成為我最喜歡的圖像編輯器,甚至在Chatgpt上也是如此。這就是原因。
一個香蕉,兩個香蕉
顯然,Nano Banana的名稱是Google的Gemini 2.5 Flash Image模型在LMARENA排行榜上的匿名代號,並且隨著時間的流逝。
您可以通過雙子座應用程序以三種方式訪問納米香蕉,從提示欄中的下拉式工具菜單中選擇“創建圖像”(您知道它現在正在使用納米香蕉,因為“創建圖像”旁邊有一個新的香蕉圖標)。或者你可以去 Google的AI工作室 並在那裡使用它,或者您可以自己去 專用網站。
我整個週末都一直在和Nanao Banana一起玩,可以報告在三個主要領域中它非常好:角色一致性,現實主義和圖像對圖像融合。
角色一致性
首先,讓我們看一下角色一致性。如果我要求Gemini 2.5 Flash“用歷史上準確的羅馬百夫長頭盔畫一隻貓”,它會產生這款宏偉的貓咪:
這也是一個很好的明亮,清晰的圖像。如果我說:“現在讓那隻貓出現在體育館裡”。它做到了,貓和頭盔看起來相同:
與Chatgpt一起,我說:“用歷史上準確的羅馬百夫長頭盔畫一隻貓”,它產生了:
它具有這種特徵性,更黑暗的感覺,看來Chatgpt似乎默認了,但它確實是一隻貓,戴著羅馬頭盔,儘管是一頭奇怪的貓。
當我要求它“現在讓那隻貓出現在體育館”時,它會產生:
如果仔細觀察,您將看到頭盔現在不同。納米香蕉看起來更好的一致性細節很少。
現實主義
如果我上傳了自己的照片(我在個人資料中使用了下面的圖片),請讓Gemini Flash 2.5把我放在山上,我得到一張實際上看起來像我的照片,在山上:
Chatgpt製作的圖像看起來像我的AI近似值(顯然增加了幾磅!):):
我不僅胖,而且圖像看起來不那麼真實。
結合圖像
納米香蕉可以以現實的方式將圖像結合在一起。例如,我上傳了自己在周末放置的一些圍欄面板,並要求Gemini將它們結合在一起,同時保持背景圖像相同。在雙子座的版本中,背景圖片根本沒有改變,它只是將我添加到其中:
相比之下,即使我要求Chatgpt保持背景相同,它也重現了與原始版本相似的背景版本,但我可以選擇差異。
更不用說它的版本顯然是由AI製作的。您可以說Chatgpt圖像更好地將框架作為圖片,但看起來並不那麼現實。
一個清晰的贏家
對我來說,Gemini現在比Chatgpt更有用,可以創建看起來真實的圖像。我認為這就是大多數人想要AI圖像的目標。所有這些都沒有提及雙子座中關於納米香蕉的最好的東西之一,這是很快的。
通常需要雙子座才能生成圖像,而changpt可以花費一分鐘才能製作圖像。有很多等待。
當然,像Midjourney這樣的專用圖像創建工具仍然是專業人士AI圖像生成的國王,但是您需要付費才能使用這些工具。如果想要非常快的事情並以最現實的方式完成工作,那麼對我來說,雙子座的納米香蕉是明顯的贏家。
您可能還喜歡
#我花了一個週末將雙子座的新納米香蕉圖像工具與chatgpt進行了比較 #還有一個清晰的贏家