隨著AI所生成的影象演變得越來越逼真,似乎“AI不會畫手”,已經是AI作品所剩下的最突出的弱點了。
無論是前段時間AI筆下風格各異的二次元美少女;
文中圖均源於網路
還是最近AI經過真人圖片訓練所生成的虛擬妹子;
就好像受到了古神的詛咒一樣,在每一位AI生成的美少女姣好面容的背後,都存在著一些瞥一眼就會不斷掉san的畸形手指,讓人瞬間就失去了想要進一步探索的慾望。
而“AI不會畫手”這回事兒,也曾是不少畫家們嘲諷AI的談資——
在此前我所報道過的“畫師們在Artstation平臺上集體抗議AI入侵”的事件中,“手指”,就是這些抗議的聲音中的一個重要的元素。
藝術家們用筆刷畫下了這些造型扭曲噁心的手指,用以回擊Artstation這一國外最大的藝術平臺默許AI入侵的行為。
——不過,AI不會畫手的“詛咒”似乎在最近被打破了。
上週,Midjourney 宣佈他們推出了第五代版本——Midjourney V5。
和前幾次迭代一樣,V5在影象質量、風格範圍和圖片紋理等等都有著一定程度的提升。
但這次大家發現了一個不一樣的地方:
AI終於學會畫手指了!
使用者發現,在更新V5之後,Midjourney渲染出影象中,人物的手指根根分明,甚至連紋路都栩栩如生,刻畫出了歲月的痕跡。
而更新後的AI也會如炫技一般,從不把手指遮遮掩掩地放在身後,而是擺在最顯眼的地方,讓你根本看不出什麼端倪。
不僅如此,如果你執意仔細研究這些AI所生成的手部細節的話,這些圖片也並不會讓你失望。
更精細的手部細節
在學會畫手的同時,使用新版本的大家發現——V5所生成的影象更加高清和逼真,甚至有的到了真假難辨的情況。
相信使用過Midjourney的觀眾都知道,在此之前,Midjourney生成的圖片總體看還是以奇幻風格為主的。
而如今Midjourney V5所生成的圖片,已經達到了照片級別的程度。
V5生成的這張AI情侶照片
不僅會畫手,新版本在人臉的精細程度上也更上一層樓。
如果誰要在不經意之間拿出這樣的圖,我想大部分人都會毫不懷疑的認為,這是照相機拍攝的吧。
就在Midjourney V5的推出炸裂全網之後,很快它生成的真假難辨的圖片,就引發了一次大規模的社會輿論。
從這週二開始,twitter上就流傳著一組“特朗普被逮捕”的圖片。
此前特朗普自稱正面臨刑事指控,可能於本週被捕,而這組圖片更是加大了群眾的可信度,一時間“特朗普被捕”的訊息火遍了全網。
不過很快就有人指出,這組圖片其實都是通過新版本的Midjourney生成的。
看來,在突破了手指的限制,擁有更好的影象質量之後,AI似乎真的難以與真實事物區分開來,開始在社會上混淆視聽了。
那麼,在AI的技術越來越成熟之後,AI真的是時候取代人類了嗎?
——先彆著急,就現在其他AI的表現來看,現在說“取代”可能還有些早了。
同樣是上週,在ChatGPT4推出的一天後,百度在釋出會上公佈了他們自研的AI工具“文心一言”。
在官方的介紹中,文心一言除了可以提供類似於ChatGPT的對話問答功能外,還支援生成圖片、視訊等功能。
然而,作為國內第一個對標ChatGPT的AIGC,它的表現卻並不是那麼優秀。
讓人“大跌眼鏡”的,主要是在文心一言的“文生圖”功能上。
雖說是百度擁有國內最大的中文搜尋引擎,但文心一言就好像聽不懂中國話一樣,只能夠理解字面意思,生成讓所有中國人瞳孔炸裂的圖片——
就比如說,“車水馬龍”是什麼樣的場面?
或許很多人腦內可能已經描繪出一副車馬如流水一般的繁華景象——不過在AI的眼裡,它所想的,就是這樣一個有車、水、龍,但唯獨沒有馬的奇幻場景。
再比如說“胸有成竹”這個成語,大家應該都明白是什麼意思吧。
然而在AI精確到每一個字的理解下,這位兄弟的胸上還真的長了根竹子。
或許通過上面兩張圖片,你已經掌握了文心一言的繪圖心得,而在看到下面這張“青梅竹馬”,你也就不奇怪了。
可能有的人覺得,對於現代的AI來說,要去理解古人幾千年琢磨出來的成語可能有些困難了。
但是,更奇葩的來了——AI對於現代詞彙的理解,我感覺還不如成語呢。
來幾個食物舉例吧。
AI生成的“魚香肉絲”可真的別有一番風味。
我想密恐人士可能在看到這張圖之後,都無法直視這道菜了。
再來上個“紅燒獅子頭”。
不過吃了這道菜,你接下來可能就要帶上一副銀手銬了。
如果你還沉浸在被“魚香肉絲”給震驚到的餘韻中,那麼下面這道“菜”,絕對能夠再一次震撼你的視覺神經——
文心一言是懂夫妻肺片的
好吧,看多了這些稍顯詭異的圖片,再來看看可愛的小動物們吧。
就比如說這盤“松鼠鱖魚”……不對啊,這是分明就是松鼠“撅”魚吧。
雖然理解不了除了字面意思上的其他含義,但文心一言在某些方面還是展現了它強大的學習和模仿能力。
就比如你讓它生成一張35歲的資深程式設計師的畫像——
嗯,的確沒毛病。
別的不說,在看了這麼多“乍一看有點懵,但仔細琢磨還真的挺形象”的圖片之後,我只覺得:
用文心一言來玩你畫我猜應該挺有意思的。
可以說,這次的文心一言尚不成熟的文生圖程式,已經成為了繼前段時間簡易版圖片生成AI軟體之後的又一個能夠承包一整天笑點的AI樂子。
在百度的文心一言的文生圖功能遭到群嘲之後,也有不少人開始質疑:
“從文心一言生成的圖片看,它根本就是將中文先翻譯成英文,再通過英文輸入生成圖片的,不會是套了其他AI繪圖工具的殼吧。”
在網友們的實踐中,能夠很明顯地看出文心一言將中文翻譯成英文的步驟:
就比如說讓它畫個“起重機”,AI生成了一個完全詞不達意的丹頂鶴——
實際上起重機在英文語境中,和鶴共用一個“crane”的單詞,所以在這樣扭曲的理解下,圖片中的工地多了只丹頂鶴。
道理我都懂,為什麼這隻鶴這麼大?
再就是如果你輸入“王冰冰”這個人名,生成的也不是本人。AI將中文翻譯成了“King”和“Ice”兩個單詞,於是在圖中你就可以看到一位“冰雪國王”。
對於網友們對文心一言套殼造假的質疑,百度在23號給出了回覆,表示:
“文心一言的文生圖能力來自於文心跨模大模型ERNIE-ViLG。而在訓練中我們使用的是全球網際網路公開資料,符合行業慣例。”
也就是說,文心一言確實把輸入的中文句子,通過機器翻譯生成了單詞。
但這並不是網友們口中說的“套殼”,而是因為目前開源的圖文資料大部分為英文內容。
百度的畫圖AI採用了應為標註的開源圖片素材進行訓練,而這樣的訓練需要將提示詞中翻英,這才導致了上面這些“圖不達意”的圖片產生。
在文心一言鬧了個大笑話之後,百度表示:
“文心一言正在大家的使用過程中不斷學習和成長,也請大家給自研技術一些信心和時間。”希望在不久之後,我們能夠看到文心一言全新的面孔。
在我看來,在AI不斷突破人類上限的技術衝擊下,像百度這樣搶先加入研究AI的行列的方式也是無可厚非的。
只不過,可能還要再給文心一言一些時間吧。
事實上,如果你也關注AI這方面的新聞的話,你會發現——
最近這段時日,有太多廠商都開始爭先恐後地將AI技術納入自己的發展目標了:
3月22日,無數美工、設計師的生產力工具Adobe,也在前幾日宣佈加入AI的戰局。
在Adobe Summit使用者大會上,Adobe釋出了“Adobe Firefly”的私人測試版AI工具,利用這個工具,僅僅輸入文字,就可以協助創造者完成影象生成、模型構建、影象編輯以及圖形變體等各種任務。
Adobe Firefly強大的“塗鴉成畫”功能
除了設計領域,遊戲行業也沒有落後追隨AI的腳步。
3月23日,育碧釋出了一款新的人工智慧工具“Ubisoft Ghostwriter”,並且生成這款AI將用於生成觸發NPC臺詞和周圍群眾聊天內容的初稿。
育碧表示AI工具的誕生能夠讓開發團隊騰出更多的時間,來處理更為重要的元素:“Ghostwriter 是與敘事團隊共同建立的,旨在幫助他們更快更有效地完成重複性任務,讓他們有更多時間和自由去處理遊戲的敘事、角色和劇情。”
在3月21日晚,英偉達的第14次GTC大會上,英偉達的創始人黃仁勳就發表了一段長達78分鐘的演講《切勿錯過AI的決定性時刻》。
在演講時,他多次強調——“AI已進入iPhone時刻”。
可以預見的是,隨著AI滲透到各個領域,AI技術帶來的工作形式的轉變,將會影響到各行各業。
這兩天一直掛在小紅書熱搜上的,就是有關AI顛覆職業的內容。
隨著AI生成影象的精度提升,將圖片中的服裝轉移到AI模特的“一鍵換裝”功能正在成為了討論的熱點。
從生成的圖片來看,AI模特身上的衣服效果和原圖並沒什麼大的區別,甚至還能夠自由變換想要的姿勢。
真人模特(左) AI模特(右)
對於店家來說,AI模特的誕生能夠給他們帶來更多的便利。不僅僅是省錢,還能夠提高效率,這樣一鍵生成的方式能夠讓他們隨時隨地的上架新的的產品。
然而,如果AI模特真的得到廣泛應用,我想不止是會影響到模特的行業,對攝影師、化妝師以及場地租賃人員等等行業來說,都會帶來不小的衝擊。
雖然我不確定AI是否能完全替代這些創造型的工作,但我知道,隨著AI滲透到各行各業,一個全面應用AI的時代已經逐漸到來。
也許目前AI仍未波及到所有的行業,但如果不想被AI所取代的話,我想每個人都要做好“駕馭”它的準備了。



