前兩天,,有同事在編輯部的車車群里來了一組圖:如圖示▼
向左滑動(dòng)平時(shí)毫無聲息的群里,頓時(shí)人潮涌動(dòng),大家紛紛指責(zé)他不厚道,留圖不留種。
在眾人的好言勸說(威逼利誘)下,,他留下了一串藍(lán)色的鏈接。
嗯,?AI!你跟我說 這些圖全是 AI 畫的,?,?一張真人都沒有?,?,?鏈接里的 Civitai 是一個(gè) AI 畫圖模型分享網(wǎng)站,有大量來自世界各地的煉丹師(調(diào)試 AI 的人)把自己訓(xùn)練的 AI 模型分享上來,。
不過這部分內(nèi)容估計(jì)大家已經(jīng)不陌生了,,我就不多贅述了。之所以老調(diào)重談,,是因?yàn)槲④浲?AI 畫圖圈子里扔了個(gè)新東西:LoRA,。
說人話就是,以前的 AI 畫圖模型就像是焊死的一體機(jī),。不論是換硬盤,、顯卡還是內(nèi)存,都得整塊主板一起換,,整體重裝,。
但是微軟搞出來的這個(gè) LoRA,把 AI 畫圖的模型給 “模塊化” 了,,可以單獨(dú)訓(xùn)練背景,、人臉、風(fēng)格等等,。等真正畫圖的時(shí)候,,再像拼積木一樣,把好多 LoRA 模型拼起來就好,。這么做的好處顯而易見:自由度更高,,并且對(duì)資源的開銷更小,。
以 Civitai 上的 DingZhenLora 模型為例,作者只是用15張丁真的照片,,就生成了一個(gè)效果還行的丁真 CosplayAI,,而且它的模型大小更是不到150MB。放在以前,,這幾個(gè)數(shù)后面至少得加個(gè) 0,。
更厲害的是,作者 “武當(dāng)山真人” 只用 3070 跑了 20 分鐘,,就生成了這個(gè)模型,。。,。
十幾張?jiān)紭颖荆?070的算力只需要不到半小時(shí),。。,。訓(xùn)練 AI 的門檻,,已經(jīng)這么低了嗎!還不趕緊親自試一下,!從米羅那薅幾十張美照,,然后找個(gè)3070Ti的電腦,開煉,!米羅美照▼
確實(shí)只用了半個(gè)多小時(shí),,我們的抽象米羅生成器就誕生了!快是真的快,!不過,,效果稍微有點(diǎn)那啥。,。,。
看來,玩定制AI也并不是有手就行,。我研究了一下發(fā)現(xiàn),,假如要想做到像之前提到的 DingZhen LoRA 那么像,還需要花更多的時(shí)間去細(xì)致的調(diào)節(jié)一下小的模型參數(shù),。然而,,我還沒來得及喝口茶,坐下來,,開始研究調(diào)參,,又有一個(gè)功能勁爆程度絲毫不亞于LoRA的新技術(shù)出現(xiàn)了。,。,。這次的主角叫ControlNet,,它能夠引導(dǎo) AI 輸出更精確的內(nèi)容。
不知道大家發(fā)現(xiàn)沒有,,咱們平常在網(wǎng)上看到的 AI 生成圖片,,里面的人物姿勢(shì)總是大同小異?這是因?yàn)?AI 會(huì)有一種 “惰性”,,更喜歡生成接近原圖(訓(xùn)練素材)的內(nèi)容,。
以前要想讓 AI 生成不同姿勢(shì)的圖片,就得使用提示詞(抬頭,、向左看,、跑步……)。但是很多時(shí)候,,提示詞很難精確描述我們想要的姿態(tài) —— 而且 AI 也不一定能正確理解,。就比如,早期 AI 不能理解啥是游泳,。
ControlNet 就能很好的解決這個(gè)問題,。只要上傳一張人物照片給 ControlNet,它就能分析這張圖片的人物肢體框架,,然后指揮 AI 生成肢體動(dòng)作類似的新圖片。完全不需要任何姿勢(shì)相關(guān)的提示詞,!
光是這一點(diǎn),,ControlNet 就足夠神奇了。,。,。而且這還沒完,僅僅就是一個(gè)周末的功夫,,ControlNet 又被發(fā)現(xiàn)了一個(gè)足以改變AI畫圖歷史的用法,!它可以通過骨架控制手型 —— AI 會(huì)畫手了!??!
估計(jì)大家早就聽說過 AI “不會(huì)畫手” 的笑話,甚至已經(jīng)有人腦洞大開了:假如我?guī)?“假手指” 再干壞事,,是不是就可以一口咬定監(jiān)控是 AI 生成,,從而逃脫罪責(zé)了?
呵呵,,這些人的想法可以胎死腹中了,。而除了控制人物骨架,ControlNet 在上色和草稿補(bǔ)全方面也更進(jìn)一步,,正確理解了草稿中空白區(qū)域是“未涂色”,,而不是“白色”,。
在這之前,假如你喂給 AI 一張沒上色的黑白草稿,,它真就只會(huì)給你生成一張“黑白照”出來,。。,。
非常陰間,。哦對(duì)了,說到精確控制和上色,。,。。就在我剛看完 ControlNet 能干嘛之后,,還沒來得及上手用,,群里就又討論起另外一個(gè) AI 了。,。,。和前文提到的那些非商業(yè)的模型不同,這次他們聊的 “ArkoAI” 是一款商業(yè)AI,。這款 AI 是專門為“土木工程”設(shè)計(jì)的,,能把隨手畫的建筑的外觀草圖轉(zhuǎn)換成概念渲染圖。這效果,,感覺和真的建了一個(gè)3D模型一樣,。
連傳統(tǒng)工業(yè)軟件都開始入局,在我看來,,AI 畫圖終于算是邁出了從“非??岬耐婢?rdquo;到“新時(shí)代生產(chǎn)力工具”的這一步。以前的 AI 只能生成一些短視頻漫畫風(fēng)格照,、渲染一些異形一樣的人物照,,而且對(duì)于指令的響應(yīng)相當(dāng)玄學(xué)。,。,。
但是現(xiàn)在,AI 已經(jīng)可以制作一打演示圖(甲方點(diǎn)頭就行),,生成一組情頭(約稿的老板滿意就行),,渲染一堆現(xiàn)實(shí)中不存在的完美小姐姐(阿宅起立就行)。,。,。我們不得不承認(rèn),AI畫圖已經(jīng)能完成需要一些創(chuàng)意,但精確度要求不高的工作了,。而且最主要的是,,現(xiàn)在這方面的技術(shù)發(fā)展實(shí)在是太快了!??!就這一個(gè)周末,先是 LoRA,,后是 ControlNet,,然后 ArkoAI 也出來刷了一波存在。,。,。我從來沒見過 AI 技術(shù)發(fā)展的這么迅速過!我真的猜不到,,明天一覺醒來,,AI 又會(huì)帶來一些什么驚喜。
文章出處:差評(píng)