時下流行的 AI 寫真工具,為用戶提供了用現(xiàn)成的照片遨游于廣袤素材與想象中的可能性,也啟發(fā) AI 從業(yè)者對于大眾消費產(chǎn)品的構想。對于個人來說,是否可以上手 AI 技術,做出自己的“數(shù)字分身”呢?本文將介紹一種高效率、易上手、低成本、高安全的“數(shù)字分身”制作方式。看完本文,你也會用一張圖片“穿越古今”,做出自己的 N 個“數(shù)字分身”。
【資料圖】
隨著網(wǎng)絡某相機小程序的火爆,關于 AIGC 智能應用的討論又一次點燃移動互聯(lián)網(wǎng)。9.9 元即可制作不同背景、造型下的“數(shù)字分身”照片,出圖效果幾可比擬專業(yè)照相館,引發(fā)了受眾的追捧。
而質疑者,認為 9.9 元的體驗成本過高,也覺得產(chǎn)品高峰期的數(shù)十小時的等待時長過于熬人??鄲烙跓o法對生產(chǎn)的照片任意加工,更為 AI 應用的數(shù)據(jù)安全性憂心忡忡。
這些想法也反映了廣大用戶對于 AI 應用的需求和渴望。對于 AI 工具,用戶希望既可以降低使用成本,又可以保證生產(chǎn)效果。如果還能簡化生產(chǎn)流程、縮短生產(chǎn)時長、提供便于交互的服務,同時保證數(shù)據(jù)安全性,當然更佳。
那么,所謂的 AI“數(shù)字分身”領域,或是“AI 寫真”領域為例,是否有一個滿足以上所有要求的方案呢?
制作個人的 LoRA 模型是一種生成“數(shù)字分身”的方式,也被一些用戶猜測為“AI 寫真小程序”的技術方案。
這種方法可以生成較為穩(wěn)定的、多角度的人像,但是其需要輸入的照片較多,技術實現(xiàn)的步驟也稍復雜,對于新手的使用門檻較高,文中不做介紹。
本文將由淺入深地介紹一種小白可以輕松上手的簡易“數(shù)字分身”制作方式,基本滿足用戶對 AI 應用的要求。
本文介紹的“數(shù)字分身”制作方法可以通過 AI 技術隨意更換照片中人物的服裝、造型、背景,用一張人像照片“穿越古今”。讀者可以拿 9.9 元買一杯蜜雪冰城,在家里“一鍵出圖”。
整個產(chǎn)圖流程可以在個人計算機的服務器完成,不需要把照片上傳到外部服務器,極大地保障數(shù)據(jù)的安全性。同時,千變萬化的服裝、背景、造型更是令人眼花繚亂,AI 的創(chuàng)意指數(shù)拉滿,令人拍案叫絕。
制作“數(shù)字分身”的過程需要解決 3 個問題:
畫什么?用什么?參考什么?
針對這 3 個問題,產(chǎn)生了 3 個步驟:
畫什么:填寫描述詞;
用什么:上傳圖片并選擇重繪區(qū)域;
參考什么:提供參考的人物姿態(tài)。
下面將按照這 3 點依次介紹。下文用到的工具為 Stable Diffusion WebUI,以及 ControlNet 插件。為了簡化內容,本文介紹便捷有效的實操步驟,Stable Diffusion 的安裝和精細化調參技能點請讀者自行學習,文末附有參考材料。
“畫什么”的問題在用文字形式模擬用戶腦海中的想象。
小時候,男生幻想自己穿著俠客的青衫,仗劍走天涯;女生幻想自己穿著飄逸的襦裙,沐浴唐風漢韻。如今的 AI 技術可以借助語言描述,讓我們在風格各異的場景中塑造個人形象。建立這一形象,首先需要用語言描述人物的服裝、發(fā)型、背景,描述語言稱為提示詞。
提示詞分為正向提示詞(希望畫面出現(xiàn)的內容)和負向提示詞(不希望畫面出現(xiàn)的內容)。繪圖用的 Stable Diffusion 為國際化工具,提示詞要用英語。
比如生成一個穿著古裝漢服的女孩,女孩佩戴精美發(fā)簪,以傳統(tǒng)的中式宮殿為背景;同時,希望圖片高質量、高清晰,不要出現(xiàn)模糊、丑陋、動畫等元素。將正向提示詞寫為“1girl, wearing song hanfu, wearing delicate traditional chinese hairpins, chinese palace background, materpiece, best quality, ultra-detailed”。負向提示詞寫為“blurry, ugly, bad quality, cartoon, anime, NSFW, nude”。
“用什么”在追問圖片生產(chǎn)過程中的主要原料是什么。
本文介紹簡易的“數(shù)字分身”制作過程,用現(xiàn)成的照片換掉照片中的造型、服飾、背景,達到“一鍵穿越”的效果。在此過程中,用到的原料是現(xiàn)有的照片,應用的技術為 Stable Diffusion 的圖生圖局部重繪(img2img inpaint)功能。涉及到的操作為上傳圖片并手動選擇重繪區(qū)域。選擇照片時,建議選擇上半身,面部輪廓清晰的正面照。比如,以一張年輕女性的正面半身照作為輸入。
上傳圖片后,我們把“換造型,換服裝”的需求轉換為技術語言“重繪除了臉部之外的所有區(qū)域”。那么,AI 工具如何知道照片中哪里是面部區(qū)域呢?在使用時,先上傳圖片,再用黑色的筆刷手動涂抹面部區(qū)域,就能精準地標識面部區(qū)域,如圖 6 所示。
此外,還需要選擇對非涂抹區(qū)域進行重繪的選項(inpaint not masked),也就是對于除面部外的區(qū)域進行新的創(chuàng)作,如圖 7 所示。
“參考什么”則是結合什么輔助信息,讓圖片生產(chǎn)的效果更穩(wěn)定。
既然是參考,則非必需,但是有利于提升圖片生產(chǎn)的質量。上面的兩個步驟為 AI 描繪了繪圖內容,也提供了人像的臉部特征。此時若是讓 AI 工具“信馬由韁”地發(fā)揮,容易出現(xiàn)人體比例失調,動作不自然等問題。為 AI 工具提供“參考答案”雖然會減少創(chuàng)意空間,但是能讓 AI 工具學習原照片的動作姿態(tài),生成更加自然的圖片。如何學習人物姿態(tài)呢?學習人物姿態(tài)需要用到 ControlNet 插件,一款對圖片進行預加工的工具,把預加工的結果像積木塊一樣拼插到生成圖片的流程中。
輸入和上一步相同的正面半身照,用 ControlNet 插件中的 openpose 預處理器學習圖中人物姿態(tài),比如頭和身體位置關系,手臂的動作。按照圖 8 的方式選擇啟用 ControlNet 插件,并選擇 openpose 預處理模式和模型。
進行上述操作后,就可以得到圖 9 的多款古裝美女“數(shù)字分身”。
那么如果想制作更多的分身,讀者應該修改前文介紹的哪些步驟呢?
讀者可以回顧,思考一下本文介紹的方法。前面介紹的 3 個步驟中,“畫什么”的步驟決定圖片內容,“用什么”的步驟決定核心素材,“參考什么”的步驟決定額外的素材。
回顧后發(fā)現(xiàn),當我們想對畫面元素做修改時,只需要修改“畫什么”步驟中的提示詞。比如想要生成現(xiàn)代裝校園風圖片,只需要重寫正向提示詞中涉及服裝,造型,背景的提示詞,將正向提示詞改寫為“1girl, wearing school uniform, ponytail, campus background, materpiece, best quality, ultra-detailed”。負向提示詞仍然寫為“blurry, ugly, bad quality, cartoon, anime, NSFW, nude”,如圖 10所示。
除了修改正向提示詞外,其他步驟均保持不變。點擊“生成”按鈕,就能得到圖 11 的“校園女孩分身”。
得到“數(shù)字分身”后,如果讀者希望進一步修改圖片細節(jié),比如重新生成背景中的建筑物,可以用局部重繪功能涂抹待修改的細節(jié),仿照上面的指引,用提示詞來牽引重繪方向,具體操作交給讀者探索。
按照這種方式不斷解鎖校園風、古代風、未來感、中式旗袍、日常風的造型,就得到了文章開頭異彩紛呈的“數(shù)字分身集”。
寫到最后,對比一下本文通過 Stable Diffusion WebUI 制作“數(shù)字分身”的方案和 AI 寫真小程序在用戶體驗方面的異同。
兩種方法的相同點為:以人像照片為輸入,通過技術手段獲得不同場景、造型的人像寫真圖。
除此之外,兩者在使用體驗方面有較大的差異。在成本方面,AI 寫真小程序需要更多“有形投資”,比如更多的照片數(shù)量,更高的費用;而本文的方法有更多的“無形投資”,比如部署和使用 Stable Diffusion 的能力。
在收益方面,AI 寫真小程序在生成圖片的角度和顏值上有優(yōu)勢,畫面自然感更高;而本文的方法在生成圖片的造型、背景豐富度以及再加工能力上更勝一籌。
期待大家可以用 AI 技術拓展生活的疆域。
歡迎加入騰訊云開發(fā)者社群,社群專享券、大咖交流圈、第一手活動通知、限量鵝廠周邊能你來~
(長按圖片立即掃碼)
關注并星標騰訊云開發(fā)者
每周4看鵝廠程序員測評新技術
關注并星標騰訊云開發(fā)者 每周4|鵝廠一線程序員,為你“試毒”新技術
渝太地產(chǎn):上半年收入總額約11 48億港元,虧損1 33億港元,毛利,房地產(chǎn),
航拍王營莊文旅小鎮(zhèn)高增平攝黃河新聞網(wǎng)呂梁訊(記者白麗紅)8月27日,
繼深圳之后,8月29日,市場又傳出“認房不認貸”政策已在廣州的南沙區(qū)
作者:泰羅,編輯:小市妹根據(jù)億邦動力報道,8月25日,中國證監(jiān)會國際
1、正方形:四條邊都相等且四個角都是直角的四邊形叫做正方形。2、各邊
1、大連市人民政府網(wǎng)站,想了解大連的政策信息,可以去市政府網(wǎng)站查詢
來為大家解答以上問題,htc,g10刷機很多人還不知道,現(xiàn)在讓我們一起來
1、建國大業(yè)(2009)破事兒TrivialMatters(2007)童夢奇緣WaitTillYou
東風集團股份(00489)公布2023年中期業(yè)績,收入為人民幣456 77億元(
1、目前還沒有發(fā)行新版人民幣的說法 。本文到此講解完畢了,希望對大家
正強股份2023中報顯示,公司主營收入1 92億元,同比上升1 36%;歸母凈
陳秋華近年來,我省縣域在維穩(wěn)經(jīng)濟大局、促進高質量發(fā)展方面發(fā)揮了重要
(聊城市新聞傳媒中心全媒體記者黃振)8月28日,由市市場監(jiān)督管理局和
導語:周漪公然質疑史萊克學院的教育理念,延續(xù)了萬年的只收怪物宗旨,

安徽安慶市正式成立“老年助餐慈善基
記者日前從安慶市民政局獲悉,該市慈善會近日設立老年助餐慈善基金,共同守護老年人舌尖上的幸福。該基金專項用于資助城鄉(xiāng)社區(qū)老年食堂、社

安徽淮北積極落實2022年電網(wǎng)防汛度汛
近日,國網(wǎng)淮北供電公司工作人員來到110千伏中泰變電站開展防汛隱患排查。該公司積極落實2022年防汛度汛措施,提前細化應急預案,推進極端

安徽全椒縣完善拓展人力信息資源助企
今年以來,全椒縣不斷完善拓展人力資源信息庫、勞務對接信息庫、企業(yè)用工需求信息庫三庫信息資源,已摸排400多家次企業(yè)缺工崗位信息1 2萬個

宿州市埇橋區(qū)柔性引進博士推進鄉(xiāng)村振
宿州市埇橋區(qū)實施博士匯工程,柔性引進29名博士擔任副鄉(xiāng)鎮(zhèn)長或園區(qū)副主任,他們將為加快產(chǎn)業(yè)發(fā)展、推進鄉(xiāng)村振興強化智力支持。目前,博士專
安徽印發(fā)出臺全面實施零基預算改革方
為進一步提高財政資源配置效率和資金使用效益,省政府印發(fā)《安徽省全面實施零基預算改革方案》,明確從編制2023年預算起,在全省范圍內全面
5月份安徽居民消費價格同比上漲2.3%
近日,國家統(tǒng)計局安徽調查總隊發(fā)布了我省5月份居民消費價格統(tǒng)計數(shù)據(jù)。統(tǒng)計顯示,我省居民消費價格同比上漲2 3%,同比漲幅比上月回落0 4個百分
安徽多種方式引導群眾防范非法集資風
合肥地鐵1號線、3號線上滾動播放防范非法集資宣傳視頻,淮南市發(fā)布《致老年群眾的一封信》……6月份是一年一度防范和處置非法集資宣傳月,今
鐵路部門持續(xù)加大長三角地區(qū)運力投放
記者從中國鐵路上海局集團有限公司獲悉,隨著上海疫情防控形勢持續(xù)向好,為進一步適應旅客出行需要,助力復工復產(chǎn),鐵路部門自6月10日起持續(xù)加
安徽六安持續(xù)精準施策全力促進工業(yè)發(fā)
六安市與蔚來汽車簽署合作協(xié)議,共建智能電動汽車零部件配套產(chǎn)業(yè)園區(qū)。該園區(qū)一期計劃2023年上半年投產(chǎn),建成后將具備年產(chǎn)30萬噸鋁壓鑄產(chǎn)能,
安徽淮北全力維護外賣送餐員合法權益
為切實防范化解新業(yè)態(tài)領域重大風險隱患,強化外賣送餐員權益保障工作,淮北市市場監(jiān)管局充分發(fā)揮職能作用,全力維護外賣送餐員合法權益?;幢?/p>
湖南漣源開展專項行動一對一為企業(yè)紓
位于漣源市的湖南三合美新材料科技有限公司,兩條生產(chǎn)線滿負荷運行,生產(chǎn)聚氨酯和巖棉復合板。因產(chǎn)品升級與產(chǎn)能擴充,急需新增兩條生產(chǎn)線,
湖南藍山縣進村入戶排查整治自建房安
老叔,這棟房屋墻體有開裂痕跡,要維修加固,安全重要!5月20日,藍山縣塔峰鎮(zhèn)果木村,黨員干部上門開展農(nóng)村自建房安全隱患排查整治。連日來
一季度湖南萬元產(chǎn)值綜合能耗同比下降
近日,湖南省工業(yè)通信業(yè)節(jié)能監(jiān)察中心發(fā)布一季度全省六大高耗能行業(yè)能源消耗統(tǒng)計監(jiān)測報告。據(jù)該報告,一季度全省146家主要高耗能企業(yè)的萬元
濟南起步區(qū)一年來累計簽約優(yōu)質項目11
萬里黃河第一隧濟南黃河濟濼路隧道建成通車,占地4000余畝的新能源乘用車零部件產(chǎn)業(yè)園加快施工……記者21日采訪獲悉,建設實施方案獲批復一
山東發(fā)布通知啟動傳統(tǒng)民居保護利用試
省住房城鄉(xiāng)建設廳、省財政廳近日聯(lián)合印發(fā)《關于做好傳統(tǒng)民居保護利用試點工作的通知》,在全省部署開展傳統(tǒng)民居保護利用試點工作。此次試點