AI技術助力B端創作:運營類3D Banner設計新思路

AI技術助力B端創作:運營類3D Banner設計新思路
現今,許多B端設計師在日常設計中難免會遇到各種運營 3D banner 設計需求。在設計過程中,他們不僅需要費盡心思構思各種造型,還要不斷進行重複渲染,而有時渲染結果也難以令人滿意。本文旨在介紹一種基於 Stable Diffusion 混合 AI 的B端 3D Banner 設計方法和流程,可供任何對該領域感興趣的人進行實驗,創作出各類B端模型。

部署 Stable Diffusion 流程

雲端部署

首先,需挑選一臺騰訊雲的 GPU 服務器。GPU 卡型本次選擇 V100,對應“GN10X”機型。從 GPU實驗室活動頁可購買特價的折扣機型。
注意,點擊立即購買後,預裝鏡像要選擇“Docker基礎鏡像”。若選擇其他鏡像,會導致無法順利跑通本流程。

拉取鏡像(10-15min)

登錄機器後,直接輸入如下命令,拉取容器鏡像。拉取約需10-15min,可以先喝杯茶,休息一下。
sudo docker pull gpulab.tencentcloudcr.com/ai/stable-diffusion:1.0.8
拉取中
拉取完成

啟動容器,完成部署(1min)

複製粘貼下述命令,啟動容器,完成部署。
sudo docker run -itd --gpus=all --network=host --device=/dev/dri --group-add=video --ipc=host --cap-add=SYS_PTRACE --security-opt seccomp=unconfined --name=stable-diffusion gpulab.tencentcloudcr.com/ai/stable-diffusion:1.0.8 | xargs sudo docker logs --follow
使用生成的 public url,即可啟動 AI 繪畫環境(如果生成 public url 失敗,可使用下面命令重啟容器)。
生成鏈接,若需重啟容器,輸入以下命令即可:
sudo docker restart stable-diffusion | xargs sudo docker logs --follow

本地安裝 Stable Diffusion

優勢 劣勢
雲端安裝 根據情況選擇硬件,成本可控;即開即用 需要手動安裝插件;部署存在一定門檻
本地安裝 預裝包插件較完整 極度依賴本地硬件;成本高
本地安裝教程可參考視頻教程

3D banner 模型訓練流程

收集設計素材,準備訓練集

設計師在尋找素材儘可能風格上統一,圖片本身的質量較高(指看得清楚)。圖片的數量也不是越多越好,數量大概在20張以內,5張以上就好(目前使用的是騰訊雲的運營活動 Banner)。

圖片處理與裁切

對圖片進行裁切和處理,儘可能讓素材中的主元素在畫面的中間,圖片的大小處理為方形大小(512 * 512),處理的原則模型主體清晰。

圖片預處理操作(手動為圖片添加描述)

打標的處理方法相對前步驟會比較麻煩,因為B端 banner 都偏抽象類型,很難用一句話描述清楚,所以這裡我們也不能使用 Stable diffusion 默認的預處理圖片方式,我們選擇手動打標的方式,描述分為兩個模塊:底座造型的描述和主體造型的描述。
底座的描述:一個方形白色為主的藍色點綴底座,圓形的裝飾物,發光燈條,透明玻璃材質,藍色的玻璃質感,白色科技感。
主體的描述:白色科技感,幾何圖形,球形,立方體,藍色玻璃質感,藍色科技感,科技感,立方體發光,透明玻璃材質,雲ICON,雲logo。
針對每張圖新建一個 text 文檔添加描述,我們將上述內容手動改為英文:A white square base with blue accents, circular decoration, glowing light bars, transparent glass material, blue glass texture, white tech feel, geometric shapes, spherical, cubic, blue glass texture, blue tech feel, tech feel, cubic glowing, transparent glass material, cloud icon, cloud logo.

使用 Dreambooth 進行訓練

創建模型
在“1“這裡輸入你訓練出來的模型的名稱,你可以按照你的喜好隨意起一個英文名,例如:tencentcloud_icon/tencentcloud_banner 之類的,使用 A100 GPU 訓練一個模型只需要5分鐘,所以可能會訓練多個模型來做對比測試,時間一長你就不知道這些模型是幹啥的了,所以我建議規範命名,能清楚闡述模型的效果。
“2”這裡選擇基底模型,Dreambooth 模型是基於一個現成的模型生成的,理想情況下,你訓練出來的新模型中:你訓練的主元素由你訓練出來的這部分繪製,其他內容由基底模型生成(基底模型決定了整個新模型的風格,如果用的是二次元的模型,最後出來的風格也就是二次元的icon)選擇一個基礎模型來進行訓練,我們這次是基於 lyriel_v14.safetensors (這是一款偏寫實人物的模型,通過C站搜索可直接下載)。
點擊“3”創建模型。
開始訓練
“1”“2”輸入你的模型的存放目錄和輸出目錄(文件夾命名的方式例如:tencentcloud_in,tencentcloud_out)。
輸入圖片的尺寸(因為之前已經把圖片的尺寸調整為512×512,那麼這個地方直接輸入就好)。
因為我們已經手動為圖片打標過了,所以我們需要把 Stable diffusion 生成的打標內容手動替換成我們自己的文本內容。
Dreambooth 設置
  • 到 dreambooth 選項卡中,選擇剛剛創建的模型:tencent cloud_banner

  • Instance prompt:輸入的 tenentcloud(這個名字不要和現實中存在的常見詞語衝突)

  • Dataset Directory:填寫你輸出的圖片和文本的目錄

  • Class Prompt:填寫icon/或者品類

  • Classification Dataset Directory 和 Total Number of Class/Reg Images 的參數根據自己的需要來填寫,例如:40

  • Learning Rate  和 Training Steps 這兩個選項都是決定訓練強度的,數字越大,學習效果越強,學習效果越強,就越容易過擬合,但是過低又會欠擬合

  • Train Wizard 如果是訓練人物模型的可以選擇 lora,不是的話可以不用選擇

  • 點擊"Generate Ckpt",大概4個小時之後就可以煉丹成功(根據顯卡配置測算時間,2080T大概時間6小時,3080T大概時間4小時)

設計師生產流程

文生圖生成內容
  • 關鍵詞寫法:內容,風格,質量,視角四個方向填寫關鍵詞

  • 以“服務器”為例。正面關鍵詞:A server, a round object with blue center and top white center, top with light blue center and white center, white background, very high quality 3D ICON. The model is divided into two parts, top and bottom. The bottom is a white metal cube with a slightly glassy texture. There are metal screws at all four corners. The screws are very small. There is only one main object in the scene, the object is on the right side of the screen, and the camera is an isometric perspective. X-axis is -20°, y-axis is 45°, z-axis is 0°, masterpiece, best quality, high resolution ;負向描述:nsfw, lowres, bad anatomy, bad hands, text, error, missing fingers, extra digit, fewer digits, cropped, worst quality, low quality, normal quality, jpeg artifacts, signature, watermark, username, blurry,fuzzy structure

  • 採樣迭代步數:20-30(不是越高越好,過高也會出現抽象的內容)

  • 生成數量:跟隨自己的電腦配置來填寫參數,配置好填寫數量高,配置低填寫低

  • 寬度/高度:512*512

  • 最後的生成效果(我們挑選了一些生成較好的效果)

混入 Lora 生成內容
再生成的時候融入了 DDiconLora 模型(可在C站下載)。
  • 以“AI 大腦”為例。正面關鍵詞:A brain, a round object with blue center and top white center, top with light blue center and white center, white background, very high quality 3D ICON. The model is divided into two parts, top and bottom. The bottom is a white metal cube with a slightly glassy texture. There are metal screws at all four corners. The screws are very small. There is only one main object in the scene, the object is on the right side of the screen, and the camera is an isometric perspective. X-axis is -20°, y-axis is 45°, z-axis is 0°, masterpiece, best quality, high resolution <lora:DDicon:1>;負向描述:nsfw, lowres, bad anatomy, bad hands, text, error, missing fingers, extra digit, fewer digits, cropped, worst quality, low quality, normal quality, jpeg artifacts, signature, watermark, username, blurry,fuzzy structure

  • 採樣迭代步數:20-30(不是越高越好,過高也會出現抽象的內容)

  • 生成數量:跟隨自己的電腦配置來填寫參數,配置好填寫數量高,配置低填寫低

  • 寬度/高度:512*512

  • 生成結果:

當我們在關鍵詞中一些“球體”關鍵詞,也有一些抽象圖形的產生。
當我們在關鍵詞中一些“愛心”關鍵詞,也有一些愛心圖形的產生。
同樣的方法我們也訓練了其他的風格效果(目前跟騰訊雲簡介頁設計風格一致)。
另外一種風格的嘗試:
後期放入到運營場景使用。使用相同方法,不同尺寸進行場景風格測試,通常可用於場景頭圖 banner 繪製,做商用的狀態。

結語

總的來說,AI 技術的發展為B端設計師提供了更多的創作可能性和工具。本文介紹的基於 Stable Diffusion 混合 AI 的 3D Banner 設計方法,不僅能夠減少設計師的重複渲染工作,還能夠創造出更加出色的設計作品。
我們相信,隨著 AI 技術的不斷發展,它將會在B端創作中發揮越來越重要的作用,為設計師們帶來更多的創作靈感和更高效的工作方式。這種新思路的出現,不僅可以提高設計師的工作效率和創作質量,也能夠為企業帶來更多的商業價值。因此,我們期待著更多的 AI 技術能夠應用到B端創作中,為這個行業帶來更多的創新和突破。
Scroll to Top