現今,許多B端設計師在日常設計中難免會遇到各種運營 3D banner 設計需求。在設計過程中,他們不僅需要費盡心思構思各種造型,還要不斷進行重複渲染,而有時渲染結果也難以令人滿意。本文旨在介紹一種基於 Stable Diffusion 混合 AI 的B端 3D Banner 設計方法和流程,可供任何對該領域感興趣的人進行實驗,創作出各類B端模型。
部署 Stable Diffusion 流程
雲端部署
拉取鏡像(10-15min)
sudo docker pull gpulab.tencentcloudcr.com/ai/stable-diffusion:1.0.8
啟動容器,完成部署(1min)
sudo docker run -itd --gpus=all --network=host --device=/dev/dri --group-add=video --ipc=host --cap-add=SYS_PTRACE --security-opt seccomp=unconfined --name=stable-diffusion gpulab.tencentcloudcr.com/ai/stable-diffusion:1.0.8 | xargs sudo docker logs --follow
sudo docker restart stable-diffusion | xargs sudo docker logs --follow
本地安裝 Stable Diffusion
優勢 | 劣勢 | |
---|---|---|
雲端安裝 | 根據情況選擇硬件,成本可控;即開即用 | 需要手動安裝插件;部署存在一定門檻 |
本地安裝 | 預裝包插件較完整 | 極度依賴本地硬件;成本高 |
3D banner 模型訓練流程
收集設計素材,準備訓練集
圖片處理與裁切
圖片預處理操作(手動為圖片添加描述)
使用 Dreambooth 進行訓練
-
到 dreambooth 選項卡中,選擇剛剛創建的模型:tencent cloud_banner
-
Instance prompt:輸入的 tenentcloud(這個名字不要和現實中存在的常見詞語衝突)
-
Dataset Directory:填寫你輸出的圖片和文本的目錄
-
Class Prompt:填寫icon/或者品類
-
Classification Dataset Directory 和 Total Number of Class/Reg Images 的參數根據自己的需要來填寫,例如:40
-
Learning Rate 和 Training Steps 這兩個選項都是決定訓練強度的,數字越大,學習效果越強,學習效果越強,就越容易過擬合,但是過低又會欠擬合
-
Train Wizard 如果是訓練人物模型的可以選擇 lora,不是的話可以不用選擇
-
點擊"Generate Ckpt",大概4個小時之後就可以煉丹成功(根據顯卡配置測算時間,2080T大概時間6小時,3080T大概時間4小時)
設計師生產流程
-
關鍵詞寫法:內容,風格,質量,視角四個方向填寫關鍵詞
-
以“服務器”為例。正面關鍵詞:A server, a round object with blue center and top white center, top with light blue center and white center, white background, very high quality 3D ICON. The model is divided into two parts, top and bottom. The bottom is a white metal cube with a slightly glassy texture. There are metal screws at all four corners. The screws are very small. There is only one main object in the scene, the object is on the right side of the screen, and the camera is an isometric perspective. X-axis is -20°, y-axis is 45°, z-axis is 0°, masterpiece, best quality, high resolution ;負向描述:nsfw, lowres, bad anatomy, bad hands, text, error, missing fingers, extra digit, fewer digits, cropped, worst quality, low quality, normal quality, jpeg artifacts, signature, watermark, username, blurry,fuzzy structure
-
採樣迭代步數:20-30(不是越高越好,過高也會出現抽象的內容)
-
生成數量:跟隨自己的電腦配置來填寫參數,配置好填寫數量高,配置低填寫低
-
寬度/高度:512*512
-
最後的生成效果(我們挑選了一些生成較好的效果)
-
以“AI 大腦”為例。正面關鍵詞:A brain, a round object with blue center and top white center, top with light blue center and white center, white background, very high quality 3D ICON. The model is divided into two parts, top and bottom. The bottom is a white metal cube with a slightly glassy texture. There are metal screws at all four corners. The screws are very small. There is only one main object in the scene, the object is on the right side of the screen, and the camera is an isometric perspective. X-axis is -20°, y-axis is 45°, z-axis is 0°, masterpiece, best quality, high resolution <lora:DDicon:1>;負向描述:nsfw, lowres, bad anatomy, bad hands, text, error, missing fingers, extra digit, fewer digits, cropped, worst quality, low quality, normal quality, jpeg artifacts, signature, watermark, username, blurry,fuzzy structure
-
採樣迭代步數:20-30(不是越高越好,過高也會出現抽象的內容)
-
生成數量:跟隨自己的電腦配置來填寫參數,配置好填寫數量高,配置低填寫低
-
寬度/高度:512*512
-
生成結果: