目前hunyuan3d的pbr材质生成是unet base的结构。实际使用过程中发现对细节的保持还是有些不足,比如草席布料那种特别细节纹理的材质。特别是带字的图片还原都比较差,比如: <img width="111" height="65" alt="Image" src="https://github.com/user-attachments/assets/63538051-df40-4deb-94ed-ade75ba57fc2" /> <img width="110" height="94" alt="Image" src="https://github.com/user-attachments/assets/342c3b29-e92c-48fc-91d6-293f336c3dc9" /> <img width="105" height="102" alt="Image" src="https://github.com/user-attachments/assets/31eb26bf-5020-4e1e-9544-61302196f28b" /> <img width="62" height="172" alt="Image" src="https://github.com/user-attachments/assets/d0b662d6-8805-4e07-b7f3-86833c2bfffb" /> 又观察到目前Dit结构的生图模型比如Flux kontext,做一些编辑任务的时候对ref image的细节保持很优秀。所以好奇用Dit的话,是否能解决这个细节保持的问题。比如这样注入ref的condition。 <img width="1063" height="502" alt="Image" src="https://github.com/user-attachments/assets/b1ffe963-9e8b-4c5f-bc86-86606df104bf" /> 大家能否分享一下自己的理解和发现。