


На 28 януари Alibaba Cloud Tongyi официално отвори своя модел Z-Image.
Моделът разполага с 6 милиарда параметъра и е недестилиран базов модел, запазвайки пълното разпределение на теглото. Той първоначално поддържа механизма за насочване на CFG, осигурявайки солидна основа за обучение за задачи за фина настройка като LoRA и ControlNet.
Z-Image има за цел да разчупи ограниченията на едно-единствено стилистично измерение: той може вярно да улови и реконструира всеки детайл, независимо дали във фотореалистично изобразяване с прецизна светлина и сянка, или в богати на емоции аниме и стилове на цифрово изкуство.
За да се справи с често срещания проблем с хомогенизираните резултати, Z-Image оптимизира разпределението на пространството за вземане на проби, като гарантира, че лицата и композициите варират значително в генерираните изображения. В сцени с много хора моделът изолира индивидуалните характеристики, за да избегне генерираните от AI „генерични лица“.
Освен това Z-Image реагира ефективно на негативни подкани, позволявайки на потребителите да филтрират недостатъците и да пречистват изображенията, постигайки прецизен контрол върху композицията, осветлението и сянката през целия процес на генериране.
Източник: IT Home
Source link
Like this:
Like Loading…
Нашия източник е Българо-Китайска Търговско-промишлена палaта






