9to5Mac
•
Ny Apple-modell kombinerar visionsförståelse och bildgenerering med imponerande resultat
Apples forskare har presenterat Manzano, en multimodal modell som effektivt kombinerar visuell förståelse och text-till-bild-generering med förbättrad prestanda och kvalitet.