Apple har tränat en stor språkmodell för att effektivt förstå långformatvideo
Apples forskare har utvecklat en anpassad språkmodell som överträffar större modeller i analys och förståelse av långformatvideo.
Apples forskare har utvecklat en anpassad språkmodell som överträffar större modeller i analys och förståelse av långformatvideo.
Apple har utvecklat AI-modellen SlowFast-LLaVA-1.5 för effektiv analys av långa videor, som presterar bättre än större modeller. Den kombinerar detaljerad och snabb analys av bildrutor och är tillgänglig som open source.
Apples forskare har utvecklat en AI för bildbeskrivning som ger mer exakta och detaljerade resultat med betydligt mindre modeller än tidigare.
Apple har utvecklat en teknik som gör stora språkmodeller upp till fem gånger snabbare på att förutsäga tokens i matematik- och kodningsuppgifter, utan att kompromissa med utdata kvaliteten.
Apple har utvecklat en AI-modell, VSSFlow, som kan generera ljud och tal från tysta videor med hög kvalitet.
© 2008 – 2026 Aapl.se - Byggt med Rails och en kärlek för RSS. Allt innehåll tillhör respektive ägare