Az Apple újraírja a generatív képi MI szabálykönyvét
A képgeneráló mesterséges intelligencia-modellek eddig két irányba fejlődtek – most az Apple egy harmadik, eddig mellőzött ösvényt tett újra járhatóvá.
Az elmúlt évek AI-forradalma a képgenerálásban két nagy iskola mentén alakult: a diffúziós modellek, mint a Stable Diffusion, illetve az autoregresszív modellek, mint a GPT-4o, uralták a terepet. Most viszont az Apple két új tanulmányával felébreszti a már-már elfeledett normalizáló áramlások (Normalizing Flows – NF) módszertanát – és mindezt Transformer-alapokra helyezve.
A normalizáló áramlások egyik legfőbb előnye, hogy nemcsak generálni tudnak képeket, de matematikai pontossággal meg is tudják határozni azok valószínűségét. Ez hatalmas előny lehet például orvosi vagy biztonságtechnikai AI-alkalmazásoknál, ahol a „miért ez a válasz?” legalább olyan fontos, mint maga a válasz.
Az Apple első új modellje, a TarFlow az autoregresszív generálás...