
Kai „ChatGPT“ buvo išleistas 2023 m. lapkritį, jį buvo galima pasiekti tik per debesį, nes už jo esantis modelis buvo tiesiog didžiulis.
Šiandien aš vykdau panašiai veikiančią AI programą „Macbook Air“ ir ji net nėra šilta. Susitraukimas rodo kaip greitai mokslininkai tobulina AI modelius kad jie būtų plonesni ir efektyvesni. Tai taip pat parodo, kad perėjimas prie vis didesnių mastelių nėra vienintelis būdas mašinas padaryti žymiai išmanesnes.
Modelis, kuriame dabar mano nešiojamasis kompiuteris yra „ChatGPT“ tipo sąmojis ir išmintis, vadinamas „Phi-3-mini“. Tai dalis mažesnių AI modelių, kuriuos neseniai išleido „Microsoft“ mokslininkai, šeimos dalis. Nors jis pakankamai kompaktiškas, kad galėtų veikti išmaniajame telefone, išbandžiau jį paleisdamas nešiojamajame kompiuteryje ir pasiekęs iš iPhone per programėlę, pavadintą Užburtas kuri suteikia pokalbių sąsają, panašią į oficialią ChatGPT programą.
A popierius Apibūdindami „Phi-3“ modelių šeimą, „Microsoft“ mokslininkai teigia, kad mano naudojamas modelis yra palankesnis GPT-3.5, OpenAI modeliui, kuris yra pirmasis ChatGPT leidimas. Šis teiginys pagrįstas jo našumo įvertinimu pagal keletą standartinių AI etalonų, skirtų sveikam protui ir samprotavimams įvertinti. Mano paties bandymais jis tikrai atrodo toks pat pajėgus.
Will Knight per „Microsoft“.
Microsoft paskelbė apie naują „multimodalinį“ Phi-3 modelį šią savaitę kasmetinėje kūrėjų konferencijoje „Build“ gali tvarkyti garsą, vaizdo įrašus ir tekstą. Tai atėjo vos po kelių dienų OpenAI ir Google tiek reklamuojamas radikalas nauji AI padėjėjai sukurta ant multimodalinių modelių, pasiekiamų per debesį.
„Microsoft“ „Lilliputian“ AI modelių šeima rodo, kad tampa įmanoma kurti įvairias patogias AI programas, kurios nepriklauso nuo debesies. Tai galėtų atverti naujus naudojimo atvejus, nes jie būtų labiau reaguojantys arba privatūs. (Neprisijungus naudojami algoritmai yra pagrindinė „Microsoft“ paskelbė atšaukimo funkciją kuri naudoja AI, kad būtų galima ieškoti visko, ką kada nors darėte savo kompiuteryje.)
Tačiau Phi šeima taip pat atskleidžia kai ką apie šiuolaikinio AI prigimtį ir galbūt apie tai, kaip jį galima patobulinti. Sébastienas Bubeckas, „Microsoft“ tyrėjas, dalyvaujantis projekte, man sako, kad modeliai buvo sukurti siekiant patikrinti, ar atrankesnis DI sistemos apmokymas gali būti būdas patobulinti jos gebėjimus.
Dideli kalbų modeliai, tokie kaip „OpenAI GPT-4“ arba „Google“ „Gemini“, kurie maitina pokalbių robotus ir kitas paslaugas, paprastai yra šaukštais tiekiami didžiuliai tekstai, siurbiami iš knygų, svetainių ir beveik bet kurio kito prieinamo šaltinio. Nors kyla teisinių klausimų, „OpenAI“ ir kiti nustatė, kad padidinus į šiuos modelius tiekiamo teksto kiekį ir jiems apmokyti naudojamą kompiuterio galią, galima atverti naujas galimybes.