Home » Microsoft вкарва мощ в новия си малък модел за изкуствен интелект Phi-2

Microsoft вкарва мощ в новия си малък модел за изкуствен интелект Phi-2

by Thomas

Microsoft Research обяви пускането на Phi-2 – малък езиков модел (SLM), който демонстрира забележителни възможности за своя размер. Пуснат днес, моделът беше разкрит за първи път по време на събитието Ignite 2023 на Microsoft, в което Сатя Надела подчерта способността му да постига най-съвременни резултати с част от данните за обучение.

За разлика от GPT, Gemini и други големи езикови модели (LLM), SLM се обучава върху ограничен набор от данни, като използва по-малко параметри, но и изисква по-малко изчисления за изпълнение. В резултат на това моделът, който не може да обобщава толкова много, колкото голям езиков модел, но може да бъде много добър и ефективен при специфични задачи – като математиката и изчисленията в случая на Phi.

Phi-2, със своите 2,7 милиарда параметри, демонстрира добри разсъждения и разбиране на езика, съперничейки си с модели до 25 пъти по-големи от него, според Microsoft. Това се дължи на фокуса на Microsoft Research върху висококачествени данни за обучение и усъвършенствани техники за мащабиране, в резултат на което моделът превъзхожда своите предшественици в различни сравнителни тестове, включително математика, кодиране и разсъждения по здрав разум.

„Със само 2,7 милиарда параметри Phi-2 надминава резултатите на моделите Mistral и Llama-2 със 7B и 13B параметри по различни обобщени показатели“, заяви Microsoft, нанасяйки нисък удар по най-новия модел на Google за изкуствен интелект: „Освен това Phi-2 съвпада или превъзхожда наскоро обявения Google Gemini Nano 2, въпреки че е по-малък по размер. „

Източник: Microsoft

Източник: Microsoft


Gemini Nano 2 е последният залог на Google за мултимодален LLM, който може да работи локално. Той беше обявен като част от семейството Gemini LLM, които се очаква да заменят PaLM-2 в повечето услуги на Google.

Подходът на Microsoft към изкуствения интелект обаче отива отвъд разработването на модели. Въвеждането на потребителски чипове, Maia и Cobalt, както съобщава TCN, показва, че компанията се движи към пълно интегриране на ИИ и облачните изчисления. Компютърните чипове, оптимизирани за задачи с ИИ, подкрепят по-широката визия на Microsoft за хармонизиране на хардуерните и софтуерните възможности и са в пряка конкуренция с Google Tensor и новата серия чипове M на Apple.

Важно е да се отбележи, че Phi-2 е толкова малък езиков модел, че може да се изпълнява локално на оборудване от ниско ниво, дори потенциално на смартфони, което проправя пътя за нови приложения и случаи на използване.

С навлизането на Phi-2 в сферата на изследванията и разработките на ИИ, наличието му в каталога с модели на Azure AI Studio също е стъпка към демократизиране на изследванията на ИИ. Microsoft е една от най-активните компании, които допринасят за разработването на ИИ с отворен код.

Като пейзажът на ИИ продължава да се развива, Phi-2 на Microsoft е доказателство, че светът на ИИ Не винаги е свързан с по-голямо мислене. Понякога най-голямата сила се крие в това да бъдеш по-малък и по-умен.

Related Posts

Leave a Comment