Microsoft do svého nového malého modelu umělé inteligence Phi-2 vkládá výkon

by Tim 13 ledna, 2024

written by Tim 13 ledna, 2024

Microsoft Research oznámil vydání Phi-2, malého jazykového modelu (SLM), který na svou velikost vykazuje pozoruhodné schopnosti. Dnes uvedený model byl poprvé odhalen během akce Microsoft Ignite 2023, na které Satya Nadella zdůraznil jeho schopnost dosahovat špičkového výkonu se zlomkem trénovacích dat.

Na rozdíl od GPT, Gemini a dalších velkých jazykových modelů (LLM) je SLM trénován na omezené sadě dat, přičemž používá méně parametrů, ale také vyžaduje méně výpočtů pro svůj běh. Výsledkem je model, který nemůže zobecňovat tolik jako velký jazykový model, ale může být velmi dobrý a efektivní ve specifických úlohách – jako je matematika a výpočty v případě Phi.

Phi-2 se svými 2,7 miliardami parametrů předvádí dobré uvažování a porozumění jazyku a podle společnosti Microsoft konkuruje modelům až 25krát větším. Vyplývá to ze zaměření výzkumu společnosti Microsoft Research na vysoce kvalitní tréninková data a pokročilé techniky škálování, díky čemuž model překonává své předchůdce v různých srovnávacích testech, včetně matematiky, kódování a uvažování zdravým rozumem.

„S pouhými 2,7 miliardami parametrů překonává Phi-2 výkon modelů Mistral a Llama-2 se 7B a 13B parametry v různých agregovaných benchmarcích,“ uvedl Microsoft a hodil tak nejnovějšímu modelu umělé inteligence společnosti Google podpásovku: „Navíc Phi-2 dosahuje stejného nebo lepšího výkonu než nedávno oznámený Google Gemini Nano 2, přestože je menší. „

Zdroj: Microsoft

Gemini Nano 2 je nejnovější sázka společnosti Google na multimodální LLM schopný lokálního provozu. Byl ohlášen jako součást rodiny LLM Gemini, která by měla nahradit PaLM-2 ve většině služeb společnosti Google.

Přístup společnosti Microsoft k umělé inteligenci však přesahuje rámec vývoje modelů. Uvedení vlastních čipů Maia a Cobalt, o kterém informovala TCN, ukazuje, že společnost směřuje k plné integraci AI a cloud computingu. Počítačové čipy optimalizované pro úlohy AI podporují širší vizi Microsoftu o sladění hardwarových a softwarových schopností a jsou přímou konkurencí pro čipy Google Tensor a novou řadu čipů M společnosti Apple.

Je důležité poznamenat, že Phi-2 je tak malý jazykový model, že jej lze provozovat lokálně na zařízeních nízké úrovně, potenciálně i na chytrých telefonech, což otevírá cestu novým aplikacím a případům použití.

S tím, jak Phi-2 vstupuje do oblasti výzkumu a vývoje umělé inteligence, je jeho dostupnost v katalogu modelů Azure AI Studio také krokem k demokratizaci výzkumu umělé inteligence. Microsoft je jednou z nejaktivnějších společností, které přispívají k vývoji otevřeného zdrojového kódu AI.

Jak se prostředí AI neustále vyvíjí, je Phi-2 společnosti Microsoft důkazem toho, že svět AI Není vždy o myšlení většího rozsahu. Někdy je největší síla v tom, že je menší a chytřejší.

Microsoft do svého nového malého modelu umělé inteligence Phi-2 vkládá výkon

FIFA bude na Polygonu vyrábět fotbalové NFT, ale Algorandu se nevzdá

Jak na umělou inteligenci: Nejlepší nástroje umělé inteligence pro spisovatele

Related Posts

Leave a Comment Cancel Reply