Microsoft pakuje moc w swój nowy mały model sztucznej inteligencji Phi-2

by Thomas 13 stycznia, 2024

written by Thomas 13 stycznia, 2024

Microsoft Research ogłosił wydanie Phi-2, małego modelu językowego (SLM) wykazującego niezwykłe możliwości jak na swój rozmiar. Wprowadzony dziś na rynek model został po raz pierwszy ujawniony podczas wydarzenia Microsoft Ignite 2023, podczas którego Satya Nadella podkreślił jego zdolność do osiągania najnowocześniejszej wydajności przy ułamku danych treningowych.

W przeciwieństwie do GPT, Gemini i innych dużych modeli językowych (LLM), SLM jest szkolony na ograniczonym zbiorze danych, przy użyciu mniejszej liczby parametrów, ale także wymaga mniej obliczeń do uruchomienia. W rezultacie model nie może generalizować tak bardzo jak duży model językowy, ale może być bardzo dobry i wydajny w określonych zadaniach – takich jak matematyka i obliczenia w przypadku Phi.

Phi-2, ze swoimi 2,7 miliardami parametrów, prezentuje dobre rozumowanie i rozumienie języka, rywalizując z modelami do 25 razy większymi, według Microsoftu. Wynika to z koncentracji Microsoft Research na wysokiej jakości danych szkoleniowych i zaawansowanych technikach skalowania, dając model, który przewyższa swoich poprzedników w różnych testach porównawczych, w tym matematyce, kodowaniu i zdroworozsądkowym rozumowaniu.

„Z zaledwie 2,7 miliardami parametrów, Phi-2 przewyższa wydajność modeli Mistral i Llama-2 przy parametrach 7B i 13B w różnych zagregowanych testach porównawczych” – powiedział Microsoft, rzucając niski cios dla najnowszego modelu sztucznej inteligencji Google: „Co więcej, Phi-2 dorównuje lub przewyższa niedawno ogłoszony Google Gemini Nano 2, mimo że jest mniejszy.”

Źródło: Microsoft

Gemini Nano 2 to najnowsza propozycja Google na multimodalny LLM zdolny do pracy lokalnej. Został ogłoszony jako część rodziny Gemini LLM, która ma zastąpić PaLM-2 w większości usług Google.

Podejście Microsoftu do sztucznej inteligencji wykracza jednak poza rozwój modeli. Wprowadzenie niestandardowych chipów, Maia i Cobalt, jak donosi TCN, pokazuje, że firma zmierza w kierunku pełnej integracji sztucznej inteligencji i przetwarzania w chmurze. Chipy komputerowe, zoptymalizowane pod kątem zadań AI, wspierają szerszą wizję Microsoftu dotyczącą harmonizacji możliwości sprzętu i oprogramowania i stanowią bezpośrednią konkurencję dla Google Tensor i nowej serii chipów M firmy Apple.

Należy zauważyć, że Phi-2 jest tak małym modelem językowym, że może być uruchamiany lokalnie na sprzęcie niskiego poziomu, nawet potencjalnie na smartfonach, co toruje drogę dla nowych aplikacji i przypadków użycia.

Ponieważ Phi-2 wkracza w sferę badań i rozwoju sztucznej inteligencji, jego dostępność w katalogu modeli Azure AI Studio jest również krokiem w kierunku demokratyzacji badań nad sztuczną inteligencją. Microsoft jest jedną z najbardziej aktywnych firm przyczyniających się do rozwoju sztucznej inteligencji open source.

Ponieważ krajobraz sztucznej inteligencji wciąż ewoluuje, Phi-2 firmy Microsoft jest dowodem na to, że świat sztucznej inteligencji nie zawsze polega na myśleniu na większą skalę. Czasami największa siła tkwi w byciu mniejszym i mądrzejszym.

Microsoft pakuje moc w swój nowy mały model sztucznej inteligencji Phi-2

FIFA będzie wybijać piłkarskie NFT na Polygon – ale nie porzuca Algorand

Jak AI: Najlepsze narzędzia AI dla pisarzy

Related Posts

Leave a Comment Cancel Reply