Home » Google има нов модел за изкуствен интелект с отворен код – може ли да се конкурира с Llama-2 на Meta?

Google има нов модел за изкуствен интелект с отворен код – може ли да се конкурира с Llama-2 на Meta?

by Patricia

Google AI – подразделение на гиганта в областта на търсенето – представи днес Gemma – нова фамилия езикови модели с отворен код, получени от наскоро пуснатия набор от инструменти за изкуствен интелект Gemini. С Gemma Google директно оспорва водещата позиция на LLM, базирани на LLaMa и Mistral на Meta.

„Имаме дълга история на подкрепа на отговорния отворен код и науката, които могат да стимулират бързия напредък на научните изследвания“, пише Демис Хасабис, съосновател на Google DeepMind, в туитър. „Затова сме горди да пуснем Gemma: набор от леки отворени модели, най-добри в класа си за своя размер, вдъхновени от същата технология, използвана за Gemini.“

Gemini е комерсиалният мултимодален LLM със затворен код, пуснат неотдавна от Google, за да замени PaLM-2 в захранването на своя набор от онлайн услуги, конкурирайки се пряко с ChatGPT Plus на OpenAI.

Gemma се предлага в две версии: Gemma 2B, олекотен модел, обучен на два милиарда параметри, който е оптимизиран за ефективност и може да се използва в по-широк спектър от хардуер, и Gemma 7B, по-стабилен модел, обучен на 7 милиарда параметри, който осигурява по-добри резултати, но изисква по-голяма изчислителна мощ.

„В Google вярваме, че ще направим ИИ полезен за всички“, заяви Google в официално съобщение, подчертавайки визията си за демократизиране на технологията на ИИ.

Пускането на модел с отворен код може да окаже по-непосредствено въздействие върху разработчиците на ИИ и софтуерните инженери, но ползите достигат до крайните потребители, след като бъдат тествани, доработени и вградени в продукти и услуги.

„Тъй като продължаваме да разширяваме семейството на модела Gemma, очакваме с нетърпение да представим нови варианти за разнообразни приложения“, добавиха от компанията.

В съобщението на Google се обхващат техническите и философските основи на Gemma, като се казва, че моделът „е проектиран с нашите принципи за изкуствен интелект на преден план“.

„За да разберем и намалим рисковия профил на моделите Gemma, проведохме солидни оценки, включително ръчни червени тестове, автоматизирани тестове с противници и оценки на възможностите на модела за опасни дейности“, се казва в него.

Малко след пускането си Gemma бързо се изкачи в класацията на често споменаваната класация Hugging Face, достигайки до второ място в списъка с тенденции и побеждавайки всички други LLM и AI модели с отворен код – с изключение на Open Cascade на Stability AI, нов генериращ AI за преобразуване на текст в изображение.

Реални цифри подкрепят заявеното от Gemma превъзходство: тя демонстрира по-добра производителност от LlaMa-2 на Meta в няколко синтетични бенчмарка. Например Gemma превъзхожда LlaMa-2 в тестове като MMLU (знания, обхващащи 57 научни дисциплини), Hellaswag (оценка на основни разсъждения в ежедневни задачи), MATH (оценка на математическите способности) и HumanEval (проверка на уменията за кодиране).

Изображение: Google

Изображение: Google


Разработчиците, които се интересуват от тестване на Gemma, могат да го направят безплатно с помощта на Kaggle – платформа за наука за данните и изкуствен интелект, създадена от Google. Компанията също така направи Gemma достъпна чрез тетрадките на Google Colab и дава 300 долара кредити за първите потребители на Google Cloud.

„Изследователите могат също така да кандидатстват за кредити от Google Cloud в размер до 500 000 долара, за да ускорят проектите си“, казват от Google.

Related Posts

Leave a Comment