Технологический гигант Microsoft представил новый метод обучения ИИ под названием «Алгоритм мыслей» (AoT), призванный сделать большие языковые модели, такие как ChatGPT, более эффективными и человекоподобными в своих рассуждениях.
Новый подход является естественным следующим шагом для компании, которая инвестирует значительные средства в ИИ, в частности, в OpenAI — создателей DALL-E, ChatGPT и мощной языковой модели GPT.
В Microsoft считают, что технология AoT является потенциальным игровым инструментом, поскольку она «направляет языковую модель по более рациональному пути решения проблем», как говорится в опубликованном исследовательском документе. Этот новый подход использует «внутриконтекстное обучение», позволяя модели организованно и систематически исследовать различные решения.
Результат? Более быстрое и менее ресурсоемкое решение проблем.
«Наша методика превосходит предыдущие методы, использующие один запрос, и находится на одном уровне с недавним подходом, использующим многозапросный поиск по дереву», — говорится в статье. «Интересно, что наши результаты позволяют предположить, что обучение модели алгоритму может привести к производительности, превосходящей сам алгоритм.
Исследователи утверждают, что модель приобретает улучшенную «интуицию», когда эта техника оптимизирует ее процесс поиска.
Человеко-алгоритмический гибрид?
Метод AoT устраняет недостатки существующих методов внутриконтекстного обучения, таких как подход «цепочки мыслей» (CoT). CoT иногда дает неверные промежуточные шаги, в то время как AoT направляет модель, используя алгоритмические примеры для получения более надежных результатов.
Для повышения эффективности генеративной модели ИИ AoT использует опыт как людей, так и машин. В то время как люди превосходят людей в интуитивном познании, алгоритмы известны своим организованным, исчерпывающим исследованием. В исследовательской статье говорится, что «Алгоритм мыслей» стремится «объединить эти два аспекта для расширения возможностей рассуждений в LLM».
По мнению Microsoft, эта гибридная техника позволяет модели преодолеть ограничения рабочей памяти человека, обеспечивая более полный анализ идей.
В отличие от линейного рассуждения CoT или техники «дерева мыслей» (ToT), AoT позволяет гибко рассматривать различные варианты решения подпроблем, сохраняя эффективность при минимальных подсказках. Она также конкурирует с внешними средствами поиска деревьев, эффективно балансируя между затратами и вычислениями.
В целом AoT представляет собой переход от обучения под наблюдением к интеграции самого процесса поиска. По мнению исследователей, такой подход позволит моделям эффективно решать сложные реальные задачи, снижая при этом воздействие на окружающую среду.
Учитывая значительные инвестиции в ИИ, Microsoft, по-видимому, имеет все возможности для внедрения AoT в такие передовые системы, как GPT-4. Хотя это и непросто, но обучение языковых моделей «думать» таким более человеческим способом может стать преобразующим фактором.