Деловой и юридический мир наполнен сложными контрактами и документами, которые необходимо внимательно читать, чтобы убедиться, что они понятны, соответствуют множеству законов и правил, а также правильно поданы и обновлены. Отслеживание судебных дел и выводов — это работа на полный рабочий день.
Некоторые из этих документов могут состоять из сотен страниц, и на их изучение уходят часы. Майо Ошин, инженер по искусственному интеллекту из Великобритании, хочет изменить эту ситуацию с помощью искусственного интеллекта. Последний проект Ошина, получивший название «Уоррен Баффет», нацелен на финансовый сектор и документы.
Я создал финансового аналитика GPT-4 «Уоррен Баффет» для «общения» и анализа множества PDF-файлов (~1000 страниц) из @elonmusk‘s Tesla 10-… k годовых отчетов (2020-2022)gpt4 openai investing stocks finance pic. twitter.com/AX75f28mBA
— Mayo (@mayowaoshin) March 27, 2023
Ошин говорит, что назвал бота в честь Баффета, потому что он был разработан для анализа финансовых документов в стиле знаменитого инвестора в стоимость
Базируясь в Лондоне, Англия, Ошин участвует в разработке фреймворка с открытым исходным кодом под названием LangChain, который предоставляет различные инструменты и ресурсы для облегчения разработки приложений ИИ.
FYI это было сделано с помощью @LangChainAI , @pinecone и @OpenAI
— Mayo (@mayowaoshin) March 27, 2023
«Тенденция среди компаний заключается в том, чтобы включить концепцию поиска в свои системы ИИ, — сказал Ошин в интервью TCN. Под извлечением понимается способность «общаться с данными», и эта функция, добавил Мэйо, стала крайне необходимой для многих компаний.
Как человек, который уже некоторое время экспериментирует с возможностями извлечения, Ошин говорит, что он осознал растущий спрос на практические примеры того, как эта технология может быть применена к различным типам документов и данных.
«Было много жалоб на то, сколько времени уходит на чтение годовых отчетов», — говорит он. «Например, инвесторы в Tesla могут захотеть разобраться в текущих факторах риска или в том, как работает руководство, но годовые отчеты могут занимать сотни страниц».
Цель проекта — показать, как ИИ может помочь в анализе больших и сложных документов, облегчая и ускоряя извлечение необходимой информации с помощью поисковых возможностей, которые позволяют пользователям общаться с данными и получать значимые выводы, что, надеемся, приведет к принятию более эффективных решений.
«Вы можете представить это как извлечение соответствующих разделов документа, в отличие от необходимости читать весь документ, но это делается на основе естественного языка», — сказал Ошин.
Как он объяснил, идея создания чат-бота заключалась в том, чтобы продемонстрировать, что бот способен на большее, чем просто однонаправленное взаимодействие, которое было в центре внимания в дискуссиях вокруг ИИ.
«Обычно это подразумевает использование [ChatGPT] для выполнения конкретной задачи над одним PDF-файлом или фрагментом информации», — сказал он. «Однако я хотел подчеркнуть, что демо-версия может выполнять анализ во времени, используя подход временных рядов». Одним из примеров является анализ движения денежных средств за несколько лет для выявления тенденций.
Учебное видео Youtube: https://t.co/Ocu3tVLKLS
Github repo (пожалуйста, обратите внимание, что это оригинальный шаблон, использованный для демонстрации, адаптированный для этого случая): https://t.co/DZ0sMKZpx8
Моя визуальная диаграмма архитектуры pdf-чатбота ниже… pic.twitter.com/VPjMZUDICv
— Mayo (@mayowaoshin) March 27, 2023
«Многие люди считают, что ИИ — это дорого, но на самом деле он может быть экономически эффективным», — сказал Ошин, добавив, что, по его мнению, причина вирусного распространения технологии в том, что люди одновременно взволнованы и напуганы тем, что ИИ означает для работы со знаниями. Он признает, что интерес и дискуссии вокруг ИИ и его влияния на рабочую силу вызваны именно опасениями.
«Пугает то, что люди, работающие над исследованиями ИИ, сами даже не знают, на что способны», — добавил Ошин. «Когда вы имеете дело с чем-то, что начинает думать самостоятельно, это серая зона»