Где заказать AI агента и почему уже пора

admin
Автор темы, Администратор
admin
Автор темы, Администратор
ID:

Сообщение #1 admin » Пн, 2 декабря 2024, 23:35

Сначала ликбез про то, что это такое
> vc.ru/ai/1659809-ii-agenty-budushee-kotoroe-izmenit-nashu-zhizn
> blogs.epsilonmetrics.ru/ii-agenty-i-multiagentnye-sistemy/
> generation-ai.ru/media/justai_recommendations

ИИ-Агент - это система искусственного интеллекта, которая использует большую языковую модель (LLM) в качестве основного вычислительного механизма, что позволяет ей вести диалог, выполнять задания, рассуждать и демонстрировать определенную степень автономности.
Воркфлоу — предопределённые сценарии, где LLM следует чётким инструкциям.

Когда использовать агентов:
Для гибкости и принятия решений на основе данных.
Для сложных задач, которые нельзя разбить на фиксированные шаги.
Когда лучше отказаться:
Если простое решение уже работает.
Если издержки по времени и ресурсам не оправданы.

> aij.ru/archive?albumId=2&videoId=293

Построение ИИ-агентов: с чего начать?
> youtu.be/TD1JY24QTAk
> youtu.be/9QXRAC8G89I или youtu.be/zy-peWyg0N8
> youtu.be/GpI68hQ3acM
> youtu.be/Xz9cr3aC7eI
> youtu.be/o3mXFIusYB0
> youtu.be/c2ebvkkm3XI
> youtu.be/bI-gRcMgWvc
> youtu.be/WG4QFBBHW2U
> youtu.be/TD1JY24QTAk
> youtu.be/12vBSQRv-jA
> youtu.be/TToYLYrg0_o

AI assistant API - инструмент для создания ИИ-ассистентов от Yandex Cloud он позволяет упростить использование RAG подхода по поиску в базе знаний и ответ с помощью языковой модели > yandex.cloud/ru/docs/foundation-models/concepts/assistant/

DeepSeek’s AI assistant https://cdn.deepseek.com/download-app/index.html обогнал ChatGPT по скачиваниям


Google опубликовали один из лучших официальных гайдов по ИИ-агентам. Agents Authors: Julia Wiesinger, Patrick Marlow and Vladimir Vuskovic В нем содержится:
- Описание агентов, компонентов и когнитивных архитектур.
- Разобраны инструменты по работе с агентами: расширения, написании функций и хранилища данных.
- Описываются методы обучения для повышения производительности агентов.
- Описываются методы создания агентов с использованием LangChain и LangGraph
читать используя vpn > kaggle.com/whitepaper-agents или искать по авторам в других местах

> anthropic.com/research/building-effective-agents
1️⃣ Улучшенная LLM — модель с возможностью поиска, использования инструментов и памятью.
2️⃣ Цепочки запросов (Prompt Chaining): пошаговое выполнение задач.
3️⃣ Маршрутизация (Routing): классификация задач и направление к нужным инструментам.
4️⃣ Параллельная обработка (Parallelization): одновременная работа над подзадачами.
5️⃣ Оркестратор и воркеры (Orchestrator-Workers): LLM разбивает задачи и делегирует выполнение.
6️⃣ Оценщик и оптимизатор (Evaluator-Optimizer): генерация и итеративная доработка ответов.

Любой интеллектуальный агент должен обладать 5 ключевыми способностями:
1️⃣ Восприятие - сбор данных из окружающей среды
2️⃣ Классификация - извлечение и представление информации из воспринимаемых данных
3️⃣ Принятие решений на основе собранной информации
4️⃣ Действие - исполнение решения
5️⃣ Обучение - извлечение уроков и повышение правильности своих действий
❗️ Важно: Агент должен быть способен принимать решения и учиться на их результатах.

Для реализации этих способностей агент должен обладать следующими характеристиками:
▶️ Автономность - принимать решения и предпринимать действия без вмешательства человека
▶️ Сотрудничество - работать в команде с другими ИИ-агентами для коллективного решения задач
▶️ Итеративность - постоянно улучшать результаты за счет выполнения итераций
▶️ Реактивность - быстро реагировать на внешние стимулы
▶️ Адаптивность - фундаментальная характеристика, которая позволяет ИИ-агентам корректировать свое поведение на основе опыта.
Постоянно обучаясь и накапливая опыт, ИИ-агенты могут оптимизировать свои решения и стратегии действий, адаптируясь к различным условиям и задачам. Для этого ИИ-агенты должны обладать сильными способностями к обучению и самооптимизации.

Исходя из этих характеристик можно определить Модель 6П ИИ-Агента.
На практике для ИИ-агентов LLM выступает в роли "мозга", управляющего шестью ключевыми процессами (см. https://t.me/c/2238220828/346):
1️⃣ Понимание - распознавание намерений пользователя (датчики, сенсоры, текст, голос, изображения и тд)
2️⃣ Планирование - декомпозиция задач на подзадачи и план их выполнения, рефлексия над процессом, обучение на ошибках и улучшение результата.
3️⃣ Память - кратковременная (контекст выполнения задачи) и долговременная память (внешние знания)
4️⃣ Производство - ИИ-агент генерирует и оценивает решения, выбирает наилучшее в зависимости от условий окружающей среды и целей задачи, а также улучшает способность выработки решений за счет итераций и обратной связи после завершения задачи.
5️⃣ Применение инструментов - ИИ-агент использует внешние инструменты для взаимодействия с физическим миром, обучения и решения практических задач
6️⃣ Поведение - выполнение принятых решений, выбирая действия из доступного набора.
Для реализации этих процессов на рынке уже существует множество решений и собрать своего агента сегодня может каждый увлеченный вовлеченный. @ReymerDigital
____________________________________________________________________
Как может выглядеть мультиагентная система, которая обрабатывает запросы с помощью скоординированного роя специализированных ИИ-агентов.
- Специальная система: Определяет сложность каждого запроса
- Интерпретатор запросов: Разбирает и анализирует запросы
- Специалист по исследованиям: Определяет ключевые области для исследования
- Критический анализатор: Оценивает информацию и выявляет пробелы
- Творческий исследователь: Генерирует новые варианты решения задачи
Синтезатор информации: - Объединяет идеи в последовательные ответы
_____________________________________________________________________
Hugging Face выпустили открытый курс по изучению AI-агентов на практике.
За прохождение курса можно получить сертификат и самое главное, что при обучении упор идет на практику.
Вы погрузитесь в популярные фреймворки агентов, такие как LangChain, LlamaIndex и smolagents. Эти инструменты предоставляют строительные блоки для создания сложных поведений агентов.
✅Записаться можно здесь (https://huggingface.us17.list-manage.com/subscrib ... a28b51bfc493d048&id=9ed45a3ef6)
_________________________________
Россия утвердила ГОСТ Р 71752—2024, нацеленный на упрощение и унификацию работы с проектами в области ИИ.
Что важно знать:
Установлены требования к структуре и содержанию ТЗ для проектов ИИ.
Акцент сделан на результатах, а не на конкретных методах.
Охватывает весь жизненный цикл проектов: от разработки до внедрения и сопровождения.
_________________________________
Откуда в компании-разработчики приходят выпускники?
Выпускники топ-6 университетов составили около 4,3 тыс. специалистов. Участники "первой волны" :
ИТМО > itmo.ru/ LLM-трек магистратуры по искусственному интеллекту AI Talent Hub
МФТИ
НИУ ВШЭ владеет cHARISMa (Computer of HSE for Artificial Intelligence and Supercomputer Modelling)
Сколтех
Иннополис
ИСП РАН
В 2023 году на специальности, связанные с ИИ, поступило 74,7 тыс. студентов.
МИФИ и другие во второй волне.

Техническое задание может быть создано
научно-учебной лабораторией LAMBDA ФКН НИУ ВШЭ https://cs.hse.ru/iai/lambda/
И спросить руководителя научной группы "Адаптивные агенты" Научно-исследовательского института искусственного интеллекта (AIRI) Владислава Куренкова

А можно сразу в https://z-union.ru/ лаборатория прикладного ИИ & ИЦИИ МИФИ

Молодые команды, например:
01 peaRL
02 Macrame club
03 AXAXAXXAXAXA
04 CUDA out of memery
05 Chechnya95
06 ThreeAngryWives
07 Selling Pandas
08 Manifold Hypothesis
09 ИИнфоцыгане
10 DAT
11 We_Use_GPT
12 MINIONS MISIS MIPT ITMO [RASCAR]
13 NFM
14 It's just business
15 NameError
16 PyBye
17 JULEBINO
18 Неtorchябрь
19 Key 34
20 Treponema
21 Boba
22 Cyber Commandos
23 AI Capybara
24 BóbrDecision
25 ощество без б
26 looking for job
27 map_reduce
28 Cognitive Coders
29 Without_shaking
30 Коты-флексеры

https://t.me/ai_machinelearning_big_data/6587

Пекинский университет предложил неожиданное решение - революционный подход к обучению корпоративных ИИ-агентов через механики настольной ролевой игры "Подземелья и драконы" (venturebeat.com/ai/researchers-improved-ai-agent-performance-on-unfamiliar-tasks-using-dungeons-and-dragons/). AgentRefine демонстрирует превосходные результаты в адаптации к новым задачам благодаря встроенной самокоррекции. Метод протестирован на ведущих языковых моделях и готов к масштабированию. Корпоративный мир получает надежный инструмент для создания по-настоящему адаптивных систем искусственного интеллекта.

AutoGen v0.4 (https://www.microsoft.com/en-us/research/blog/aut ... -extensibility-and-robustness/) это переработанный фреймворк, в котором значительно улучшена масштабируемость, добавлена модульность и новая система отладки процессов agentic AI за счет внедрения асинхронной архитектуры, управляемой событиями.
> github.com/microsoft/autogen
__________________________________________________________________________________________

admin
Автор темы, Администратор
admin
Автор темы, Администратор
ID:

Как сделать самим и пример тренировки

Сообщение #2 admin » Вс, 19 января 2025, 10:50

Microsoft выпустила бесплатный курс AI Agents for Beginners, который поможет новичкам освоиться в мире ИИ-агентов. Курс состоит из 10 уроков, охватывающих ключевые темы и инструменты для создания ИИ-агентов.
Основные темы курса:
1. Введение в ИИ-агентов и их использование.
2. Изучение агентских фреймворков.
3. Шаблоны проектирования агентов.
4. Инструменты для проектирования.
5. Генерация с дополненной выборкой (RAG) для агентов.
6. Создание надежных ИИ-агентов.
7. Проектирование планирующих агентов.
8. Проектирование мультиагентов.
9. Методы метапознания для ИИ-агентов.
10. ИИ-агенты в продакшене.
В каждом уроке — примеры кода на Python, практические задания и полезные ссылки. Всё доступно на GitHub но русский перевод пока отсутствует. Для работы используются модели с GitHub Models (бесплатно с ограничениями) и Azure AI Foundry (требуется аккаунт Azure).
Подробнее:
github (https://github.com/microsoft/ai-agents-for-beginn ... v-file#-multi-language-support)
________________________________________________________
Платформа https://www.make.com/en позволяет собрать бизнес-ассистента:
Генерирует контент через ChatGPT.
Сохраняет идеи и аналитику в Google Sheets.
Автоматически отвечает на сообщения в Telegram.
_________________________________________________________
Создаем своего ИИ-ассистента на базе OpenAi за 2 минуты
Перейдите в раздел "Assistants" на платформе OpenAI (>platform.openai.com/assistants) Нажмите "Create" и придумайте имя для ассистента.
Введите системные инструкции. Например: "Ты — полезный ассистент, помогай пользователю с анализом данных о......".
2. Выбор модели
Выберите модель, которая будет отвечать за обработку запросов:
GPT-4 — мощная модель, идеально подходящая для решения сложных, многозадачных задач, требующих глубокого анализа и контекстного понимания. Это лучший выбор для более трудоемких процессов, таких как разработка стратегий, анализ данных, создание продвинутых чат-ботов и бизнес-ассистентов.
GPT-4 Mini — компактная и экономичная модель, подходящая для быстрого выполнения лёгких задач и простых запросов. Она идеально справляется с рутинными задачами, где не требуется глубокий контекст, но важна высокая скорость и эффективность.
3. Инструменты для ассистента / Вы можете активировать дополнительные инструменты для работы с файлами и выполнения кода:
File search — поиск файлов и работа с данными.
Code interpreter — выполнение кода для обработки данных или разработки программ.
4. Загрузка файлов
Загрузите нужные файлы для работы ассистента. Это могут быть текстовые документы, таблицы и другие данные, с которыми ваш ассистент будет работать.
__________________________________________________________
LangChain недавно представил интересную концепцию – Ambient Agents (https://blog.langchain.dev/introducing-ambient-agents/) (фоновые агенты). Это такие агенты, которые обрабатывают поток событий без участия человека, но когда требуется что-то решить, они передают финальное решение на подтверждение человеку (Human-in-the-loop).
Например, подобный агент (https://github.com/langchain-ai/executive-ai-assistant?ref=blog.langchain.dev) может разбирать входящую почту, автоматически назначать встречи в календаре или добавлять участников в переписку.

Идея тут – Telegram-ассистент для входящих сообщений, который помогает вести переписки, складывая свои предложения в виде драфт-сообщений (неотправленных). Как это работает? Логика у ассистента довольно простая:
• Агент запускается раз в .... минут
• Ищет непрочитанные сообщения
• Анализирует историю переписки и предлагает ответ, который мог бы подойти (как прикрутить базу данных и базу ответов? ниже)
• Сохраняет ответ как драфт (сообщение выглядит как написанное вами, но не отправленное)
• Пользователь (front office специалист по продажам или клиентскому сервису) видит сообщение и решает: отправить как есть или переписать
https://t.me/robofuture/64
Проект учебный
• Нет RAG’а, функций или подключения к календарю (с целью упрощения кода)
• Простая реализация на LangGraph
• Ассистент использует chain-of-thought для принятия решений
• Модель генерирует не только ответ, но и имеет возможность принимать решения, например вообще не отвечать в некоторых случаях
• Пересылает нужному получателю

Идеи для улучшений
Если ассистент продолжит радовать, вот что можно в него добавить:
• RAG для анализа предыдущих переписок.
• Поддержку групповых чатов (реакция только на важные сообщения)
• Анализ изображений (например, мемов)
• Автоматические ответы на некоторые категории запросов (без драфтов)
[Код на GitHub (https://github.com/Rai220/telegram_ambient_agent)]

Также LangChain представляет новую парадигму взаимодействия с ИИ через систему фоновых агентов > venturebeat.com/ai/whats-next-for-agentic-ai-langchain-founder-looks-to-ambient-agents/ Архитектура с распределением ролей между специализированными агентами и централизованным контролем через Центр управления агентами демонстрирует прагматичный подход к автоматизации. При этом сохраняется баланс между автономностью агентов и контролем со стороны человека. Первые результаты на примере обработки электронной почты показывают эффективность подхода, но настоящий потенциал раскроется при массовом внедрении.
Но, говорят, много косяков в лэнгчейне
______________________________
IntellAgent (https://intellagent-doc.plurai.ai/) - open-source фреймворк для тестирования ИИ мультиагентов.
Кому полезен? в первую очередь для тестировщиков ИИ проектов
В чем польза?
Все, кто тестировал ИИ проекты, знает, насколько сложно покрыть его автотестами из-за разнообразия реакций на одно и тоже событие.
IntellAgent направлен на решение сложностей, связанных с оценкой агентов, которые должны вести многоходовые диалоги и придерживаться различных политик. Фреймворк создает синтетические сценарии, и позволяет комплексно тестировать агентов по нескольким параметрам сложности.
Конвейер системы IntellAgent состоит из трех основных компонентов: генерация событий, моделирование диалога и детальный анализ результата. В анализе проверяется правильность завершения диалога и соблюдение политик. Анализируется системный промпт и в отчете выводится, что было соблюдено, а что нарушено.
Забрать на тестирование тут (https://github.com/plurai-ai/intellagent)
_______________________________
OpenAI анонсировала Responses API, Agents SDK и встроенные инструменты, которые помогут строить полезных и надежных агентов.
Responses API — объединяет возможности Chat Completions API и Assistants API, позволяя агентам выполнять сложные многошаговые задачи.
Встроенные инструменты:
✅ Web Search — поиск с актуальными результатами и ссылками.
✅ File Search — быстрый поиск информации по загруженным документам.
✅ Computer Use — управление компьютером и браузером через API.
Agents SDK — новый фреймворк для оркестрации агентских рабочих процессов.
_______________________________
Компания-участник JUST AI (Маинд Крафт) выпустила (> habr.com/ru/companies/just_ai/articles/879370/) статью о способах оценки качества ботов (бот с LLM vs бот на интентах) с помощью методологии usability-тестирования, выложила подкаст (> music.yandex.ru/album/26748734/track/134662817?dir=desc&activeTab=track-list) «Гости в IT» о главных трендах, событиях и ожиданиях бизнеса в области genAI в 2025 году и открыла (>optimism.kz/2025/02/06/razrabotka-ii-botov-v-kazahstane-stala-proshhe-just-ai-otkryvaet-publichnyj-dostup-k-platforme-jaicp/)публичный доступ к своей платформе JAICP в Казахстане для всех, кто хочет самостоятельно создавать разговорные проекты
_______________
Для организации важно помнить, что автоматизация — это не просто внедрить нейросеть, это изменить привычки людей.

admin
Автор темы, Администратор
admin
Автор темы, Администратор
ID:

Ассистент по закупкам

Сообщение #3 admin » Пт, 24 января 2025, 22:47

«Сибур», одна из крупнейших нефтегазохимических компаний страны, в сотрудничестве со «Сбером» и группой компаний ЦРТ, разрабатывает AI-помощника, который оптимизирует закупки материально-технических ресурсов.

Для создания AI-помощника группа ЦРТ объединила алгоритмы обработки естественного языка и NLU-подходы (Natural Language Understanding, или понимание естественного языка) с возможностями нейросетевой модели GigaChat. Дополнительно использовались специализированные подходы:

SFT (Supervised Fine-Tuning) — процесс дообучения большой языковой модели для улучшения способности выполнять конкретные задачи;
RAG (Retrieval-Augmented Generation) — генерация, которая помогает GigaChat генерировать ответ из внешней базы данных.
Разрабатываемый AI-ассистент — «умный» помощник, который существенно ускоряет работу с данными. Он призван помочь специалисту по закупкам подобрать аналоги необходимых изделий по цене, качеству, доступности, срокам поставки и другим заданным характеристикам. Проект находится на стадии пилотирования и продолжает развитие.

Подробнее на РБК:
https://trends.rbc.ru/trends/industry/cmrm/6762a9f29a7947619dfa563d

admin
Автор темы, Администратор
admin
Автор темы, Администратор
ID:

AI Агенты - ОПЕРАТОРЫ

Сообщение #4 admin » Вс, 6 апреля 2025, 20:13

OpenAI представили своего AI агента.
Operator — это ИИ-агент, который умеет работать с браузером, Вам нужно просто описать свою задачу, а затем наблюдать в реальном времени, как оператор выполняет её за вас. обещают в ближайшем времени: ▪️operator (> operator.chatgpt.com/)
Что умеет?
Самостоятельно ищет, кликает, заполняет формы — как человек;
Бронирует туры (например, топовые экскурсии в Риме), заказывает еду, создает мемы;
Исправляет ошибки и передает управление вам, если нужны платежные данные или логины.
Вам нужно просто описать свою задачу, а затем наблюдать в реальном времени, как оператор выполняет её за вас.
Технология:
На базе GPT-4o + новый модель CUA — видит интерфейсы через скриншоты и обучается взаимодействовать с ними. Уже бьет рекорды в тестах WebArena.

Где доступно?
Сейчас — только для Pro-пользователей в США ($200/месяц). Позже появится у Plus, Team и Enterprise.

Безопасность:
Не сохраняет данные ввода (пароли, карты);
Требует подтверждения перед заказом;
Блокирует подозрительные сайты.

Почему это прорыв?
Operator — первый шаг к ИИ-агентам, которые заменят рутину: от покупок до управления сервисами. Как заявил Сэм Альтман: «Агенты — третья ступень эволюции ИИ».

Ограничения:
Пока не справляется со сложными задачами (календари, презентации) — команда учит его на фидбеке.
openai (> openai.com/index/introducing-operator/)
__________________________________________________
И сразу же появляется что-то похожее
WebRover (> github.com/hrithikkoduri/WebRover) – это автономный ИИ-агент , предназначенный для взаимодействия с элементами веб-страниц и выполнения пользовательских запросов.
Агент построен на базе LangChain и LangGraph и в первую очередь создан, чтобы освободить пользователей от рутины, связанной с поиском и сбором информации.
Благодаря глубокому пониманию контекста и способности автоматически определять нужные элементы, WebRover эффективно справляется даже со сложными задачами.
Основные возможности WebRover включают:
- самостоятельную навигацию по сайтам, управление состоянием через LangGraph и автоматизированное взаимодействие с браузером посредством Playwright.
- агент способен анализировать содержимое страниц, делать скриншоты и формировать структурированные ответы и парить информацию.

Особенности
Навигация на основе GPT-4 для понимания контекста и интеллектуальной навигации по веб-сайтам
Интеллектуальное обнаружение элементов: Автоматически идентифицирует и взаимодействует с любыми элементами сайтов
Визуальная обратная связь: Визуализация процесса навигации в реальном времени
Автономная работа: Самокорректирующаяся навигация со стратегиями обратного хода

git clone > github.com/hrithikkoduri18/webrover.git
cd webrover
cd backend
> t.me/ai_machinelearning_big_data/6628
_________________________________________________
Сохранен стиль и слэнг автора t.me/cgevent/11141
Микрософт "опенсорснул" новую версию OmniParser V2 (https://microsoft.github.io/OmniParser/). С коннекторами.
Нет, это не "ответочка" Operator-y и не агент для управления вашим компом. Это "улучшайзер" первой части работы Оператора и ему подобных систем - сильно оптимизированное распознавание содержимого вашего экрана. Так и пишут: OMNIPARSER, метод разбора скриншотов пользовательского интерфейса на структурированные элементы, который значительно повышает способность GPT-4V генерировать действия.

Более того, этот парсер-распознаватель экрана может быть пристегнут (опенсорс жеж) как плагин и к другим LLM.

И по этому поводу они также релизнули OmniTool: Control a Windows 11 VM with OmniParser + your vision model of choice. И вот это круто ибо тул может работать с: OpenAI (4o/o1/o3-mini), DeepSeek (R1), Qwen (2.5VL) или Anthropic Computer Use

Интересно наблюдать за процессом "декомпозиции" мозгов LLM. Помните писал (https://t.me/cgevent/11009) про Глубокую Клодку, что расщепление на рассуждающую и отвечающую часть, приводит к улучшению качества ответов. Теперь можно отщепить "зрение" или воспринимающую часть. И комбинировать разные "восприниматоры" и "отвечаторы".

А "восприниматоры" тоже можно разделить по областям: распознаватели экрана, спортивных трансляций, жизни насекомых. Надеваем на LLM разные очки и ну улучшать качество ответов вижен-моделей и не только.

В общем мозги для ИИ сделали, пока заняться нервной системой.


Вернуться в «Темы по ИИ (back up темы)»

Кто сейчас на форуме (по активности за 5 минут)

Сейчас этот раздел просматривают: 10 гостей