Главное:
- Microsoft разработала новую модель искусственного интеллекта под названием «Large Action Model» (LAM).
- LAM может управлять программами Windows, включая приложениями Microsoft Office.
- При тестах LAM превзошла GPT-4o, выполняя задачи в 71% случаев против 63% у конкурента.
Что такое Large Action Model?
Исследователи Microsoft представили новую модель LAM, которая способна не только понимать текст, но и осуществлять действия, основываясь на запросах пользователя. Это существенный шаг вперед по сравнению с предыдущими языковыми моделями, такими как GPT-4o, которые просто генерируют текст, но не могут выполнять реальные задачи. Лам, в отличие от них, умеет взаимодействовать с интерфейсами программ и автоматизировать процессы, что открывает новые горизонты для применения искусственного интеллекта в повседневной жизни.
Процесс обучения LAM включает четыре основных этапа: разделение задач на логические шаги, обучение у более продвинутого AI, исследование новых решений и доработка посредством обучения на основе вознаграждений. Интересно, что модель была создана на базе Mistral-7B и уже продемонстрировала впечатляющие результаты.
Работа с Microsoft Office
LAM была специально разработана для выполнения задач в приложениях Microsoft Office, таких как Word. В тестах модель успешно справлялась с задачами в 71% случаев, что значительно выше, чем 63% у GPT-4o при аналогичных условиях. Более того, LAM проявила удивительную скорость: она выполняла задания за 30 секунд, в то время как GPT-4o требовала на это 86 секунд. Это подчеркивает рост производительности AI и его возможность эффективнее справляться с задачами, что может сократить время выполнения рутинных операций.
Таким образом, данная модель демонстрирует реальные примеры внедрения AI в офисные инструменты, что может значительно упростить работу пользователей и повысить эффективность работы с документами.
Перспективы и вызовы
Несмотря на успехи, LAM также сталкивается с рядом вызовов, включая потенциальные ошибки в действиях AI и сложные технические аспекты, которые необходимо решить для лучшего масштабирования системы. Исследователи подчеркивают, что работа над улучшением и адаптацией LAM к различным приложениям все еще продолжается.
Тем не менее, демонстрация возможностей LAM говорит о важном шаге к созданию более интеллектуальных помощников, которые могут не просто понимать команды, а активно их выполнять. Это открывает новые горизонты для развития интеллектуальных систем, которые смогут выполнять более сложные задачи, ранее доступные только человеку.
Кажется, что будущее AI на подходе, и лишь время покажет, как быстро мы сможем перейти от текстовых взаимодействий к реальному взаимодействию с программным обеспечением.
Добавить комментарий