Technological Deep Dive

How to Get into the Tech

Business Insights/Industry·Market·Technology

The Rise of AI Agents: AI 에이전트가 온다

mju-bilab 2024. 11. 25. 19:19

요약

생성형 AI의 등장으로, 필요한 업무를 스스로 찾아내 결과물을 도출하는 'AI 에이전트(AI Agent)' 시대가 도래함
AI Agent는 사람의 개입 없이 환경과 상호작용하며 자율적으로 작업을 수행하는 지능형 소프트웨어 시스템
에이전트 설계의 핵심 구성 요소는 외부 환경, 센서, 액추에이터 및 성능 측정(선택적)
빅테크 기업들은 AI 에이전트 시장을 선점하기 위해 개방형 혹은 폐쇄형 모델을 공개

AI Agent란?

AI Agent 정의 및 기본 개념

사실, AI 에이전트는 완전히 새로운 개념이 아닙니다. 스마트(인공지능) 스피커의 초기 형태는 이미 우리 생활 속에 AI 에이전트의 존재를 보여주었습니다. 아주 간단한 명령을 통해 일상 생활의 편리성을 극대화하겠다는 목표로 출시됐으나, 음성 인식을 포함한 자연어 처리 기술(Natural Language Processing; NLP)의 한계로 인해 완전한 성공을 이루지 못했습니다. 그러나 생성형 AI의 등장으로 완전한 AI 에이전트의 구현 가능성을 더욱 긍정적으로 바라보게 되었습니다. 특히, 거대 언어 모델(Large Language Model; LLM)기반의 AI 에이전트가 기존의 기술적 한계를 뛰어넘어 적용 범위를 확장해나갈 것으로 주목받기 시작했습니다. 

AI 스피커 (source: 삼성디스플레이 뉴스룸)

 

그럼, AI 에이전트에 대한 정의부터 살펴보도록 하겠습니다. 주요 기관에서는 AI 에이전트에 대해 다음과 같이 정의하고 있습니다. 

An artificial intelligence (AI) agent refers to a system or program that is capable of autonomously performing tasks on behalf of a user or another system - IBM
AI agents are autonomous intelligent systems performing specific tasks without human intervention - AWS
AI agents are designed to perform specific tasks, answer questions, and automate processes for users - Microsoft
An AI agent is a software program designed to interact with its environment, perceive the data it receives, and take actions based on that data to ahieve specific goals - SIMFORM
An artificial intelligence agent is an intelligent system that can understand and respond to customer inquiries without human intervention - Salesforce

 

종합해보면, AI 에이전트는 사람의 개입 없이 환경과 상호작용하며 자율적으로 작업을 수행하는 지능형 소프트웨어 시스템이라고 할 수 있습니다.

AI 에이전트의 개념 도식화 (source: SIMFORM)

AI Agent의 차별적 특징

그렇다면, 사람이 직접 프롬프트(prompt)를 입력하는 거대 언어 모델과는 어떤 점이 다를까요? 

정의에 기반하여 AI 에이전트의 핵심은 자율성상호작용 능력에 있으며, 이를 통해 사용자에게 맞춤화된 서비스를 제공하는 것에 있습니다. 즉, 단순한 질의응답 시스템(Question-Answering System)을 넘어서, 사용자가 수행을 요구한 과업(Task)의 완료를 위해 활용가능한 여러 도구(Tool)와의 상호작용(Interaction)을 연쇄적으로, 자율적으로(Autonomously) 수행할 수 있는 기술이라는 점이 중요합니다. 

  1. 자율 실행(Autonomous): 주어진 목표를 완수하기 위해 자율적으로 계획 수립 및 이행
  2. 조합 실행(Combined): 웹 검색이나 외부 API 등 도구 조합 및 활용하여 작업 수행
  3. 재귀 실행(Recursive): 작업을 반복적으로 평가하고 수정하여 최적의 결과를 도출

AI Agent  구조적 핵심 구성 요소

에이전트는 센서를 통해 환경을 인식하고 액추에이터를 통해 해당 환경에 따라 행동하는 것으로 볼 수 있습니다. 이는 전통적으로 인간공학에서 usability testing를 통해 왜 오류가 발생하는가를 설명하기 위한 PCA model을 따릅니다. 여기서 PCA는 perception, cognition, 그리고 action을 의미합니다. 

Agents interact with environments through sensors and actuators (source: 고민수)

  • Perception (지각): 에이전트는 외부 환경으로부터 발생하는 다양한 종류의 데이터를 감지하여 환경의 상태에 대한 이해를 하게 됩니다. 이 때 외부 환경으로부터 데이터를 수신하기 위한 장치가 센서가 됩니다. 
  • Cognition (인지): 센서로부터 수집된 데이터를 에이전트는 분석하고 판단하는 의사결정을 수행하게 됩니다. 이 과정에서 인공지능이 활용됩니다.
  • Action (행동): 의사결정에 따른 출력물은 다양한 형태로 수행됩니다. 대표적으로 행동이 될 수도 있고, 시각적 인터페이스를 통해 전달되는 정보일 수 있습니다. 
정리하면, ① 지각-센서, ② 인지-인공지능, ③행동-구동기로 연계할 수 있습니다. 

인공지능 에이전트의 동작 원리 (source: 코딩하는 수학쌤)

위와 같이 에이전트는 센서-인공지능-구동기의 역할이 계속 순환적으로 반복하면서 작동한다고 볼 수 있습니다. 

AI Agent 유형 및 사례

일반적으로 AI 에이전트는 인지 지능과 능력 정도에 따라 다섯 가지 유형으로 분류할 수 있습니다. 이러한 다섯 가지 에이전트는 시간이 지남에 따라 더 나은 행동을 할 수 있게 되어 전체적인 성능을 개선합니다. 

Five main types of AI agents (source: SIMFORM)

  • Simple reflex agents: 현재 상황에 대해서만 미리 정의된 규칙에 따라 반응합니다. 과거를 기억하거나 미래를 예측하지 않고 현재 입력에만 기반하여 좁은 범위의 결정을 내립니다. 완전히 관찰 가능한 환경에서만 성공 가능하며 조건-행동(Condition-Action) 규칙에 의해서만 작동합니다. 
    • 사례: 스마트 온도조절기는 방의 현재 온도에 따라 직접적으로 반응합니다. 온도가 특정 수준 이하로 떨어지면 자동으로 난방을 켜고, 특정 수준 이상으로 올라가면 에어컨을 켭니다.

  • Model-based reflex agents: 환경의 상태를 모델링하고 이를 기반으로 행동을 결정합니다. 과거 데이터를 저장해 환경의 변화를 이해합니다. 부분적으로 관찰 가능한 환경에서 작동하고 상황을 추적할 수 있습니다. 
    • Model: 세계에 어떤 일이 일어나고 있는지에 대한 지식
    • Internal State: 과거 인식 기록을 바탕으로 현재 상태를 이해 
    • 사례: 로봇청소기는 방의 구조를 파악하여 모델링하고, 장애물을 피해 최적의 경로를 계산하며 청소를 수행합니다. 

  • Goal-based agents: 실시간 환경 데이터를 평가할 뿐만 아니라 행동을 수행하기 전에 다양한 옵션을 고려하여 원하는 결과에 가장 빠르고 효율적으로 도달할 수 있는 방법을 선택합니다. 모델 기반 에이전트의 능력을 확장하여 목표가 달성 가능한지를 결정하기 전에 일련의 여러 행동들을 고려하는 능동적인 에이전트에 해당합니다. 
    • 사례: 내비게이션 시스템은 사용자가 설정한 목적지(목표)에 도달하기 위해 교통 상황과 경로를 분석하여 최적의 경로를 안내합니다. 

  • Utility-based agents: 복잡한 추론 방법을 사용하여 다양한 시나리오와 각각의 장단점을 비교하고, 사용자의 선호도에 따라 전반적으로 가장 높은 효용 가치를 제공하는 옵션을 선택합니다. 목표 기반 에이전트와 비슷하지만 주어진 환경, 조건, 상태에서 유용성을 측정할 수 있는 추가 요소를 제공합니다. 유용성 함수를 통해 각각의 행동이 목표를 얼마나 효율적으로 달성하는지 확인할 수 있습니다. 
    • 사례: 여행객들은 자신의 일정과 예산 등의 요소를 고려한 최적의 항공권을 찾을 수 있습니다. 

  • Learning agents: 경험을 통해 지속적으로 학습하여 성능을 개선하고 자동으로 적응합니다. 환경과 상호작용하면서 피드백을 받고, 행동과 결과를 분석하여 자신을 최적화합니다. 
    • 학습(Learning element): 학습을 통해 행동을 개선합니다. 
    • 비판(Critic): 에이전트가 수행 역량 관련 피드백을 받습니다.
    • 퍼포먼스(Performance element): 외부 행동을 선택합니다. 
    • 문제 생성(prbolem generator): 새롭고 유익한 경험으로 이어질 행동을 제안합니다. 
    • 사례: 추천 시스템은 전자 상거래 플랫폼에서 사용자의 선호도를 분석하여 다양한 옵션 중 최고의 만족도를 제공할 상품을 추천합니다. 이 때, 사용자 피드백과 행동으로부터 지속적으로 학습하여 더 나은 추천을 제공합니다. 

 

빅테크 기업들의 AI Agent 시장 선점을 위한 노력

Google

버텍스 AI 에이전트 (Vertex AI Agents)

  • 대규모 언어 모델을 기반으로 빌드된 새로운 자연어 이해 플랫폼으로 대화식 사용자 인터페이스를 쉽게 설계하여 모바일 앱, 웹 애플리케이션, 기기, 봇, 대화형 음성 응답 시스템 등에 통합할 수 있습니다.

AI 에이전트 '프로젝트 아스트라' 공개

  • 말하는 고급 반응형 에이전트: AI가 주변 세계를 보고 추론할 수 있는 경험을 구축하고 있습니다.

The role of genAI agents (source: Google)

OpenAI

오퍼레이터(Operator)라는 코드명을 가진 프로젝트는 내년 1월 공개 예정

  • 다양한 형태의 에이전트를 개발해 왔으며, 그 중 가장 완성도가 높은 것은 웹 브라우저에서 인간 대신 작업을 처리해 주는 도구인 것으로 알려져있습니다. 
  • 웹 작업과 코딩 등 용도별로 다양한 에이전트를 개발 중인 것으로 볼 수 있습니다.
성능 고도화를 위해 '추론'과 '도구사용' 능력 강화에 집중

2025년 1월 출시 예정인 오픈AI의 인공지능(AI) 에이전트 오퍼레이터(Operator)

MS

'코파일럿 AI 에이전트'와 함께 코파일럿 탑재한 AI PC '코파일럿+PC' 공개

  • 코파일럿은 AI를 위한 UI(사용자 인터페이스)로, 앞으로 모든 직원은 자신을 알고 자신의 업무 방식을 이해하는 코파일럿을 가지게 될 것 - 사티아 나델라 MS 최고경영자
    • 특정 사이트나 파일, 폴더가 있는 곳을 쉽게 찾아주는 '셰어포인트 에이전트'
    • 직원들이 휴가 신청을 하고 급여 및 복지 정보를 대신 확인해주는 '직원 셀프 서비스 에이전트'
    • 다양한 에이전트가 들어 있는 '에이전트 라이브러리(Agent library)'를 활용해 상황에 따라 반복적인 작업을 수행할 수 있는 에이전트를 구축

Meta

인스타그램·왓츠앱 등에 AI 비서 '메타 AI' 탑재

  • 메타의 차세대 거대 언어모델 '라마3'를 기반으로 하는 메타 AI는 이용자 질문에 답하고 애니메이션을 만들고 이미지를 생성할 수 있습니다.
  • 레스토랑 추천, 휴가 계획 등의 도움을 받을 수 있습니다.

Apple

OpenAI 등과 협업해 애플 기기 전반에 AI 기능 탑재할 예정

  • 애플은 애플 생태계에서의 AI 시스템을 'Apple Intelligence'라고 명명하며, 음성 비서인 Siri가 사용자를 더 잘 이해하여 맞춤화 서비스를 제공할 수 있도록 기능적으로 향상되었습니다.
  • 앱의 콘텐츠를 이해하여 시스템의 어느 곳에서나 앱에서 얻은 정보를 사용자에게 제공할 수 있게 되었습니다. 이는 사용자의 요구를 이해하고, 적합한 행동을 취하는 LAM (Large Action Model)라고 볼 수 있습니다. 

 

애플은 음성 비서 Siri와 애플 인텔리전스를 결합하여, AI 에이전트 시스템을 구성하고 있습니다. 

① 사용자가 Siri에게 새로운 일정을 추가해달라고 요청하면,
② Siri는 이 요청을 애플 인텔리전스에 보내고, 
③ 애플 인텔리전스는 일정 앱에 접근하여 사용자가 요청한 일정을 추가합니다.

AI Agent - 기술적 관점

AI Agent의 요소 기술과 흐름 연계도

기존의 AI가 사용자의 명령에 따라 작업을 수행하는 방식이었다면, AI Agent는 인간처럼 자체적으로 계획을 세워 목표를 달성하는데 큰 차이가 있습니다. 

Andrew Ng (앤드류 응)은 Agentic Approach로 1) 반추, 2) 도구 사용, 3) 계획, 4) 에이전트간 협력을 제시

Overview of a LLM-powered autonomous agent system (source: Lilian Weng)

  • 반추(Reflection): AI의 답변을 다른 AI가 재검토함으로써 정확도를 높이는 방법
  • 도구 사용(Tool use): AI가 도구를 활용하는 방법 역시 정확도와 유용성을 높이는데 기여, RAG(검색 증강 생성) 기법은 외부 소스에서 가져온 정보로 생성 AI 모델의 정확성과 신뢰성을 향상
  • 계획(Planning): AI가 복잡한 작업을 추론하고 고안하며 분해할 수 있도록 훈련하는 것으로 자율적으로 작업을 세분화하고, 필요한 하위 단계와 도구를 식별하며, 다양한 모델을 호출함으로써 작업을 수행
  • 에이전트간 협력(Multi-agent collaboration): 두 개 이상의 에이전트가 협업하여 작업을 수행하는 구조로, 각 에이전트는 고유한 페르소나를 가지며 동일하거나 서로 다른 언어 모델과 도구를 사용

 

AI Agent 미래 전망

AI 에이전트의 기대효과

AI 에이전트는 단순히 컴퓨터와의 상호작용 방식을 바꾸는 것뿐만 아니라 소프트웨어 산업 전체를 뒤흔들 것이다 - 빌 게이츠

 

가트너는 AI 에이전트를 통해 자율적으로 이뤄지는 일상적 업무 결정의 비율이 2024년 0%에서 2028년에는 최소 15% 증가할 것으로 전망했습니다. 더불어 시장조사기관 Grand View Research에 따르면 글로벌 자율 AI 및 에이전트 시장은 2023년 58억 2,000만 달러에서 연평균 성장률(CAGR) 42.8%를 기록하며 2030년 705억 3,000만 달러를 넘어설 전망이라고 합니다. 그렇다면 왜 AI 에이전트가 AI 기술 발전에 있어 중요한 이정표로 인식되는 것일까요? 

  1. 기능성의 비약적 확장: AI 에이전트는 단순 대화를 넘어 복잡한 작업을 수행할 수 있어, AI의 실용성과 적용 범위를 크게 확대할 수 있음
  2. 인간-AI 상호작용의 질적 변화: 더 자연스럽고 효율적인 인간-AI 협업이 가능해, 일상생활과 업무에 더 깊이 통합할 수 있음
  3. AI의 자율성 증대: 인간의 적은 개입만으로도 큰 생산성 향상이 가능함
  4. 문제 해결 능력의 향상: 조합 실행, 재귀 실행을 통해 복잡한 문제를 다각도로 분석하고 해결하여 실질적 가치를 높임
  5. 기술 융합의 촉진: AI 에이전트는 다양한 기술들을 통합하여 사용하므로, 여러 기술 분야의 발전을 가속할 수 있음
  6. 새로운 산업과 서비스의 창출: 기존 AI 보다 폭넓은 활용 범위로 인해 새로운 비즈니스 모델과 서비스를 창출할 수 있음
생성형 AI와 AI 에이전트의 발전은 비즈니스의 본질적인 변화를 의미합니다. 과거의 기술 혁신이 주로 생산성 증대와 비용 절감을 통한 수익성 극대화에 중점을 두었다면, 오늘날의 AI 기술은 기업의 의사결정 과정에 깊숙이 관여하여, 보다 혁신적이고 창의적인 솔루션을 제공할 것입니다. 

AI 에이전트의 한계 및 장애물

  1. Data bias: 의사 결정을 내리는 데 데이터에 크게 의존합니다. 사용하는 데이터에 편향성이 있다면 불공정하거나 차별적인 결과를 초래할 수 있습니다. 
  2. Lack of accountability: 인간의 개입 없이 결정을 내릴 수 있기 때문에 그들의 행동에 대해 책임을 묻기가 여러울 수 있습니다. 
  3. Lack of transparency: AI 에이전트의 의사 결정 과정은 복잡하고 불투명할 수 있어, 특정 결정에 도달하는 방식을 이해하기 어려울 수 있습니다. 
  4. Ethical considerations: AI 에이전트가 윤리적 결정을 내리도록 프로그래밍하는 것은 매우 어려운 과제가 될 수 있습니다. 
  5. Security risks: 소프트웨어 에이전트는 사이버 공겨겡 취약할 수 있으며, 이는 의사 결정 과정을 손상시키거나 데이터 유출로 이어질 수 있습니다. 
  6. Lack of adaptability: 학습 데이터에 따라 행동하기 때문에 새로운 상황이나 맥락에 적응하는 데 어려움을 겪을 수 있습니다. 

더보기

'Business Insights > Industry·Market·Technology' 카테고리의 다른 글

온디바이스 AI  (4) 2024.12.02
ATL 1.0: 인공지능 기술 수준 정의  (3) 2024.11.17
The AI Revolution  (4) 2024.11.17