Bot을 넘어서: AI 에이전트가 엔터프라이즈 자동화의 차세대 물결을 주도하는 방법

모든 직업은 인간과 기계가 분담하는 일련의 작업으로 생각할 수 있습니다. 수년 동안 소프트웨어는 점점 더 많은 작업을 처리해 왔지만, 오늘날에도 인간은 여전히 대부분의 비즈니스 프로세스를 주도하고 있습니다. 모든 기능에서 인건비는 소프트웨어 비용보다 몇 배나 더 큽니다.

AI 에이전트는 이 작업의 균형을 결정적으로 바꿀 가능성이 있습니다. 이전 세대의 소프트웨어가 주로 순차적으로 실행할 수 있는 낮은 수준의 작업을 처리했던 것과 달리, 새로운 인지 아키텍처는 에이전트가 동적으로 프로세스 전체를 자동화할 수 있도록 합니다. 이는 단순히 문서를 읽고 쓰는 AI가 아니라, 애플리케이션 로직의 흐름을 결정하고 여러분을 대신해 작업을 수행하는 AI입니다.

그리고 이 에이전트들은 오늘날 기업에서 LLM이 제공하는 가장 큰 기회를 나타냅니다. 다른 글에서 우리는 이러한 새로운 "에이전트"가 무엇이며 이를 가능하게 한 설계 패턴에 대해 설명했습니다. 여기에서는 이들이 어떻게 기업에서 적용되어 새로운 기업 자동화 시대를 이끌고 있는지 살펴보겠습니다.

RPA의 귀환?

이 이야기를 이미 들어본 것처럼 느껴진다면, 지난 10년 동안 UiPath와 Zapier 같은 회사들이 "봇 자동화"라는 이름으로 유사한 비전을 제시했기 때문입니다.

UiPath가 처음이었습니다. 로보틱 프로세스 자동화(RPA) 거인의 핵심 사업은 화면 스크래핑과 GUI 자동화를 통해 "봇"이 사용자의 작업을 기록하고 문서에서 정보를 추출하거나, 폴더를 이동시키고, 양식을 채우고, 데이터베이스를 업데이트하는 등의 순차적인 작업을 모방할 수 있게 하는 것이었습니다.

이후, Zapier와 같은 iPaaS 공급업체들은 생산성 사례를 위한 더 경량화된 "API 자동화" 접근 방식을 제시했습니다. 이 플랫폼은 사전 구축된 API 통합 및 웹훅을 사용하여 더 안정적인 자동화를 제공했지만, 이 접근 방식은 회사의 범위를 웹 애플리케이션 자동화로 제한했고, 이는 API를 지원하지 않는 소프트웨어까지 자동화할 수 있는 UiPath의 능력과 차별되었습니다.

UiPath와 Zapier는 부서별 또는 산업별 소프트웨어 시스템 간에 존재하는 다양한 기업 프로세스를 처리하기 위한 조합 가능한 규칙 기반 수평 자동화 플랫폼의 시장을 입증했습니다. 그러나 기업들이 봇 기반 자동화를 확장하면서 이러한 전통적인 아키텍처의 기능과 약속된 자율성 간의 격차가 드러나기 시작했습니다. 특히 다음과 같은 문제들이 있었습니다:

  • 여전히 많은 인력과 수작업이 필요함. 봇과 자동화에 대한 이야기는 많지만, 자동화를 설정하고 유지하는 과정은 여전히 고통스럽게 수작업입니다. 사실, UiPath가 벌어들이는 1달러당 7달러가 EY와 같은 구현 및 컨설팅 파트너에게 들어가며, 이는 길고 비용이 많이 드는 배포 및 유지보수 주기를 초래합니다.
  • 취약한 UI 자동화 또는 제한된 API 통합. 소프트웨어 UI가 변경되면 UI 자동화는 자주 깨지며, API는 더 안정적이지만 특히 레거시 또는 온프레미스 소프트웨어와의 통합이 제한적입니다.
  • 비정형 데이터를 처리할 수 없음. 기업 데이터의 80%는 비정형 및 반정형 데이터로 구성되지만, 순차 기반 자동화는 이 데이터 대부분을 지능적으로 처리할 수 없습니다. Hyperscience와 Ocrolus와 같은 지능형 문서 처리(IDP) 솔루션이 여기서 진전을 이루려 했지만, 간단한 "문서 추출 및 변환" 사례에서도 엣지 케이스 및 예외 처리를 처리하는 데 어려움을 겪었습니다.

더욱이, 기존 RPA와 iPaaS 솔루션은 LLM을 통합하려 할 때조차 결정론적 아키텍처에 얽매여 있습니다. 오늘날 UiPath의 AI 솔루션인 Autopilot과 Zapier의 AI Actions는 각각 (1) 텍스트-액션 또는 (2) 시맨틱 검색, 합성, 또는 원샷 생성과 같은 하위 에이전트 설계 패턴만을 제공합니다.

이러한 AI 기능은 강력할 수 있습니다. 이는 비즈니스 기능이 자동화 규칙서를 IT가 아닌 비즈니스가 소유할 수 있도록 하고, 비전 트랜스포머를 통한 강력한 객체 감지 및 인식을 OCR 대신 사용할 수 있게 하며, RAG를 통한 데이터 추출 및 변환을 가능하게 합니다. 그러나 우리는 다음에서 탐구할 더 변혁적인 프로세스 자동화 사용 사례를 놓치고 있습니다.

의사결정 엔진으로서의 AI 에이전트

에이전트는 근본적으로 다릅니다. 이들은 오늘날의 RPA 봇의 하드코딩된 논리나 생성 AI 혁명의 첫 번째 물결을 정의한 RAG 앱과 달리 애플리케이션의 제어 흐름 중심에서 의사결정 엔진 역할을 합니다. 이들은 적응성, 다단계 작업, 복잡한 추론, 그리고 강력한 예외 처리를 가능하게 합니다.

청구서 조정 예시를 통해 그 영향을 설명해 보겠습니다. 아래는 새 청구서 PDF를 회사의 총계정원장과 일치시키기 위한 간소화된 프로세스 다이어그램입니다(RPA 구현 엔지니어가 RPA용으로 시각적으로 모델링해야 할 것과 유사한 프로세스).

이 워크플로우의 복잡성은 빠르게 감당하기 어려운 수준으로 증가하며, 첫 번째 세트의 세 가지 의사결정만으로도 모든 관련 엣지 케이스와 예외를 처리하는 것은 거의 불가능해집니다. 대부분의 경우, 이 워크플로우를 기계적으로 실행하는 RPA 봇은 부분적으로 일치된 항목이나 누락된 항목을 인간에게 에러로 보고하게 됩니다. 아마도 이것이 오늘날 대부분의 기업이 여전히 수백 명의 직원을 투입해 수작업으로 이 과정을 수행하는 이유일 것입니다.

그러나 동일한 워크플로우에 에이전트를 적용하면 성능이 훨씬 우수해집니다. 에이전트는 다음과 같은 능력을 가집니다:

  • 새로운 상황에 적응하기: 에이전트는 새로운 데이터 소스, 청구서 양식, 명명 규칙, 계정 번호, 심지어는 정책 변경도 기본적인 추론과 관련된 비즈니스 맥락을 바탕으로 인식하고 적응할 수 있습니다. 별도의 프로그래밍이나 명시적인 SOP가 없어도 말이죠.
  • 다단계 작업 실행: 청구서 금액이 일치하지 않는 경우, 에이전트는 공급업체로부터 최근 이메일을 스캔하여 가격 변경 통지를 확인하는 등의 다단계 조사를 실행할 수 있습니다.
  • 복잡한 추론 수행: 예를 들어, 국제 공급업체의 청구서를 회사의 총계정원장과 조정해야 한다고 가정해 보겠습니다. 이 과정에는 청구서 통화, 총계정원장 통화, 거래일, 환율 변동, 국경 간 수수료, 은행 수수료 등의 다양한 고려사항이 포함됩니다. 이 모든 것을 검색하고 함께 계산하여 결제를 조정해야 합니다. 에이전트는 이러한 지능을 갖추고 있지만, RPA 봇은 단순히 인간에게 이 문제를 보고할 수밖에 없습니다.
  • 불확실성 처리: 에이전트는 총 주문 금액 및 과거 청구서 발행 시기와 빈도와 같은 맥락 단서를 기반으로 개별 항목에 대한 반올림 오류나 판독 불가능한 숫자와 같은 예외에 대해 견고합니다.

AI 에이전트 시장 환경

에이전트는 공상과학 속 이야기에만 그치지 않습니다. 이 카테고리는 아직 초기 단계이지만, 스타트업에서 포춘 500대 기업에 이르기까지 많은 기업들이 이미 이러한 시스템을 대규모로 구매하고 활용하고 있습니다.

현재 에이전트 환경은 두 가지 핵심 차원으로 시각화할 수 있습니다:

  • 도메인 특수성: 헬스케어와 같은 특정 버티컬 산업 또는 고객 지원 부서와 같은 부서별로 고도로 전문화된 에이전트에서부터 광범위하고 일반적인 기능을 가진 수평 에이전트 플랫폼에 이르기까지 다양합니다.
  • LLM 자율성: 언어 모델이 애플리케이션 로직을 독립적으로 계획하고 지시할 수 있는 정도를 나타냅니다.

이 두 가지 요소는 우리가 작업 중인 AI 에이전트 시장 지도의 축을 형성합니다.

마켓 맵의 오른쪽 상단에서 가장 수평적이고 일반화할 수 있는 에이전트에는 다음과 같은 것들이 있습니다:

  • 엔터프라이즈 에이전트. 확장 가능한 에이전트 플랫폼은 자연어로 작성된 SOP 또는 규칙서(마치 신규 직원에게 제공하는 것과 같은)를 통해 여러 기능과 워크플로우에서 에이전트를 구축하고 관리할 수 있게 합니다. 이러한 플랫폼은 특히 각 비즈니스 유닛별 개별 솔루션이 아닌, 폭넓게 적용할 수 있는 에이전트 기능을 찾는 중앙 IT 구매자들에게 매력적입니다. 예를 들어, Sema4의 청구서 조정 에이전트의 핵심 처리 능력은 금융, 조달 및 운영 전반에 걸친 다양한 데이터 검증 작업에 적용될 수 있습니다.

그러나 대부분의 엔터프라이즈 에이전트는 "레일 위의 에이전트(agents on rails)" 아키텍처를 사용하여 새로운 프로세스마다 미리 정의된 작업, 비즈니스 맥락 및 가드레일로 고정된 워크플로우에 기반을 둬야 합니다. 이러한 데이터 인프라는 워크플로우 간에 공유될 수 있지만, 이 플랫폼의 수평적 특성은 인간과 유사한 일반화 가능성보다는 사용 사례를 쌓아올림으로써 형성됩니다. 결과적으로 이 분야의 일부 플레이어는 더 큰 제품 및 시장 진입 전략(GTM) 레버리지를 위해 특정 도메인으로 집중하고 있습니다 (예: 고객 지원과 보안에 집중하는 Brevian, 판매 및 지원에 집중하는 Ema).

  • 브라우저 에이전트. MultiOn, Induced, Twin과 같은 웹 에이전트는 또 다른 유형의 수평적이고 일반화 가능한 에이전트를 나타냅니다. 대부분은 다양한 소프트웨어 인터페이스 및 그 기저 코드베이스에 대해 학습된 비전 트랜스포머를 활용하는 "일반 AI 에이전트" 설계를 따릅니다. 이를 통해 에이전트는 웹 구성 요소, 그 기능 및 상호작용을 "이해"하고, 웹 브라우징, 시각적 UI 작업 및 텍스트 입력을 자동화할 수 있습니다.

이러한 에이전트들은 일반화 가능성을 얻는 대신 일관성에서 희생이 따릅니다. 현재 대부분은 더 간단한 생산성 또는 전자 상거래 사용 사례를 목표로 하며, 기업 등급의 성능을 향해 나아가고 있습니다. 적절한 데이터 스캐폴딩과 가드레일이 있는 더 제한된 문제 공간의 이점을 얻지 못한 채, 더 신뢰할 수 있는 브라우저 에이전트는 복잡한 작업 및 관찰 공간을 관리하고, 여러 페이지에 걸쳐 맥락을 유지하며, 다양한 웹 인터페이스를 해석하는 등의 주요 과제를 해결해야 합니다.

  • AI 지원 서비스. 기업의 에이전트 기능에 대한 수요는 고객이 자체적으로 에이전트를 생산화할 수 있는 능력을 초과하고 있습니다. 특히 "레일 위의 에이전트" 설계를 실무에서 작동시키려면 광범위한 데이터 인프라와 가드레일이 필요합니다. Distyl 및 Agnetic과 같은 회사는 이 격차를 메우기 위해 "AI를 위한 Palantir" 모델의 전방 배치된 엔지니어링 서비스를 제공하고 있습니다. Palantir의 Foundry와 마찬가지로, 이러한 회사들은 고객 전반에 걸쳐 모듈형 시스템 인프라를 재사용할 수 있어, 시간이 지남에 따라 플랫폼과 서비스의 비율을 재조정할 수 있습니다.

그러나 모든 에이전트가 수평적이고 일반화 가능성을 목표로 하는 것은 아닙니다. 점점 더 많은 도메인 및 워크플로우 특화 에이전트들이, 그들이 해결하려는 문제 유형을 제한함으로써 신뢰성을 높이고 있습니다:

  • 버티컬 에이전트. 버티컬 에이전트의 가장 유망한 기회는 현재 SOP 또는 규칙서를 따라 인간이 처리하는 수작업 기반 프로세스에서 발견됩니다. 많은 기업들은 이미 이러한 기능을 비즈니스 프로세스 아웃소싱(BPO) 업체나 계약업체에 외주를 주고 있습니다. 이러한 작업은 규칙 기반 자동화에는 너무 복잡하지만, 자체 지식 노동자를 고용할 만큼 도전적이거나 차별화되지 않은 경우가 많습니다. 주요 카테고리에는 고객 지원, 채용, 코드 리뷰, 테스트 및 유지보수와 같은 특정 소프트웨어 개발 작업, 콜드 세일즈 아웃바운드, 그리고 보안 운영이 포함됩니다.
  • AI 어시스턴트. 에이전트의 초점을 도메인 특수성 대신 작업 특수성으로 좁히는 또 다른 방법은 AI 어시스턴트입니다. AI 어시스턴트는 엔터프라이즈 및 버티컬 에이전트가 처리하는 더 복잡한 엔드투엔드 프로세스보다 더 간단하고 생산성 지향적인 작업을 실행합니다. 일반적인 기본 작업에는 간단한 단계의 웹 리서치, 지식 추출, 요약 및 ad-hoc 작업을 위한 비정형 데이터 변환(예: PDF 파일 채팅 또는 Gong 트랜스크립트에서 기능 요청 추출)이 포함됩니다.

마지막으로, 에이전트는 아니지만 에이전트 기반 솔루션과 같은 예산을 두고 경쟁하며 때로는 동일한 워크플로우와도 경쟁하는 생성 AI 솔루션의 광범위한 카테고리가 존재합니다. 주로 RAG 아키텍처를 기반으로 구축된 이러한 솔루션은 애플리케이션 제어 흐름에 포함되지 않으므로 에이전트와 같은 인간과 유사한 추론을 더 완전히 복제할 수 없습니다. 그러나 이들의 기능은 여전히 상당한 서비스 자동화를 가능하게 하며, 기업에 제어권을 제공합니다:

  • 버티컬 AI: 시맨틱 검색 및 비정형 데이터 변환은 버티컬 워크플로우에서 강력한 기본 기능입니다. 예를 들어, 헬스케어 AI 자동화 플랫폼 Tennr는 팩스, PDF, 전화 통화 및 기타 복잡한 소스에서 비정형 데이터를 추출하고 이를 클리닉의 EHR에 입력하여 추천 처리의 병목을 제거하고 직원이 수동으로 데이터를 입력할 필요를 없애줍니다. 산업용 AI는 또 다른 예로, 유사한 접근 방식을 사용하여 제조업체의 견적 워크플로우를 자동화합니다.
  • RAG-as-a-Service: Danswer와 Gradient와 같은 RAG-as-a-Service 회사들은 버티컬 시맨틱 검색 및 비정형 데이터 변환 회사들의 수평적 대응책으로, 고객이 PDF와 같은 비정형 데이터 소스를 쿼리하고 데이터를 추출하여 더 구조화된 데이터베이스 또는 기록 시스템에 입력할 수 있는 기능을 제공합니다.
  • 엔터프라이즈 검색: Glean, Perplexity, Sana*는 또 다른 목적을 위한 시맨틱 쿼리 기능을 제공하며, 조직 전체의 지식을 더 잘 관리하고 기업 데이터 사일로를 해체하기 위해 개념적으로 관련된 문서를 인덱싱하고 검색합니다.

미래의 기업 자동화

생성 AI의 두 번째 물결은 단순히 문서를 읽고 쓰는 것이 아니라, 여러분을 대신해 사고하고 행동할 수 있는 에이전트에 의해 정의될 것입니다. 이러한 아키텍처가 성숙해짐에 따라, 이들은 서비스 경제에서 AI가 주도권을 잡는 강력한 촉매제가 될 것입니다.


(출처: Menlo VC)