AI 에이전트 개발 기업 H가 클라우드 기반 웹 에이전트인 ‘러너 H(Runner H)’를 출시한다고 21일 밝혔다. 

AI 에이전트는 사람의 제어 하에 복잡하고 여러 단계를 거치는 반복적인 워크플로우를 자동화한다. H는 독자적인 파운데이션 및 실행 모델을 기반으로 추론, 계획 및 실행이 가능한 에이전트를 제공한다. 

러너 H는 대기업의 다중 시스템 및 레거시 솔루션 환경에 원활히 통합되거나 신생 기업이 AI 에이전트로 구성된 팀을 활용하게 한다. 이는 일상적인 작업부터 복잡한 QA 테스트까지 인간과 기계의 협업을 위한 새로운 가능성을 제공한다.

다양한 분야 자동화로 시간과 비용 절약

한 번의 프롬프트 입력으로 전체 채용 프로세스를 자동화할 수 있다. 직무 설명 작성부터 이력서 취합, 지원자 맞춤형 후속 연락까지 불필요한 수작업을 없앨 수 있다. 링크드인(LinkedIn) 등 플랫폼에서 얻은 인사이트를 바탕으로 지원자 데이터를 보강하고, CRM 자동 업데이트와 온보딩에 적용할 수 있다. 기업은 몇 주가 소요되던 업무를 단 몇 분으로 단축해 시간과 리소스를 절약하며 인재를 채용할 수 있다.

많은 시간과 리소스 투입이 필요한 웹사이트 및 애플리케이션 테스트 과정을 효율화한다. 사용자 인터페이스의 변동사항에 원활히 적응하고 반복적인 테스트 프로세스를 자동화할 수 있다. 페이지 가용성 검증, 실사용자 행동 시뮬레이션, 결제 수단 간 호환성 보장 등 복잡한 워크플로우도 쉽게 탐색 가능하다. 개발자는 테스트 유지관리 부담을 줄여 혁신과 창의성에 집중하고 핵심 영역에 초점을 맞춰 수익을 창출할 수 있다.

보험 플랜 조회, 메모 작성, 비용 분석 및 제출, 환급 추적 등 시간과 비용이 소요되는 비용 청구 워크플로우를 자동화해 업무를 간소화할 수 있다. 즉, 아웃소싱에 대한 의존과 지연을 줄이고 기업이 재무 운영을 제어하도록 지원한다.

성능과 추론에서 테스트 평가 높아

베타버전인 ‘에이전트 러너 H 0.1’은 공개 벤치마크인 웹보이저(WebVoyager)에서 AI 기업 앤트로픽(Anthropic)의 컴퓨터 유즈(Computer Use)보다 29% 더 뛰어난 성능을 기록했다.  

러너 H에 기반한 H의 소형 모델 2B 파라미터 모델이 코드 및 함수 호출 평균 성능이 기존 대형 모델보다 뛰어났다.
러너 H에 기반한 H의 소형 모델 2B 파라미터 모델이 코드 및 함수 호출 평균 성능이 기존 대형 모델보다 뛰어났다.

러너 H에 기반한 H의 소형 모델인 2B 파라미터의 대규모언어모델(LLM) 및 비전언어모델(VLM)은 미스트랄(Mistral)과 메타(Meta)의 대형 모델을 능가했다. 20억 개 매개변수 모델은 코드 및 함수 호출의 평균 성능이 높아 큰 규모의 모델보다 뛰어난 성능을 갖췄다.

또한 그래픽과 텍스트 요소를 인식 및 이해하고 상호 작용할 수 있도록 3B 매개변수 비전언어모델(VLM)을 훈련하고 전문화했다. H-VLM은 스크린스팟(Screenspot)의 그래픽 사용자 인터페이스(GUI) 실행 기준 벤치마크 분석 결과, 식별(localization) 부문에서 오픈AI의 GPT4o, 앤트로픽의 소넷3.5(Sonnet 3.5), 미스트랄의 픽스트랄 라지(Pixtral Large), 메타의 라마(Llama) 등의 성능을 뛰어넘었다.  

현재 웹을 주력 환경으로 두고 웹 테스트와 프로세스 자동화, 아웃소싱과 같은 분야에서 활용하고 있다. 러너 H는 모든 그래픽 인터페이스를 탐색할 수 있는 AI 에이전트로서 범용 자동화를 목표로 하고 있다.

H의 CEO 찰스 칸토르(Charles Kantor)는 “러너 H는 사용자의 워크플로우를 자동화하고 작업을 간소화하며 웹을 소유하도록 하는 등 이전과 전혀 다른 방식으로 AI를 활용할 수 있다.”라고 말했다.

관련기사

저작권자 © 지티티코리아 무단전재 및 재배포 금지