AI 에이전트 스킬 vs 멀티에이전트

2026. 2. 26. 05:08개발/AI

1. 멀티에이전트와 스킬, 왜 헷갈릴까?

취업에 성공하고 나서 개발보다는 AX(AI Transformation)를 어떻게 높일 수 있을지 고민하며 코딩을 하던 중, 낯선 개념 두 가지를 마주쳤다.

스킬멀티에이전트.

스킬은 에이전트가 특정 책을 꺼내 읽고 그걸 참고해서 일하는 것, 멀티에이전트는 여러 에이전트가 각자 잘하는 일을 나눠서 맡는 것이라고 한다. 그런데 여기서 의문이 생겼다.

어차피 둘 다 뭔가를 "불러다 쓰는" 건데, 도대체 뭐가 다른 걸까?

2. 스킬이란 무엇인가?

스킬을 한 문장으로 정의하면 이렇다.

에이전트가 일을 잘 하기 위해 참고하는 "매뉴얼"이다.

 

 

사람으로 치면, 신입사원한테 "이 회사에서는 이렇게 일해"라고 적힌 온보딩 문서를 쥐여주는 것과 같다. 에이전트는 기본적으로 아무것도 모르는 상태로 시작한다. 어떤 형식으로 출력해야 하는지, 어떤 말투를 써야 하는지, 어떤 절차를 따라야 하는지. 스킬은 그 공백을 채워준다.

[하나의 에이전트]
  ├─ 스킬 A
  ├─ 스킬 B
  └─ 스킬 C

어떤 문제를 해결하는가

매번 프롬프트에 긴 설명을 쓰지 않아도 된다는 것이다. 예를 들어 "보고서를 작성할 때는 항상 이 형식을 따르고, 이 단어는 쓰지 마라"는 규칙을 매번 입력하는 건 비효율적이다. 스킬에 한 번 정리해두면, 에이전트는 매번 그걸 꺼내 읽고 일한다.

그래서 토큰이 어떻게 절약되는가

여기서 토큰 얘기를 잠깐 해야 한다. AI는 텍스트를 처리할 때 "토큰"이라는 단위로 읽고 쓴다. 대략 한글 한 글자가 1~2토큰 정도라고 보면 된다. AI는 토큰을 쓸수록 비용이 발생하고, 한 번에 처리할 수 있는 토큰 양에도 한계가 있다.

스킬이 없으면 어떻게 될까. 매번 프롬프트에 모든 규칙을 전부 집어넣어야 한다. 요청이 100번이면 그 설명도 100번 반복된다. 토큰 낭비다.

스킬은 다르게 동작한다. 규칙 전체를 매번 집어넣는 게 아니라, 일단 인덱스(목차)만 올려둔다. 에이전트는 그 인덱스를 보고 "지금 이 작업엔 이 규칙이 필요하겠다"고 판단한 다음, 해당 내용만 꺼내 읽는다. 도서관에서 책 전체를 외우는 게 아니라, 필요한 페이지만 펼쳐보는 것과 같다.

결과적으로 컨텍스트에 올라오는 내용이 줄어들고, 그만큼 토큰을 아낄 수 있다.

이런 상황에서 스킬을 쓴다

회사에서 매주 주간보고를 AI로 자동화하고 싶다고 해보자. 보고서 양식이 정해져 있고, 쓰면 안 되는 표현도 있고, 분량 기준도 있다. 이런 규칙들을 스킬로 만들어두면, 에이전트는 매번 그 기준에 맞게 보고서를 뽑아낸다. 프롬프트에 매번 설명할 필요가 없고, 토큰도 아낄 수 있다.

3. 멀티에이전트란 무엇인가?

멀티에이전트를 한 문장으로 정의하면 이렇다.

각자 맡은 역할이 있는 AI 여러 명이 협력해서 하나의 일을 처리하는 구조다.

왜 AI를 여러 개 쓰는가

AI 하나가 못 푸는 문제가 있다. 정확히는 "못 푼다"기보다, 혼자 다 처리하려다 보면 한계에 부딪힌다.

앞서 토큰 얘기를 했는데, AI는 한 번에 처리할 수 있는 토큰 양이 정해져 있다. 이걸 컨텍스트 윈도우라고 한다. 작업이 단순하면 상관없다. 근데 처리해야 할 내용이 엄청 많거나, 여러 단계를 거쳐야 하는 복잡한 작업이면 얘기가 달라진다. 하나의 AI가 모든 걸 컨텍스트에 올려두고 처리하면 금방 한계에 찬다.

멀티에이전트는 이 문제를 역할 분리로 푼다. 전체 작업을 쪼개서, 각 에이전트가 자기 담당 부분만 처리한다. 각자의 컨텍스트는 가볍게 유지되고, 결과만 다음 에이전트에게 넘긴다. 공장 컨베이어 벨트처럼, 한 사람이 처음부터 끝까지 다 만드는 게 아니라 각 공정을 나눠서 처리하는 것과 같다.

오케스트레이터
 ├── Agent A
 │     └── 스킬들
 ├── Agent B
 │     └── 스킬들
 └── Agent C
       └── 스킬들

이런 상황에서 멀티에이전트가 필요하다

뉴스 기사 100개를 읽고, 요약하고, 트렌드를 분석해서 보고서를 만드는 작업을 자동화한다고 해보자. AI 하나한테 "이거 다 해"라고 하면 컨텍스트가 터진다. 100개 기사를 한 번에 올리는 것 자체가 무리다.

멀티에이전트로 나누면 이렇게 된다. 1번 에이전트는 기사를 읽고 요약만 한다. 2번 에이전트는 그 요약들을 받아서 트렌드를 분석한다. 3번 에이전트는 분석 결과를 받아서 보고서 형식으로 정리한다. 각자는 자기 일만 하면 되니까 컨텍스트가 가볍고, 전체 작업은 훨씬 안정적으로 돌아간다.

4. 둘의 핵심 차이는 무엇인가?

여기까지 읽었으면 이제 처음 의문으로 돌아갈 수 있다.

어차피 둘 다 뭔가를 "불러다 쓰는" 건데, 도대체 뭐가 다른 걸까?

 

스킬은 AI를 더 잘하게 만드는 것이고, 멀티에이전트는 AI를 나눠서 쓰는 것이다.

스킬은 같은 AI가 더 나은 결과를 내도록 돕는다. AI가 바뀌는 게 아니라, AI가 참고하는 정보가 달라지는 것이다. 사람으로 치면 직원은 그대로인데 매뉴얼을 쥐여줘서 일을 더 잘하게 만드는 것과 같다.

 

멀티에이전트는 다르다. AI 자체를 여러 개로 나눈다. 한 명이 처음부터 끝까지 다 하는 게 아니라, 각자 맡은 역할만 처리하고 결과를 넘긴다. 직원 한 명한테 다 시키는 게 아니라 팀을 꾸리는 것과 같다.

 

  스킬 멀티에이전트
AI 개수 1개 여러 개
목적 더 잘하게 나눠서 처리
토큰 전략 필요한 것만 꺼내 읽기 컨텍스트 자체를 분리
적합한 상황 규칙·형식이 정해진 반복 작업 크고 복잡한 다단계 작업
비유 매뉴얼을 쥐여준 직원 역할이 나뉜 팀

5. 그래서 어떻게 써야 할까?

그러면 실제로 어떻게 판단하면 될까.

스킬만으로 충분한 경우

작업 자체는 단순한데, 매번 같은 규칙을 반복 적용해야 할 때다. AI한테 "이렇게 해"라고 가르쳐두면 혼자서 잘 처리할 수 있는 일들이 여기 해당한다.

예를 들어 고객 문의 메일에 답장을 자동화한다고 해보자. 답변 말투, 금지 표현, 서명 형식 같은 규칙을 스킬로 만들어두면 된다. AI는 매번 그 스킬을 꺼내 읽고 기준에 맞게 답장을 쓴다. 굳이 AI를 여러 개 쓸 이유가 없다.

멀티에이전트가 필요한 경우

작업이 여러 단계로 나뉘거나, 처리해야 할 양이 너무 많아서 AI 하나의 컨텍스트로는 감당이 안 될 때다.

예를 들어 경쟁사 10곳의 웹사이트를 크롤링해서 가격을 비교하고, 그걸 바탕으로 전략 보고서를 만드는 작업이라고 해보자. 크롤링, 데이터 정리, 비교 분석, 보고서 작성을 AI 하나한테 다 시키면 컨텍스트가 터진다. 이럴 때는 각 단계를 에이전트에게 나눠서 맡기는 게 맞다.

둘을 함께 쓰는 전략

사실 실전에서는 스킬과 멀티에이전트를 같이 쓰는 경우가 많다. 멀티에이전트로 작업을 나눠두고, 각 에이전트한테 스킬을 쥐여주는 방식이다.

 

아까 뉴스 보고서 예시로 돌아가보자. 1번 에이전트는 기사 요약을 담당하는데, "요약은 3줄 이내로, 수치는 반드시 포함"이라는 스킬을 갖고 있다. 2번 에이전트는 트렌드 분석을 담당하는데, "분석은 항상 긍정/부정/중립으로 분류"라는 스킬을 갖고 있다. 3번 에이전트는 보고서 작성을 담당하는데, 회사 보고서 양식 스킬을 갖고 있다.

 

역할은 멀티에이전트로 나누고, 각자의 퀄리티는 스킬로 잡는 것이다. 이게 둘을 가장 잘 쓰는 방법인것 같다.

참고 자료