RAG와 MCP
2025년에 접어들어 AI 서비스의 품질을 좌우하는 두 가지 기술이 있다.
바로 RAG(Retrieval-Augmented Generation) 과 MCP(Model Context Protocol).
이 둘은 단순히 LLM을 “더 똑똑하게” 만드는 기술이 아니라,
데이터 접근 → 문맥 관리 → 응답 생성이라는 AI 파이프라인의 전 과정을 완성시키는 핵심 축이라고 할 수 있다.
RAG란 무엇인가?
RAG의 개념
•
RAG는 Retrieval-Augmented Generation의 약자로 “검색 기반 생성”이라고 번역된다.
•
즉 LLM이 답변을 생성하기 전에 외부 데이터베이스(지식 저장소)에서
관련 정보를 검색(Retrival)하고, 그 정보를 기반으로 답변을 생성(Generation)하는 구조이다.
RAG의 작동 흐름
RAG 아키텍처 구성 요소
구성 요소 | 설명 |
Retriever | 벡터DB(Faiss, Milvus, Pinecone 등)에 질의하며
관련 문서 검색 |
Chunker | 문서를 작은 단위로 나누어 검색 효율 향상 |
Embedder | 텍스트를 벡터로 변환
(예: Open AI Embeddings, bge-large, E5 등) |
Generator | 검색된 문서를 참조하여 응답 생성
(예: GPT, Claude, Gemini 등) |
RAG의 장점
•
사실 기반 응답 (Hallucination 방지)
•
모델 재학습 없이 지식 확장 가능
•
조직 내부 데이터에 맞춤형 AI 구축 용이 → 커스텀 AI 활용 가능
RAG 프로세스
MCP란 무엇인가?
MCP의 등장배경
MCP(Model Context Protocol)는 AI 모델이 외부 도구나 시스템과 안전하게 통신하도록 만드는 프로토콜이다. 즉, LLM을 단순 텍스트 응답기가 아닌 “행동 가능한 에이전트(Agentic AI)”로 확장시켜준다.
MCP의 핵심 아이디어
LLM은 MCP를 통해 도구(tool) 들과 통신한다.
이때 LLM은 단순히 명령을 보내는 것이 아니라, MCP의 표준화된 스키마(JSON-RPC 기반)를 통해
“현재 어떤 작업이 가능한지”, “요청의 형식은 어떤지” 등을 자동으로 이해한다.
MCP의 구조 요약
구성 요소 | 역할 |
Model | AI 모델 자체 (예: GPT-5, Claude Sonnet 4.5 등) |
Server | MCP 프로토콜을 구현한 서버 (예: GitHub, Jira, DB 등) |
Client | MCP를 사용하는 애플리케이션 (예: VSCode, 웹 IDE, 백엔드 시스템) |
Transport Layer | 모델 |
MCP 활용 예시
•
파일 관리: LLM이 MCP를 통해 로컬 또는 원격 파일을 읽고 수정
•
API 호출 자동화: LLM이 REST API 구조를 MCP로 파악 후 직접 호출
•
도구 체인 결합: Github → Jenkins → DB → Redis 같은 체인을 AI가 자동으로 orchestration
MCP의 장점
•
LLM이 “할 수 있는 일”의 범위를 명시적으로 정의
•
도구 간 표준 인터페이스 제공 → 확장성과 보안성 확보
•
Agentic AI 구축의 기반 기술 (RAG + MCP 조합으로 완성형 AI 시스템 구현 가능)
RAG와 MCP의 시너지
구분 | RAG | MCP |
목적 | 정보 검색 + 문맥 기반 응답 | 도구 제어 + 실행 환경 연결 |
핵심 기능 | 벡터 검색 + 지식 주입 | 모델과 외부 도구 간 표준 프로토콜 |
결합 효과 | “사실 기반” + “행동 가능한” AI | 예: 문서를 읽고 → 분석하고 → DB
업데이트 수행 |
예시 시나리오:
1. “RAG가 Jira의 문서를 검색”
2. “MCP를 통해 LLM이 실제 Jira API를 호출해 티켓 생성
→ AI 비서가 문서를 참고해 실제 행동까지 수행하는 완전한 Agentic Workflow”
개발자가 알아야 할 구현 포인트
포인트 | 설명 |
RAG 파이프라인 구성 | LangChain, LlamaIndex, Haystack 등으로 구현 가능 |
벡터DB 선택 | Pinecone, Milvus, FAISS, PGVector |
MCP 서버 구성 | JSON-RPC 기반, OpenAI MCP SDK 참고 |
보안 설계 | API Key, OAuth, 토큰 기반 접근 제어 필수 |
테스트 자동화 | RAG + MCP 결합 시 E2E 테스트 필요 (Mock Server 적극 활용) |





