🤖

AI 백엔드 개발자가 알아야 하는 RAG와 MCP

생성일

2025/10/13 15:21

태그

AI

RAG란 무엇인가?

RAG의 작동 흐름

RAG 아키텍처 구성 요소

RAG 프로세스

MCP란 무엇인가?

MCP의 등장배경

MCP의 핵심 아이디어

MCP의 구조 요약

MCP 활용 예시

RAG와 MCP의 시너지

개발자가 알아야 할 구현 포인트

RAG와 MCP

2025년에 접어들어 AI 서비스의 품질을 좌우하는 두 가지 기술이 있다.

바로 RAG(Retrieval-Augmented Generation) 과 MCP(Model Context Protocol).

이 둘은 단순히 LLM을 “더 똑똑하게” 만드는 기술이 아니라,

데이터 접근 → 문맥 관리 → 응답 생성이라는 AI 파이프라인의 전 과정을 완성시키는 핵심 축이라고 할 수 있다.

RAG란 무엇인가?

RAG의 개념

•

RAG는 Retrieval-Augmented Generation의 약자로 “검색 기반 생성”이라고 번역된다.

•

즉 LLM이 답변을 생성하기 전에 외부 데이터베이스(지식 저장소)에서 
관련 정보를 검색(Retrival)하고, 그 정보를 기반으로 답변을 생성(Generation)하는 구조이다.

RAG의 작동 흐름

RAG 아키텍처 구성 요소

구성 요소	설명
Retriever	벡터DB(Faiss, Milvus, Pinecone 등)에 질의하며 관련 문서 검색
Chunker	문서를 작은 단위로 나누어 검색 효율 향상
Embedder	텍스트를 벡터로 변환 (예: Open AI Embeddings, bge-large, E5 등)
Generator	검색된 문서를 참조하여 응답 생성 (예: GPT, Claude, Gemini 등)

RAG의 장점

•

사실 기반 응답 (Hallucination 방지)

•

모델 재학습 없이 지식 확장 가능

•

조직 내부 데이터에 맞춤형 AI 구축 용이 → 커스텀 AI 활용 가능

RAG 프로세스

MCP란 무엇인가?

MCP의 등장배경

MCP(Model Context Protocol)는 AI 모델이 외부 도구나 시스템과 안전하게 통신하도록 만드는 프로토콜이다. 즉, LLM을 단순 텍스트 응답기가 아닌 “행동 가능한 에이전트(Agentic AI)”로 확장시켜준다.

MCP의 핵심 아이디어

LLM은 MCP를 통해 도구(tool) 들과 통신한다.

이때 LLM은 단순히 명령을 보내는 것이 아니라, MCP의 표준화된 스키마(JSON-RPC 기반)를 통해

“현재 어떤 작업이 가능한지”, “요청의 형식은 어떤지” 등을 자동으로 이해한다.

MCP의 구조 요약

구성 요소	역할
Model	AI 모델 자체 (예: GPT-5, Claude Sonnet 4.5 등)
Server	MCP 프로토콜을 구현한 서버 (예: GitHub, Jira, DB 등)
Client	MCP를 사용하는 애플리케이션 (예: VSCode, 웹 IDE, 백엔드 시스템)
Transport Layer	모델 서버 간 안전한 통신 (HTTP, WebSocket 등)

MCP 활용 예시

•

파일 관리: LLM이 MCP를 통해 로컬 또는 원격 파일을 읽고 수정

•

API 호출 자동화: LLM이 REST API 구조를 MCP로 파악 후 직접 호출

•

도구 체인 결합: Github → Jenkins → DB → Redis 같은 체인을 AI가 자동으로 orchestration

MCP의 장점

•

LLM이 “할 수 있는 일”의 범위를 명시적으로 정의

•

도구 간 표준 인터페이스 제공 → 확장성과 보안성 확보

•

Agentic AI 구축의 기반 기술 (RAG + MCP 조합으로 완성형 AI 시스템 구현 가능)

RAG와 MCP의 시너지

구분	RAG	MCP
목적	정보 검색 + 문맥 기반 응답	도구 제어 + 실행 환경 연결
핵심 기능	벡터 검색 + 지식 주입	모델과 외부 도구 간 표준 프로토콜
결합 효과	“사실 기반” + “행동 가능한” AI	예: 문서를 읽고 → 분석하고 → DB 업데이트 수행

예시 시나리오:
1. “RAG가 Jira의 문서를 검색”
2. “MCP를 통해 LLM이 실제 Jira API를 호출해 티켓 생성
→ AI 비서가 문서를 참고해 실제 행동까지 수행하는 완전한 Agentic Workflow”

개발자가 알아야 할 구현 포인트

포인트	설명
RAG 파이프라인 구성	LangChain, LlamaIndex, Haystack 등으로 구현 가능
벡터DB 선택	Pinecone, Milvus, FAISS, PGVector
MCP 서버 구성	JSON-RPC 기반, OpenAI MCP SDK 참고
보안 설계	API Key, OAuth, 토큰 기반 접근 제어 필수
테스트 자동화	RAG + MCP 결합 시 E2E 테스트 필요 (Mock Server 적극 활용)