카프카 구축 시 참고사항 / 설치형 카프카, SaaS형 카프카 차이 및 장단점
카프카 구축 시 참고사항
클라우드 서비스 모델 종류
https://0songha0.github.io/op/2025-04-30-1
온프레미스, IaaS, PaaS, SaaS 개념을 정리한 글입니다.
운영 카프카 권장 하드웨어 사양
RAM | 32GB (브로커 프로세스용 힙 메모리 6GB, 나머지는 데이터 입출력을 위한 OS 페이지 캐시 영역으로 활용) |
CPU | 24 core (SSL 암호화 및 압축 기능 사용 시 더 높은 사양 필요) |
디스크 | RAID 10 디스크 (지연 및 데이터 손실 위험이 있어 NAS는 권장하지 않음) |
디스크 용량 | 하루 1TB 데이터 적재 시, 7일 7TB x 복제 수 용량 필요 |
파일시스템 | XFS 또는 ext4 |
개발용 카프카 권장 하드웨어 사양
RAM | 16GB (브로커 프로세스용 힙 메모리 6GB) |
CPU | 16 core |
설치형 카프카
온프레미스, IaaS 환경에서 카프카 클러스터를 직접 서버에 설치하여 사용합니다.
설치형 카프카 종류
- 컨플루언트 플랫폼 : 모니터링 툴 제공, 단계별 스토리지 기능 제공
- 아파치 카프카 (오픈소스 카프카) : 모니터링 툴 제공 X
- Kafka on Kubernetes (K8s)
아파치 카프카 모니터링 방법
JMX Exporter + Prometheus + Grafana 오픈소스 설치 및 구축이 필요합니다.
SaaS형 카프카
카프카 클러스터를 직접 설치하거나 관리하지 않고 바로 사용할 수 있습니다.
카프카 토픽 데이터를 SQL로 조회 및 처리할 수 있는 ksqlDB, 모니터링 툴 등은 옵션에 따라 제공합니다.
SaaS형 카프카 종류
컨플루언트 클라우드 | 엔터프라이즈 수준 보안 수준 제공, 데이터 적재 제한 없음 (디스크 용량 고민 X) |
AWS MSK | AWS에서 제공하는 아파치 카프카 기반 SaaS. 모니터링 대시보드 제공, TLS인증 보안 설정 가능 |
SaaS형 카프카 장점
- Kafka 운영 노하우가 부족한 상태에서 빠르게 클러스터 인프라를 구축할 수 있습니다.
- 장애 브로커 발생 시 동일한 옵션의 새로운 브로커로 자동 교체되어 클러스터가 복구됩니다.
- 브로커 개수 변경 (스케일 아웃, 스케일 인) 을 대시보드에서 쉽게 할 수 있습니다.
- 큐 사이즈, 메시지 처리량, 레이턴시 등 브로커 수집 지표를 시각적으로 모니터링할 수 있습니다.
- 성능 저하, 장애 발생 시 알람을 자동 수신하여 빠른 대응이 가능합니다.
- SSL, SASL, ACL 등 보안 설정으로 암호화, 인증, 접근 권한 제어 기능을 제공합니다.
SaaS형 카프카 단점
- 법적으로 사용자 개인정보, 결제 정보 등을 클라우드에 저장하면 안 되는 금융, 의료, 공공기관 등에서는 사용이 제한됩니다.
- 시간당 인스턴스 사용 요금 (브로커 3대 기준 약 120만 원) + 스토리지 사용 요금 + 카프카 외부로 데이터 전송 시 발생하는 네트워크 전송 요금 등이 매달 부과됩니다.
- 모든 서버 최적화 옵션, 카프카 브로커 옵션을 제공하지는 않을 수 있습니다.
- 특정 클라우드 서비스 제공 업체에 종속성이 생길 수 있습니다.