에러없이 선착순 이벤트 진행하기

2026. 3. 23. 17:37· 서비스 운영 일지/봄봄

봄봄 코드 리뷰 문화 개선 (5)	2025.12.23
이메일 수신 서버 구축 및 뉴스레터 적재 파이프라인 고도화 (1)	2025.12.14
봄봄 AWS 비용 다이어트 이야기 (3)	2025.12.09
봄봄에서 서드파티 라이브러리를 대하는 방법 (2)	2025.11.22
봄봄 서비스에 맞게 검색 성능 개선기 (4)	2025.11.17

에러없이 선착순 이벤트 진행하기

상단으로

들어가며

현재 상태

1차 문제 : 운영서버에 이벤트 로직을?

1차 해결: 이벤트 서버로 분리

2차 문제: 제일 먼저 트래픽을 받는 곳은?

방법 1: EC2 인스턴스에 HAProxy를 두고 직접 로드밸런싱하기

방법 2: NLB(Network Load Balancer)

방버 3: ALB(Application Load Balancer)

2차 문제 해결: ALB로 결정!

3차 문제: 로드밸런서 뒤의 서버는 얼마나 받아낼 수 있을까

1. OS단 설정

1) nofile

2) backlog 관련 설정

2. 톰캣 설정 점검

1) 인스턴스 체급

2) 톰캣 스레드 설정

3) 연결 수와 대기 구간

4) 무엇이 먼저 한계에 도달하는지

3차 문제의 잠정 판단

4차 문제: DB 병목

문제 해결 시도 1: DB 동시성 제어

문제 해결 시도 2: 메모리 기반 저장소 도입

문제 해결 시도 3: 원자적 연산을 향한 고민

문제 해결 시도 4 : Redis를 최종 저장소로?

4차 문제 해결 : 대기열

5차 문제 : Redis 안에서 줄 세우기

5차 문제 해결: Sorted Set

6차 문제 : 대기열 상태에서 자신의 차례를 어떻게 확인할지

6차 문제 해결 방법 1: SSE

6차 문제 해결 방법 2: WebSocket

6차 문제 해결 방법 3: Polling

6차 문제 해결

7차 문제: 실제 발급 구간을 어떻게 제어할 것인가

7차 문제 해결 방법 1: 비관적 락

7차 문제 해결 방법 2: 낙관적 락

7차 문제 해결 방법 3: 원자적 조건 업데이트

7차 문제 해결 방법 4: 스킵 락

7차 해결 : 결국 스킵 락이 가장 잘 맞았다

최종 설계

부하테스트

첫 부하 테스트: “짧은 순간의 폭주”를 버틸 수 있는지부터 확인

병목 원인 1: 대기열 API가 세션 DB를 타고 있었다

1차 개선 이후: 시간은 절반 가까이 줄었다.

병목 원인 2: 왕복 횟수

2차 개선 이후

본격적인 부하 테스트: 현재 구조에서 어디까지 버틸 수 있는가

TPS 2,000

TPS 2,500

TPS 2,800

정리: 현재 서버 2대 기준 안정권은 약 2,100 TPS 수준으로 봤다

1. 스레드 설정

2. Redis 쪽도 더 줄일 수 있는지 다시 봤다

결론

실제 이벤트에서는 ?

Reference

'서비스 운영 일지 > 봄봄' 카테고리의 다른 글

티스토리툴바