Cross-Zone Load Balancing trên AWS NLB: Bài Học Từ Triển Khai RabbitMQ Trên EKS Tác giả: Lê Phan Tấn Lộc — DevOps Engineer Tags: AWS , NLB , EKS , RabbitMQ , Kubernetes , Load Balancing , Networking Mở Đầu Trong một lần triển khai RabbitMQ lên Amazon EKS theo mô hình Kubernetes Operator, tôi gặp phải một lỗi kỳ lạ: kết nối từ ứng dụng ngoài vào RabbitMQ qua AWS Network Load Balancer (NLB) lúc được, lúc không — hoàn toàn không nhất quán. Test port 5672 bằng bash /dev/tcp thì TCP handshake thành công một lần, thất bại lần tiếp theo, rồi lại thành công. Không có lỗi ứng dụng, không có log rõ ràng, NLB target health đều healthy . Sau khi đào sâu vào tài liệu AWS và kiến trúc mạng, tôi phát hiện ra nguyên nhân gốc rễ: Cross-Zone Load Balancing bị tắt mặc định trên NLB . Bài này là phân tích kỹ thuật về cơ chế đó, tại sao nó gây ra vấn đề trong kiến trúc này, và cách khắc phục. Kiến Trúc Triển Khai Trước khi đi vào vấn đề, hãy hiểu bức tranh tổng thể của hệ thống.…