Figma에서의 속도 탐 (새 탭에서 열림)
피그마(Figma)는 기존 EC2 기반의 레거시 인프라가 성장을 저해하자, 개발자 생산성과 시스템 확장성을 확보하기 위해 쿠버네티스(Kubernetes, K8s) 전환을 결정했습니다. 이들은 단순한 인프라 교체를 넘어 내부 추상화 도구를 통한 '골든 패스(Golden Path)'를 구축함으로써 1년 미만이라는 짧은 기간 내에 주요 핵심 서비스를 성공적으로 이전했습니다. 결과적으로 인프라 운영의 복잡성을 낮추면서도 대규모 트래픽을 효율적으로 수용할 수 있는 현대적인 컴퓨팅 환경을 마련했습니다. ### 기존 인프라의 한계와 전환 배경 * 기존의 Chef와 Puppet 기반 EC2 환경은 배포 속도가 느리고 수동 설정이 많아 급격한 사용자 증가에 따른 스케일링 대응에 한계가 있었습니다. * 인프라 팀이 모든 프로비저닝 요청의 병목지점이 되면서 개발팀의 자율성이 저하되고, 환경 간 일관성을 유지하기 어려운 문제가 발생했습니다. * 애플리케이션의 이식성을 높이고 리소스 효율성을 극대화하기 위해 컨테이너 중심의 관리 체계로의 패러다임 전환이 필수적이었습니다. ### 개발자 경험 중심의 추상화 레이어 구축 * 개발자가 쿠버네티스의 복잡한 YAML 명세나 `kubectl` 명령어를 직접 학습하지 않아도 되도록 내부 플랫폼 인터페이스를 설계했습니다. * 표준화된 서비스 정의와 배포 프로세스를 제공하는 내부 도구를 통해, 개발자는 몇 가지 설정만으로도 보안과 모니터링이 적용된 인프라를 즉시 할당받을 수 있게 되었습니다. * 이러한 '추상화'는 인프라 팀이 하부 구조를 변경하더라도 상위의 개발자 워크플로우에는 영향을 주지 않는 유연성을 제공했습니다. ### 점진적 마이그레이션과 안정성 확보 전략 * '빅뱅' 방식의 전환 대신, 기존 EC2 서비스와 새로운 K8s 서비스를 병행 운영하며 트래픽을 단계적으로 전환하는 방식을 채택했습니다. * 실제 트래픽을 복제하여 새로운 환경의 안정성을 미리 검증하는 '섀도우 트래픽(Shadow Traffic)' 테스트를 통해 마이그레이션 시 발생할 수 있는 리스크를 사전에 차단했습니다. * 전환 과정에서의 데이터 정합성 유지와 네트워크 지연 시간을 최소화하기 위해 서비스 메쉬 및 전용 커넥터를 활용하여 두 환경 간의 통신을 최적화했습니다. 대규모 인프라 마이그레이션의 성공은 단순히 기술적 스택을 바꾸는 것이 아니라, 개발자의 진입 장벽을 낮추는 내부 플랫폼 설계에 달려 있습니다. 복잡한 기술적 세부 사항을 추상화하고 점진적인 검증 절차를 거치는 전략은 서비스 중단 없이 대규모 시스템을 현대화하려는 조직에게 훌륭한 본보기가 됩니다.