쿠팡 로켓배송의 (새 탭에서 열림)

쿠팡은 급증하는 배송 물량을 효율적으로 처리하기 위해 기존의 텍스트 및 우편번호 기반 배송 구역 관리 시스템을 공간 인덱스(H3) 기반의 시각적 시스템으로 혁신했습니다. 이를 통해 복잡한 배송 구역을 지도상에서 직관적으로 분할하고 관리할 수 있게 되었으며, 숙련된 인력의 경험에 의존하던 운영 방식을 데이터 중심의 체계적인 시스템으로 전환하는 성과를 거두었습니다. 결과적으로 배송 효율성을 극대화하고 캠프 관리자들이 유연하게 구역을 조정할 수 있는 기술적 토대를 마련했습니다. **기존 텍스트 기반 관리의 한계** * **우편번호 단위의 한계:** 과거에는 정부가 할당한 우편번호를 배송 단위로 사용했으나, 배송 물량이 급증하면서 단일 우편번호 구역이 한 명의 쿠팡 친구가 처리하기에는 너무 비대해졌습니다. * **경험 의존적 운영:** 우편번호를 아파트 단지나 건물 단위로 더 세밀하게 쪼개야 했으나, 공간 정보가 없는 텍스트 주소 위주여서 해당 지역에 익숙한 숙련자의 주관적인 판단에만 의존해야 했습니다. * **시각화 및 편집의 어려움:** 텍스트 중심 데이터는 지도상에서 구역의 경계를 직관적으로 파악하기 어려웠으며, 구역을 변경하거나 공유하는 과정에서 데이터의 일관성을 유지하기 힘들었습니다. **H3 공간 인덱스 도입과 이점** * **육각형 격자 시스템(H3) 선택:** 구글의 S2(사각형/다이아몬드 기반) 시스템 대신 우버에서 개발한 H3 육각형 그리드 시스템을 채택했습니다. * **기하학적 이점:** 육각형은 인접한 모든 셀과의 중심 거리가 동일하여 거리 계산 및 확장이 용이하며, 구역을 병합하거나 나누었을 때 시각적 왜곡이 적어 배송 구역 관리에 최적입니다. * **데이터 표준화:** 모든 배송지를 위경도 기반의 H3 인덱스로 변환함으로써, 주소 체계에 상관없이 일관된 공간 데이터를 추출하고 분석할 수 있게 되었습니다. **시스템 재설계 및 기술적 구현** * **적정 해상도(Resolution) 설정:** 너무 세밀한 해상도는 데이터 양을 과도하게 늘리고, 너무 낮은 해상도는 정밀도를 떨어뜨립니다. 쿠팡은 배송 효율을 고려해 관리 효율성과 데이터 크기의 균형을 맞춘 최적의 해상도 단계를 선택했습니다. * **육각형 그룹 기반 구역 정의:** 배송 구역을 단순한 텍스트 리스트가 아닌 '육각형들의 집합(Hexagonized Polygon)'으로 재정의했습니다. 이를 통해 지도상에서 다각형(Polygon)을 그리면 해당 영역에 포함된 H3 셀들이 자동으로 할당되는 방식을 구현했습니다. * **운영 도구의 혁신:** 캠프 관리자들이 웹 인터페이스를 통해 직접 지도 위에서 구역을 수정하고, 변경된 구역의 물량 통계를 즉각적으로 확인하며 최적의 배송 영역을 설정할 수 있는 환경을 구축했습니다. 공간 인덱스 기반의 시스템 전환은 단순한 시각화를 넘어, 배송 구역별 물량 통계를 실시간으로 파악하고 데이터에 기반한 의사결정을 가능하게 합니다. 물류 및 배송 시스템을 운영하는 조직이라면 주소 텍스트에 의존하기보다 H3와 같은 공간 인덱스를 활용해 구역 관리의 유연성과 데이터 정확도를 확보하는 것이 배송 최적화의 핵심입니다.

쿠팡의 머신러닝 (새 탭에서 열림)

쿠팡의 머신러닝 플랫폼은 데이터 탐색부터 모델 배포에 이르는 전체 ML 생애주기를 가속화하여 개발 생산성을 혁신적으로 높이는 것을 목표로 합니다. 이를 통해 검색, 가격 책정, 물류 최적화 등 쿠팡의 다양한 서비스에 머신러닝을 효율적으로 적용하고 있으며, 인프라 관리 부담을 줄여 엔지니어들이 모델 고도화에만 집중할 수 있는 환경을 제공합니다. 결과적으로 이 플랫폼은 복잡한 비즈니스 문제를 해결하는 핵심 기술 기반으로서 쿠팡의 비즈니스 성장을 견인하고 있습니다. **플랫폼 구축의 동기와 목표** * **생산 모드 전환 시간 단축**: 실험 단계의 모델을 실제 서비스 환경에 배포하기까지 걸리는 시간을 줄여 비즈니스 요구사항에 빠르게 대응합니다. * **ML 개발의 CI/CD 도입**: 소프트웨어 공학의 지속적 통합 및 배포(CI/CD) 개념을 ML에 접목하여, 모델 학습과 배포 과정을 자동화하고 일관된 품질을 유지합니다. * **컴퓨팅 자원의 효율적 확장**: 하부 인프라에 대한 개입 없이도 대규모 학습 및 추론을 수행할 수 있도록 유연한 확장성을 제공하여 비용과 성능을 최적화합니다. **플랫폼의 핵심 기능 및 구성 요소** * **관리형 노트북 및 파이프라인 SDK**: 데이터 과학자들이 익숙한 Jupyter 기반 환경에서 작업할 수 있도록 지원하며, 전용 SDK를 통해 복잡한 ML 파이프라인을 손쉽게 정의하고 실행할 수 있습니다. * **피처 스토어(Feature Store)**: 학습과 추론 단계에서 동일한 피처 데이터를 재사용하고 공유할 수 있는 중앙 저장소를 제공하여, 데이터 정합성 문제를 해결하고 개발 효율을 높입니다. * **모델 학습 및 추론 서비스**: 다양한 ML 프레임워크를 지원하는 매니지드 학습 환경과, 대규모 트래픽을 처리할 수 있는 실시간 및 배치 추론 인프라를 운영합니다. * **모니터링 및 관측 가능성**: 배포된 모델의 성능 저하(Drift)나 이상 징후를 실시간으로 추적하여 모델의 신뢰성을 보장하고 신속한 재학습 여부를 결정합니다. **주요 성공 사례** * **Ko-BERT를 통한 검색 고도화**: 한국어 특화 언어 모델인 Ko-BERT를 학습시켜 고객의 검색 쿼리 의도를 더 정확하게 파악하고 상품 검색의 질을 향상시켰습니다. * **실시간 가격 예측**: 수백만 개의 상품에 대해 시장 변화를 즉각적으로 반영하는 실시간 가격 예측 모델을 성공적으로 배포하여 비즈니스 의사결정을 지원하고 있습니다. 쿠팡 ML 플랫폼은 단순히 도구의 집합을 넘어, 데이터 과학자가 비즈니스 가치 창출에만 전념할 수 있도록 돕는 강력한 엔지니어링 생태계입니다. 대규모 데이터와 복잡한 모델을 다루는 조직이라면 쿠팡의 사례처럼 파이프라인 자동화와 피처 정합성을 보장하는 통합 플랫폼 구축을 통해 개발 사이클을 획기적으로 단축할 수 있습니다.

쿠팡 로켓배송: 공간 색인 기반의 새로운 배송 영역 관리 시스템 | by 쿠팡 엔지니어링 | Coupang Engineering Blog | Medium (새 탭에서 열림)

쿠팡은 급증하는 배송 물량과 복잡해지는 배송 환경에 대응하기 위해 기존의 텍스트 및 우편번호 중심 시스템에서 탈피하여 공간 색인 기술인 H3를 도입한 새로운 배송 영역 관리 시스템을 구축했습니다. 이 시스템은 배송 영역을 지도상에 시각화하고 데이터 기반으로 정교하게 분할할 수 있게 함으로써, 숙련자의 경험에만 의존하던 운영 방식에서 벗어나 누구나 직관적으로 배송 경로를 최적화할 수 있는 환경을 제공합니다. 결과적으로 공간 데이터 중심의 관리를 통해 신축 건물이나 지형 변화에도 유연하게 대처할 수 있는 로켓배송의 기술적 토대를 마련했습니다. **텍스트 기반 우편번호 체계의 한계** * 기존 시스템은 정부의 우편번호와 텍스트 주소에 의존했으나, 쿠팡의 성장에 따라 단일 우편번호 내 배송 건수가 한 명의 쿠친이 처리할 수 있는 범위를 초과하게 되었습니다. * 우편번호를 아파트 단지나 동 단위로 세분화해야 했으나, 텍스트 정보만으로는 공간적 위치를 파악하기 어려워 해당 지역에 능숙한 캠프 리더의 직관에만 의존하는 문제가 있었습니다. * 신축 건물의 등장이나 철거 등 지형적 변화가 발생했을 때 이를 시스템에 즉각적으로 반영하고 배송 영역을 조정하는 데 한계가 있었습니다. **H3 공간 색인 시스템의 도입** * 우버(Uber)에서 개발한 육각형 기반의 그리드 시스템인 H3를 도입하여 전 세계를 균일한 크기의 육각형 격자로 나누어 관리합니다. * 육각형 구조는 인접한 모든 이웃 격자와의 중심점 거리가 동일하여, 사각형이나 삼각형 격자보다 공간 분석 및 경로 최적화 계산에 훨씬 유리합니다. * 주소라는 텍스트 데이터 대신 위경도 기반의 공간 좌표를 사용함으로써 배송 영역의 경계를 더욱 명확하고 정교하게 설정할 수 있습니다. **시스템 재설계와 시각화 최적화** * 캠프 작업자들이 지도 위에서 배송 영역을 직접 확인하고, 마우스 클릭이나 드래그를 통해 영역을 생성, 수정, 공유할 수 있는 직관적인 UI를 구현했습니다. * 개별 육각형 격자들을 그룹화하여 하나의 다각형(Polygon) 형태로 변환하는 기술을 적용해 지도 렌더링 성능을 높이고 사용자 가독성을 개선했습니다. * 배송 밀도와 작업량을 격자 단위로 수치화하여 제공함으로써, 특정 영역에 업무가 쏠리지 않도록 균등하게 배송 물량을 배분할 수 있는 통계 기능을 강화했습니다. 물류 및 배송 시스템에서 주소는 더 이상 단순한 텍스트가 아닌 정교한 공간 데이터로 다뤄져야 합니다. 격자 기반의 공간 색인 시스템을 활용하면 운영 효율을 극대화할 수 있을 뿐만 아니라, 향후 자율주행 배송이나 드론 배송과 같은 미래 기술로 확장하기 위한 필수적인 데이터 구조를 확보할 수 있습니다. 이미 주소 기반 시스템의 한계를 느끼고 있는 물류 기업이라면 H3와 같은 공간 인덱싱 기술로의 전환을 적극적으로 검토할 것을 권장합니다.