Airbnb / data-science

2 개의 포스트

airbnb

Academic Publications & Airbnb Tech: 2025 Year in Review (새 탭에서 열림)

Airbnb는 2025년 한 해 동안 KDD, CIKM, EMNLP 등 세계적인 AI 및 데이터 사이언스 학술대회에서 다수의 논문을 발표하며, 여행 및 주거 플랫폼으로서의 기술적 리더십을 공고히 했습니다. 이들은 단순히 학술적 성과에 그치지 않고 검색 알고리즘 고도화, 개인화 추천 시스템, 다중 모달(Multi-modal) 임베딩 등 실제 비즈니스 문제를 해결하기 위한 응용 머신러닝 기술에 집중했습니다. 결과적으로 이러한 연구들은 예약 전환율 향상과 수천만 달러의 추가 수익 창출이라는 실질적인 성과로 이어졌습니다. ### 검색 랭킹 및 개인화 기술 고도화 (KDD) * **교차 배치(Interleaving) 및 반사실적 평가(Counterfactual Evaluation):** 숙소 예약과 같이 전환 주기가 긴 상품의 경우 A/B 테스트 결과를 얻는 데 시간이 오래 걸립니다. 이를 해결하기 위해 실제 온라인 테스트 전 신속하게 알고리즘 성능을 예측하는 기법을 개발하여 실험 프로세스의 효율성을 높였습니다. * **극한 분류(Extreme Classification)를 통한 검색 지역 확장:** 사용자의 의도를 정밀하게 파악하기 위해 위치 검색 시 단순히 지리적 반경을 사용하는 대신, 고정밀 카테고리 기반의 위치 셀(Cell) 시스템을 도입하여 검색 정확도를 개선했습니다. ### 검색 보조 및 지도 UI 최적화 (CIKM) * **추천 시스템을 통한 검색 결과 보완:** 사용자가 지나치게 좁은 조건(필터)으로 검색하여 결과가 부족할 경우, 날짜 조정이나 편의시설 완화 등 대안적인 추천을 동적으로 제공하여 사용자 경험과 예약률을 개선했습니다. * **지도 기반 랭킹 최적화:** 전체 검색 상호작용의 80%가 발생하는 지도 UI는 기존 리스트 기반의 NDCG 지표로는 사용자 주의 집중도를 정확히 모델링하기 어렵습니다. 이에 지도 전용 NDCG 지표를 설계하고 이를 최적화하여 실제 예약 증대 효과를 거두었습니다. ### 다중 모달 데이터 활용 및 비교 쇼핑 모델링 (CIKM) * **BListing(이봉 분포 리스팅) 임베딩:** 숙소의 텍스트 정보와 사진 데이터를 대규모 언어 모델(LLM)과 이미지 모델을 통해 하나의 벡터로 통합했습니다. 이 다중 모달 임베딩 도입을 통해 수천만 달러의 점진적 수익 성장을 달성했습니다. * **비교 쇼핑 학습(Learning-to-Comparison-Shop):** 전통적인 랭킹 모델은 각 아이템을 개별적으로 평가하지만, 새로운 시스템은 사용자가 검색 결과 페이지에서 여러 아이템을 서로 비교하는 행동 자체를 모델링합니다. 이를 통해 예약 전환율을 0.6% 향상시켰습니다. ### NLP 및 대규모 언어 모델(LLM)의 실무 적용 (EMNLP) * **고객 지원 및 신뢰와 안전:** EMNLP에서는 LLM을 활용한 고객 상담 지원, 검색 및 발견 기능 강화, 플랫폼 내 신뢰 시스템 구축을 위한 최신 아키텍처와 학습 전략을 공유했습니다. * **실제 프로덕션 환경의 LLM:** 단순한 모델 성능을 넘어 대규모 서비스 환경에서 LLM을 안전하고 효율적으로 운영하기 위한 평가 체계와 오픈소스 라이브러리 활용 방안을 제시했습니다. 데이터 기반의 의사결정과 정교한 머신러닝 모델링은 복잡한 양면 시장(Two-sided Marketplace)에서 사용자 만족도를 높이는 핵심 동력입니다. 특히 사용자 경험에 직접적인 영향을 미치는 검색 UI(지도 vs 리스트)별 전용 지표를 설정하거나, 텍스트와 이미지를 통합한 다중 모달 임베딩을 구축하는 접근 방식은 유사한 도메인의 엔지니어들에게 실무적인 영감을 제공합니다.

airbnb

My Journey to Airbnb: Peter Coles (새 탭에서 열림)

에어비앤비의 정책 부문 수석 경제학자이자 데이터 사이언스 디렉터인 피터 콜스(Peter Coles)는 학문적 이론과 비즈니스 실무를 결합하여 거대 플랫폼의 복잡한 문제를 해결해 온 여정을 소개합니다. 그는 게임 이론과 시장 설계(Market Design)라는 학문적 토대가 어떻게 실제 마켓플레이스의 효율성을 높이고 정책적 의사결정을 뒷받침하는 데이터 분석으로 진화할 수 있는지를 자신의 경력을 통해 증명합니다. 결국 이 글은 학계의 정교한 방법론이 기업의 실시간 데이터와 만났을 때 사회적 영향력과 비즈니스 성장을 동시에 달성할 수 있음을 시사합니다. ### 학문적 토대와 시장 설계에 대한 관심 * 피터 콜스는 스탠퍼드 대학교에서 경제학 박사 학위를 취득하며 복잡한 문제를 단순화하여 분석하는 법을 배웠으며, 게임 이론을 바탕으로 수학과 전략의 접점을 연구했습니다. * 하버드 경영대학원(HBS) 조교수 시절, 노벨 경제학상 수상자인 앨빈 로스(Al Roth)와 함께 '시장 설계' 분야를 공동 강의하며 가격만으로는 해결되지 않는 '매칭(Matching)' 메커니즘을 깊이 있게 다루었습니다. * 이론적 연구에 머물지 않고 실제 기술 산업에 매력을 느낀 그는, 이베이(eBay)의 데이터 랩(Data Labs)을 이끌며 아이템의 공정 시장 가치를 산출하는 등 실무적인 모델링 경험을 쌓았습니다. ### 에어비앤비에서의 데이터 사이언스 3단계 여정 * **1단계: 정책과 경제의 결합**: 초기에는 글로벌 데이터 사이언티스트 및 경제학자 팀을 구성하여 단기 임대 서비스가 도시에 미치는 경제적 영향과 규제 문제를 분석하는 데 집중했습니다. * **2단계: 중앙 전략 및 통찰(CSI) 팀 창립**: 부서 간 경계를 넘나드는 전사적 문제를 해결하기 위해 'CSI(Central Strategy & Insights)' 팀을 설립했습니다. 마치 과학 수사대처럼 데이터를 추적하여 팬데믹 기간 중 변화된 여행 트렌드를 분석하고, 기업 공개(IPO)를 앞두고 주주들에게 비즈니스 모델을 설명하는 분석을 주도했습니다. * **3단계: 사회적 영향력 측정과 학술 협력**: 팬데믹 이후 여행 수요가 회복되는 과정에서 에어비앤비가 게스트, 호스트, 그리고 사회 전체에 미치는 영향을 평가하는 모델을 개발했습니다. 또한 외부 학계 연구자들과 협력하여 에어비앤비의 방대한 데이터를 바탕으로 한 학술적 연구 프로그램을 확장하고 있습니다. ### 이론과 실무의 균형을 통한 시너지 * 피터 콜스는 학계의 깊이 있는 연구 방식과 기업의 빠른 실행 속도 사이에서 균형을 잡는 것이 중요하다고 강조합니다. * 그는 에어비앤비에서 수백만 명의 사용자 데이터를 직접 다루며 제품 결정과 정책 수립에 실질적인 영향력을 행사하는 동시에, 여전히 학계와 긴밀히 소통하며 데이터 기반의 통찰을 공유하고 있습니다. 이 글은 데이터 사이언티스트나 경제학자를 꿈꾸는 이들에게 학문적 전문성이 어떻게 글로벌 플랫폼의 핵심 전략으로 치환될 수 있는지를 보여주는 실무적인 가이드를 제공합니다. 전문 지식을 갖춘 인재라면 단순히 기술적 분석에 그치지 않고, 비즈니스의 거시적 흐름과 정책적 맥락을 읽는 능력을 키울 것을 추천합니다.