optimization-algorithms

2 개의 포스트

중첩 학습(Nested Learning) 소개 (새 탭에서 열림)

구글 리서치에서 발표한 중첩 학습(Nested Learning)은 머신러닝 모델을 단일한 최적화 과정이 아닌 서로 연결된 여러 층위의 최적화 문제로 재정의하여, 새로운 지식을 학습할 때 기존 지식을 잊어버리는 '치명적 망각(Catastrophic Forgetting)' 문제를 해결하고자 합니다. 이 패러다임은 모델의 아키텍처와 최적화 알고리즘을 별개의 요소가 아닌 정보 흐름과 업데이트 빈도가 다른 동일한 개념의 연장선으로 통합하여 관리합니다. 이를 통해 모델은 인간의 뇌처럼 신경 가소성을 발휘하며 실시간으로 지식을 습득하면서도 과거의 숙련도를 유지할 수 있는 강력한 연속 학습(Continual Learning) 능력을 갖추게 됩니다. ### 중첩 학습의 패러다임과 핵심 원리 * 중첩 학습은 복잡한 머신러닝 모델을 상호 연결된 다층적 최적화 문제의 집합으로 간주하며, 각 내부 문제마다 고유한 '문맥 흐름(Context Flow)'을 가집니다. * 연상 기억(Associative Memory) 관점에서 역전파(Backpropagation) 과정을 분석한 결과, 모델이 데이터 포인트를 로컬 오차 값에 매핑하는 학습 과정 자체가 일종의 기억 시스템임을 입증했습니다. * 트랜스포머의 어텐션 메커니즘 역시 토큰 간의 매핑을 학습하는 단순한 연상 기억 모듈로 공식화할 수 있으며, 이는 모델 구조와 최적화 규칙이 본질적으로 같다는 점을 시사합니다. * 각 구성 요소의 가중치가 조정되는 주기를 의미하는 '업데이트 빈도(Update Frequency Rate)'를 정의함으로써, 최적화 문제들을 여러 수준(Level)으로 서열화하고 제어할 수 있습니다. ### 딥 옵티마이저(Deep Optimizers)의 재구성 * 중첩 학습 관점에서는 모멘텀 기반 옵티마이저를 연상 기억 모듈로 취급할 수 있으며, 이를 통해 기존 최적화 알고리즘을 원칙적으로 개선할 수 있는 경로를 제공합니다. * 기존 옵티마이저들이 데이터 샘플 간의 관계를 충분히 고려하지 않는 단순 내적 유사도에 의존했다면, 중첩 학습은 이를 L2 회귀 손실(L2 regression loss) 기반의 목적 함수로 대체합니다. * 이러한 수식의 변화를 통해 데이터가 불완전하거나 노이즈가 섞인 상황에서도 모델이 더욱 견고하게 학습을 지속할 수 있는 새로운 모멘텀 공식을 도출했습니다. ### 연속적 메모리 시스템과 'Hope' 아키텍처 * 표준 트랜스포머가 단기 메모리로서 현재 문맥만 유지하는 한계를 극복하기 위해, 업데이트 빈도를 다르게 설정한 계층적 메모리 시스템을 적용했습니다. * 이 패러다임을 실제 검증하기 위해 설계된 자가 수정형 아키텍처 'Hope'는 기존 최첨단 모델들보다 언어 모델링 성능이 우수하며, 특히 긴 문맥(Long-context) 관리 능력에서 탁월한 성과를 보였습니다. * 인간의 뇌가 단기 기억을 장기 기억으로 전이시키는 것과 유사하게, 각 구성 요소의 업데이트 속도를 최적화함으로써 정보의 저장과 회상을 더욱 효율적으로 관리할 수 있습니다. 중첩 학습은 모델 아키텍처와 학습 알고리즘 사이의 가로막힌 벽을 허물고, 인공지능이 데이터를 학습하는 방식을 근본적으로 재설계할 수 있는 도구를 제공합니다. 특히 대규모 언어 모델(LLM)이 사전 학습된 정적 지식에 머물지 않고 실시간으로 지식을 확장해야 하는 상황에서, 중첩 학습 기반의 설계를 도입하면 치명적 망각 없이 지속 가능한 인공지능 시스템을 구축하는 데 큰 도움이 될 것입니다.

모빌리티 AI를 소개합니다: (새 탭에서 열림)

구글 리서치는 급격한 도시화와 자율주행, 전자상거래 확산 등 변화하는 교통 환경에 대응하기 위해 AI 기반의 차세대 교통 관리 프로그램인 'Mobility AI'를 발표했습니다. 이 프로그램은 측정, 시뮬레이션, 최적화라는 세 가지 핵심 기둥을 중심으로 도시 교통 시스템의 데이터를 분석하고, 정책 결정자와 엔지니어에게 실질적인 해결책을 제공하는 것을 목표로 합니다. 결과적으로 Mobility AI는 교통 체증 완화, 탄소 배출 감소, 그리고 도로 안전 강화를 통해 지속 가능한 도시 이동성을 실현하고자 합니다. ### 정밀 측정을 통한 교통 현황 및 이동 패턴 분석 - ML 기반의 혼잡 함수(Congestion Functions)를 통해 차량 통행량과 속도의 상관관계를 수학적으로 모델링하며, 전체 데이터가 아닌 일부 부동 차량 데이터(Floating car data)만으로도 도시 전역의 교통 흐름을 정밀하게 유추합니다. - 자기지도 학습(Self-supervised learning)을 활용한 지오스페이셜 임베딩 기술로 데이터가 부족한 지역에서도 지역적 특성과 공간적 관계를 파악하여 이동 패턴을 정교하게 이해합니다. - 인과 추론(Causal inference) 기술을 도입해 날씨나 공휴일 같은 복잡한 변수 속에서도 신호 체계 변경과 같은 특정 개입이 실제 교통 흐름에 미친 순수한 효과를 정확히 측정합니다. ### 고충실도 시뮬레이션을 활용한 디지털 트윈 구축 - 기존의 수동적이고 느린 시뮬레이션의 한계를 극복하기 위해, 머신러닝이 실제 도로 위 운전자들의 행동을 직접 학습하여 반영하는 'Traffic Simulation API'를 개발했습니다. - 고해상도 이동 데이터를 활용한 자동 보정 기술을 통해 도시 전체 규모의 '디지털 트윈'을 신속하게 생성하며, 이를 통해 새로운 교통 정책이나 인프라 변화의 결과를 가상 환경에서 미리 검증할 수 있습니다. - 대규모 이벤트 이후의 교통 흐름을 분석하거나 대중교통 및 보행자 환경 개선을 위한 다양한 시나리오를 고성능 시뮬레이션 환경에서 테스트하여 최적의 대안을 찾습니다. ### 실질적 개선을 위한 지능형 교통 최적화 - '그린 라이트(Green Light)' 프로젝트를 통해 AI가 기존 교차로의 신호 타이밍을 최적화함으로써 불필요한 정차를 줄이고 연료 소비 및 온실가스 배출을 감축하고 있습니다. - 현재 전 세계 3,000개 이상의 교차로에서 운영 중인 이 기술은 별도의 하드웨어 설치 없이 구글 맵의 데이터를 활용해 도시 당국에 효율적인 신호 조절 권장 사항을 제공합니다. - 교통 신호 제어 API(Traffic Signal Control API)를 통해 지자체가 직접 AI 기반의 최적화 제안을 받아 현장에 적용할 수 있도록 지원하며, 향후 연석 공간 관리나 화물 운송 최적화로 서비스 영역을 확장할 계획입니다. Mobility AI는 구글의 방대한 지리정보 데이터와 고도화된 AI 기술을 결합하여 공공 부문의 교통 문제를 해결하려는 혁신적인 시도입니다. 교통 당국은 이 플랫폼을 통해 단순한 현황 파악을 넘어 미래 변화를 과학적으로 예측하고, 데이터에 기반한 정책을 수립함으로써 시민들에게 더 안전하고 효율적인 이동 경험을 제공할 수 있을 것입니다.