codex

2 개의 포스트

What’s Next with AWS, 2026 주요 발표 내용 | Amazon Web Services (새 탭에서 열림)

AWS는 2026 'What’s Next with AWS' 행사를 통해 에이전트(Agent) 중심의 비즈니스 혁신과 인공지능 생태계 확장이라는 비전을 제시했습니다. 이번 발표의 핵심은 개인용 AI 비서인 'Amazon Quick'의 대중화, 'Amazon Connect'의 산업별 전문 에이전트 솔루션으로의 진화, 그리고 OpenAI와의 파트너십 강화를 통한 최신 모델의 Bedrock 통합입니다. 이를 통해 AWS는 기업이 복잡한 워크플로우를 자동화하고 보안이 보장된 환경에서 최첨단 AI를 활용할 수 있는 토대를 마련했습니다. **Amazon Quick: 업무 효율을 높이는 범용 AI 어시스턴트** * **데스크톱 앱 출시(Preview):** 브라우저를 열지 않고도 로컬 파일, 캘린더, 커뮤니케이션 도구와 연결되어 개인화된 업무 경험을 제공합니다. * **접근성 확대:** AWS 계정 없이도 개인 이메일이나 기존 소셜 계정(Google, Apple 등)으로 가입할 수 있는 Free 및 Plus 요금제를 도입했습니다. * **시각 자료 생성:** 채팅 인터페이스에서 직접 전문적인 문서, 프레임워크, 인포그래픽 및 이미지를 즉석에서 생성할 수 있습니다. * **외부 앱 통합 확대:** Google Workspace, Zoom, Airtable, Dropbox, Microsoft Teams 등 주요 협업 툴과의 네이티브 연동을 지원합니다. **Amazon Connect: 4가지 산업 특화 에이전틱 AI 솔루션** * **Connect Decisions:** 아마존의 30년 운영 노하우가 집약된 공급망 계획 솔루션으로, 팀이 위기 대응을 넘어 선제적인 의사결정을 내릴 수 있도록 돕습니다. * **Connect Talent (Preview):** 대규모 채용을 위한 솔루션으로, AI 기반 인터뷰와 과학적 역량 평가를 통해 편향을 줄이고 우수 인재를 빠르게 선발합니다. * **Connect Customer:** 기존 Amazon Connect의 진화 버전으로, 전문 지식 없이도 몇 주 만에 대화형 AI를 설정하고 개인화된 고객 경험을 제공할 수 있도록 구성 능력을 강화했습니다. * **Connect Health:** 환자 인증, 예약 관리, 의료 기록 자동화(Ambient Documentation) 및 코딩을 지원하여 의료진이 진료에 더 집중할 수 있는 환경을 구축합니다. **AWS와 OpenAI의 파트너십 강화 및 Bedrock 통합** * **최신 모델 도입:** GPT-5.5 및 GPT-5.4 등 OpenAI의 최첨단 모델을 Amazon Bedrock API를 통해 보안과 거버넌스가 유지된 상태로 사용할 수 있습니다. * **Codex on Amazon Bedrock:** CLI, 데스크톱 앱, VS Code 확장 프로그램을 통해 OpenAI의 코딩 에이전트를 AWS 환경 내에서 직접 활용하고 클라우드 약정 비용을 적용받을 수 있습니다. * **OpenAI 기반 Managed Agents:** OpenAI의 모델 성능을 극대화하도록 설계된 'OpenAI Harness'를 기반으로, 더 빠른 실행 속도와 정교한 추론 능력을 갖춘 프로덕션급 에이전트를 클라우드에 쉽게 구축할 수 있습니다. 이번 발표는 기업들이 더 이상 AI 모델 선택에만 머물지 않고, 실제 산업 현장에 즉시 투입 가능한 '에이전트' 중심의 인프라를 구축해야 함을 시사합니다. 특히 OpenAI의 최신 모델을 AWS의 안정적인 인프라 위에서 사용할 수 있게 됨에 따라, 보안과 성능을 모두 중시하는 엔터프라이즈 고객들에게 Amazon Bedrock은 더욱 강력한 선택지가 될 것으로 보입니다.

코딩 에이전트를 활용한 취약점 수집·생성 자동화로 가드레일 모델 고도화 (새 탭에서 열림)

LLM 서비스의 보안 위협인 프롬프트 인젝션과 탈옥을 방지하기 위해 가드레일 모델이 필수적이지만, 실제 운영 환경에서는 정상적인 요청을 공격으로 오해하는 오탐(False Positive) 문제가 주요 과제로 떠오르고 있습니다. 이를 해결하기 위해 개발팀은 코딩 에이전트(Codex)를 활용하여 테스트 데이터 생성부터 모델 평가 및 분석까지 전 과정을 자동화한 파이프라인을 구축했습니다. 이 시스템은 공격 유형을 카테고리별로 구조화하고 병렬로 테스트함으로써 가드레일 모델의 취약점을 체계적으로 파악하고 실서비스 적합성을 높이는 데 기여합니다. ### 벤치마크와 실서비스 성능의 간극 * **오탐(False Positive)의 문제:** 외부 벤치마크에서는 높은 성능을 보였으나, 실제 환경에서는 'ignore', 'bypass'와 같은 보안 키워드가 포함된 정상적인 개발/학술 질의까지 공격으로 차단하는 한계가 노출되었습니다. * **입력 다양성 확보의 필요성:** 단순한 성능 지표 개선을 넘어, 실제 사용자의 다채로운 입력 패턴을 모사하고 모델이 맥락을 정확히 이해하는지 검증할 체계적인 환경이 필요해졌습니다. * **코딩 에이전트 도입:** 반복적이고 복잡한 테스트 시나리오를 자동화하기 위해 LLM 기반의 도구 실행 및 파일 편집 능력을 갖춘 코딩 에이전트(Codex) 워크플로를 테스트 파이프라인에 접목했습니다. ### 코딩 에이전트(Codex)의 핵심 구성 요소 * **사용자 정의 지침 (AGENTS.md):** 프로젝트 루트에 전역 가이드라인을 명시하여 에이전트가 코딩 컨벤션과 보안 제약 사항을 준수하며 일관된 결과물을 내도록 제어합니다. * **서브 에이전트 오케스트레이션:** 복잡한 작업을 메인 에이전트(조율)와 작업자 에이전트(수행)로 분리하여 병렬 처리를 지원하고, 각 작업의 문맥을 명확히 분리해 효율성을 높입니다. * **스킬(Skill) 기반 표준화:** 특정 작업을 모듈화한 절차(SKILL.md)를 통해 데이터 생성, 모델 평가 등 반복되는 작업을 규격화하여 재현성을 확보합니다. ### 실험 단위의 카테고리화와 스킬 설계 * **실험 단위 분리:** 시스템 키워드가 포함된 업무 요청이나 교육 목적의 민감 주제 등 가드레일이 취약할 수 있는 지점을 카테고리별로 분리하여 병렬 실행 및 심층 분석이 가능하도록 설계했습니다. * **합성 데이터 생성 스킬 (synthetic-generator):** 카테고리별 제약 조건과 타깃 라벨을 반영하여 실제 서비스와 유사한 다채로운 문장 구조의 테스트셋(JSONL)을 자동으로 생성합니다. * **가드레일 모델 평가 스킬 (injection-classifier):** 생성된 데이터를 바탕으로 모델 API에 질의를 던져 오탐 및 미탐 통계를 산출하고, 원본 텍스트와 예측 결과를 통합 저장합니다. ### 자동화 테스트 파이프라인 아키텍처 * **메인 에이전트의 역할:** 테스트 명세를 파악하여 카테고리별로 서브 에이전트에게 업무를 할당하고, 최종적으로 모든 작업 완료 보고를 취합하는 컨트롤 타워 역할을 수행합니다. * **워커 에이전트의 실행 흐름:** 할당받은 카테고리에 대해 데이터 생성 및 평가 스킬을 순차적으로 호출한 뒤, 오탐/미탐 사례에 대한 심층 분석 보고서를 작성합니다. * **체계적인 산출물 관리:** 모든 실험 결과(입력 데이터, 평가 통계, 분석 보고서)는 고유한 실행 ID 경로에 저장되어, 향후 모델 패치 시 성능 개선 여부를 정밀하게 비교할 수 있는 근거가 됩니다. 가드레일 모델의 신뢰성을 높이기 위해서는 단순히 공격을 잘 막는 것을 넘어, 정상적인 비즈니스 맥락을 오차단하지 않는 정교함이 필요합니다. 코딩 에이전트를 활용한 자동화 파이프라인은 이러한 미세 조정을 위한 데이터와 분석 결과를 지속적으로 공급함으로써 보안과 사용성 사이의 균형을 잡는 핵심적인 도구가 됩니다.