AWS / ai-agent

6 개의 포스트

aws

AWS Weekly Roundup: OpenAI partnership, AWS Elemental Inference, Strands Labs, and more (March 2, 2026) | Amazon Web Services (새 탭에서 열림)

AWS와 OpenAI의 대규모 전략적 파트너십 체결을 중심으로, 2026년 AWS는 기업들이 생성형 AI 실험 단계를 넘어 실제 비즈니스 가치를 창출할 수 있도록 지원하는 AI-DLC(AI-Driven Lifecycle) 프레임워크와 에이전트 중심의 기술 생태계를 강화하고 있습니다. 이번 파트너십을 통해 Amazon Bedrock에 OpenAI 모델 기반의 상태 유지 런타임 환경이 도입되며, AWS 전용 가속기인 Trainium 칩의 대규모 공급과 함께 보안, 미디어 처리, 인프라 관리 전반에 걸친 지능형 자동화 서비스들이 대거 출시되었습니다. **Amazon과 OpenAI의 전략적 파트너십 및 기술 통합** * **대규모 투자 및 독점 공급:** Amazon은 OpenAI에 총 500억 달러를 투자하며, AWS는 OpenAI Frontier 모델의 독점적 제3자 클라우드 배포처로서 기업용 에이전트 구축 및 관리를 지원합니다. * **Stateful Runtime Environment:** Amazon Bedrock 내에 OpenAI 모델을 기반으로 한 '상태 유지 런타임'을 구축하여, 개발자가 컨텍스트를 유지하고 다양한 소프트웨어 도구 및 데이터 소스에 걸쳐 작업을 수행할 수 있도록 합니다. * **커스텀 실리콘 협력:** OpenAI는 향후 8년 동안 AWS의 차세대 AI 칩인 Trainium3 및 Trainium4를 포함하여 약 2기가와트(GW) 규모의 연산 용량을 사용하기로 합의했습니다. **생성형 AI 에이전트 및 개발 생산성 강화** * **Amazon Bedrock Projects API:** OpenAI 호환 API를 사용하여 생성형 AI 워크로드를 애플리케이션 단위로 격리하고, 액세스 제어 및 비용 추적, 관측성을 개선할 수 있습니다. * **Strands Labs 신설:** 에이전트 중심의 AI 프로젝트를 실험하기 위한 별도의 조직을 구성하고 Robots, AI Functions 등 실험적 프로젝트를 오픈소스로 공개했습니다. * **Amazon Location Service LLM Context:** 위치 기반 기능을 구현할 때 AI 에이전트(Claude Code 등)가 활용할 수 있는 최적화된 컨텍스트를 제공하여 개발 속도와 정확도를 높였습니다. **미디어 처리 및 보안 운영의 자동화** * **AWS Elemental Inference:** AI를 활용해 라이브 및 주문형 비디오를 틱톡, 인스타그램 릴스용 세로 형식으로 자동 크롭하며, 6~10초의 짧은 지연 시간 내에 하이라이트 클립을 추출합니다. * **AWS Security Hub Extended:** CrowdStrike, Okta 등 주요 보안 파트너 솔루션을 AWS 통합 빌링과 사전 협의된 가격으로 손쉽게 배포 및 통합 운영할 수 있는 풀스택 보안 서비스를 제공합니다. * **AWS AppConfig & New Relic 통합:** 기능 플래그(Feature Flag) 배포 시 New Relic의 워크플로 자동화와 연동하여 이상 감지 시 즉각적인 지능형 롤백을 수행, 장애 대응 시간을 초 단위로 단축합니다. **성공적인 AI 도입을 위한 실무적 제언** 단순한 AI 기술 실험을 넘어 실제 운영 환경에 적용하려는 기업은 AWS가 제시하는 **AI-DLC(AI-Driven Lifecycle) 프레임워크**를 적극 활용할 것을 권장합니다. 특히 에이전트 기반 시스템 구축 시 발생할 수 있는 환각 현상을 줄이기 위해 단순 RAG 방식과 GraphRAG 방식을 비교 분석하고, 새롭게 오픈소스화된 EKS Node Monitoring Agent 등을 통해 인프라 가시성을 확보하는 것이 중요합니다.

aws

AWS Weekly Roundup: Claude Sonnet 4.6 in Amazon Bedrock, Kiro in GovCloud Regions, new Agent Plugins, and more (February 23, 2026) | Amazon Web Services (새 탭에서 열림)

AWS는 Amazon Bedrock에 Claude Sonnet 4.6 모델을 도입하고 Kiro의 가용성을 GovCloud로 확장하며 AI 에이전트 개발 및 배포 지원을 대폭 강화했습니다. 이번 발표는 고성능 컴퓨팅(HPC) 인스턴스 출시와 데이터베이스 보안 자동화를 포함하여, 개발자가 AI 기술을 실제 운영 환경에 더 쉽고 안전하게 적용할 수 있도록 돕는 데 중점을 두고 있습니다. 특히 인간과 AI가 공동 개발자로 협력하는 '재탄생하는 소프트웨어(Renascent Software)' 개념을 실현하기 위한 구체적인 도구와 에코시스템을 제시하고 있습니다. **Claude Sonnet 4.6 및 AI 모델 고도화** * **Claude Sonnet 4.6 출시:** Amazon Bedrock에서 사용 가능한 이 모델은 코딩, 에이전트 수행, 전문 업무 전반에서 최상위 성능을 제공하며, Opus 4.6 수준의 지능을 더 낮은 비용과 빠른 속도로 구현합니다. * **SageMaker 기반 Nova 모델 최적화:** Amazon SageMaker Inference를 통해 커스텀 Nova 모델의 인스턴스 유형, 오토스케일링 정책, 동시성 설정을 사용자의 요구에 맞춰 구성할 수 있습니다. * **자동화된 추론과 신뢰:** AI가 생성한 코드나 결정의 정확성을 검증하기 위해 AWS가 지난 10년간 다듬어온 '자동화된 추론(Automated Reasoning)' 기술을 에이전틱 시스템에 적용하고 있습니다. **컴퓨팅 인프라 및 가상화 혁신** * **EC2 Hpc8a 인스턴스:** 5세대 AMD EPYC 프로세서를 탑재하여 기존 대비 최대 40% 향상된 성능과 300 Gbps의 Elastic Fabric Adapter(EFA) 네트워킹을 제공하며, 복잡한 HPC 시뮬레이션에 최적화되었습니다. * **중첩 가상화(Nested Virtualization):** 가상 EC2 인스턴스 위에서 KVM이나 Hyper-V를 실행할 수 있게 되어, 모바일 앱 에뮬레이터나 차량용 하드웨어 시뮬레이션, Windows용 Linux 하위 시스템(WSL) 실행이 가능해졌습니다. **보안 및 규제 환경 대응** * **Aurora 기본 암호화:** 모든 신규 Amazon Aurora 데이터베이스 클러스터에 AWS 소유 키를 사용한 서버 측 암호화(SSE)가 기본 적용됩니다. 이는 별도의 비용이나 성능 저하 없이 투명하게 관리됩니다. * **Kiro의 GovCloud 확장:** 엄격한 보안 통제가 필요한 정부 기관 및 규제 환경의 개발 팀도 Kiro의 에이전틱 AI 도구를 활용하여 미션을 수행할 수 있습니다. **에이전트 개발 생태계 및 도구** * **오픈 소스 에이전트 플러그인:** 'deploy-on-aws'와 같은 플러그인을 통해 코딩 에이전트가 직접 아키텍처 추천, 비용 추정, 인프라 코드(IaC) 생성을 수행할 수 있도록 지원합니다. * **AWS DevOps Agent의 성과:** 운영 효율성을 높이기 위해 도입된 DevOps 에이전트는 Amazon 내부에서 수천 건의 에스컬레이션을 처리하며 86% 이상의 근본 원인 파악률을 기록했습니다. * **커뮤니티 및 이벤트:** 25개의 MCP 도구를 통합한 Kiro Power 사례와 함께, 총 4만 달러의 상금이 걸린 'Amazon Nova AI 해커톤'을 통해 에이전틱 AI 및 멀티모달 솔루션 개발을 장려하고 있습니다. 개발자들은 Claude Sonnet 4.6과 새로운 에이전트 플러그인을 활용해 단순 코딩을 넘어 인프라 배포까지 자동화하는 고성능 AI 에이전트를 구축할 수 있습니다. 특히 운영 효율을 극대화하려는 기업은 AWS DevOps Agent의 모범 사례를 참고하고, 다가오는 AWS Summit이나 해커톤을 통해 최신 에이전틱 AI 기술 역량을 확보하는 것을 추천합니다.

aws

AWS Weekly Roundup: Amazon Bedrock agent workflows, Amazon SageMaker private connectivity, and more (February 2, 2026) | Amazon Web Services (새 탭에서 열림)

이번 AWS Weekly Roundup은 생성형 AI 에이전트의 워크플로우 강화와 데이터 보안 및 운영 효율성을 높이는 다양한 업데이트를 다루고 있습니다. 특히 Amazon Bedrock의 서버 측 도구 지원과 S3의 암호화 관리 방식 개선 등 개발자가 더욱 안전하고 고도화된 애플리케이션을 구축할 수 있도록 돕는 기능들이 대거 출시되었습니다. 이번 업데이트들을 통해 기업들은 인프라 관리의 복잡성을 줄이면서도 고성능의 탄력적인 클라우드 환경을 구현할 수 있게 되었습니다. ### Amazon Bedrock 및 AI 에이전트 워크플로우 강화 * **서버 측 도구 지원**: Bedrock 에이전트가 AWS 보안 경계 내에서 웹 검색, 코드 실행, 데이터베이스 업데이트 등의 작업을 수행할 수 있는 서버 측 도구 기능이 추가되었습니다. (OpenAI GPT OSS 20B/120B 모델 지원) * **프롬프트 캐싱 TTL 확장**: 멀티 턴(multi-turn) 대화의 성능을 높이고 비용을 절감하기 위해 프롬프트 캐싱에 1시간 TTL(Time-to-Live) 옵션이 도입되었습니다. * **자연어 기반 배포(MCP Server)**: AI 에이전트가 자연어 프롬프트만으로 AWS CDK 인프라를 생성하고 CloudFormation 스택을 배포할 수 있는 표준 운영 절차(SOP)가 미리보기로 제공됩니다. ### 데이터 보안 및 네트워크 연결성 최적화 * **S3 객체 암호화 변경**: `UpdateObjectEncryption` API를 통해 데이터를 이동하거나 다시 업로드하지 않고도 기존 객체의 서버 측 암호화 유형(SSE-S3에서 SSE-KMS 등)을 변경하거나 키를 교체할 수 있습니다. * **SageMaker Unified Studio 프라이빗 연결**: AWS PrivateLink를 지원하여 공용 인터넷을 거치지 않고 VPC와 SageMaker Unified Studio 간의 안전한 데이터 통신이 가능해졌습니다. * **Network Firewall 가시성**: 생성형 AI 애플리케이션 트래픽을 식별하는 웹 카테고리가 추가되어, AI 도구에 대한 액세스 제어 및 URL 수준의 필터링이 가능합니다. ### 데이터베이스 및 이벤트 기반 아키텍처 성능 향상 * **Amazon Keyspaces 테이블 예열(Pre-warming)**: 높은 읽기/쓰기 트래픽이 예상되는 시점에 미리 테이블을 예열하여 콜드 스타트 지연 없이 즉각적인 처리량을 확보할 수 있습니다. * **EventBridge 페이로드 용량 확대**: 이벤트 페이로드 제한이 기존 256KB에서 1MB로 크게 늘어나, 대규모 JSON 구조나 텔레메트리 데이터를 외부 저장소 없이 한 번에 전송할 수 있습니다. * **DynamoDB MRSC 결함 주입 테스트**: AWS Fault Injection Service와 통합되어 다중 리전 강력한 일관성(MRSC) 글로벌 테이블의 리전 장애 시뮬레이션 및 복원력 검증이 가능합니다. ### 모니터링 및 운영 도구 개선 * **Lambda-Kafka 관측성 강화**: Kafka 이벤트 소스 매핑에 대한 CloudWatch 로그 및 지표가 추가되어, 폴링 설정 및 스케일링 상태를 더욱 세밀하게 모니터링할 수 있습니다. * **AI 지원 관측성 워크플로우**: Amazon CloudWatch Application Signals와 Kiro의 통합으로 AI 에이전트의 도움을 받아 서비스 상태 및 SLO 준수 여부를 더 빠르게 조사할 수 있습니다. 이번 업데이트의 핵심은 AI 에이전트가 실제 비즈니스 로직을 안전하게 수행하도록 돕는 인프라를 구축하고, 대규모 데이터 처리 시 발생하는 운영상의 병목 현상을 제거하는 데 있습니다. 특히 S3 암호화 변경이나 EventBridge 용량 확대와 같은 기능은 기존 아키텍처의 수정 없이도 운영 효율을 즉각적으로 개선할 수 있는 실용적인 변화이므로 적극적인 도입 검토를 추천합니다.

aws

AWS Weekly Roundup: Kiro CLI latest features, AWS European Sovereign Cloud, EC2 X8i instances, and more (January 19, 2026) (새 탭에서 열림)

이 글은 2026년 1월 셋째 주 AWS의 주요 기술 업데이트와 커뮤니티 소식을 다루며, 특히 Kiro CLI의 기능 강화와 유럽 주권 클라우드의 정식 출시를 핵심 성과로 제시합니다. 또한 고성능 메모리 최적화 인스턴스인 EC2 X8i의 상용화와 Amazon Quick Suite를 통한 AI 에이전트 활용 사례를 통해 더욱 고도화된 클라우드 생태계를 구축했음을 보여줍니다. 이번 소식은 엔터프라이즈급 성능 요구 사항과 지역별 규제 준수, 그리고 AI 기반 생산성 향상이라는 세 가지 측면에서 AWS의 진보를 요약하고 있습니다. **Kiro CLI의 제어 및 사용자 경험 강화** * 웹 호출(web fetch) URL에 대한 세밀한 제어 기능을 도입하여, 허용 목록(allowlist)과 차단 목록(blocklist)을 통해 에이전트가 접근할 수 있는 URL 범위를 엄격하게 제한할 수 있습니다. * 커스텀 에이전트를 위한 전용 키보드 단축키와 개선된 Diff 뷰를 제공하여, 단일 세션에서 여러 전문화된 에이전트와 협업할 때 발생하는 마찰을 최소화했습니다. **AWS 유럽 주권 클라우드 정식 출시** * 2023년부터 추진해 온 독립적인 클라우드 인프라인 'AWS European Sovereign Cloud'가 모든 고객을 대상으로 정식 서비스(GA)를 시작했습니다. * 유럽 내 가장 엄격한 데이터 주권 및 규제 요건을 충족할 수 있도록 설계되었으며, 포괄적인 AWS 서비스 세트를 제공하여 유럽 고객들의 컴플라이언스 대응을 지원합니다. **메모리 최적화 EC2 X8i 인스턴스 상용화** * AWS 전용 커스텀 Intel Xeon 6 프로세서를 탑재한 EC2 X8i 인스턴스가 정식 출시되었으며, 모든 코어에서 최대 3.9GHz의 터보 주파수를 유지합니다. * SAP 인증을 획득한 이 인스턴스는 클라우드 내 인텔 기반 프로세서 중 최고 수준의 성능과 메모리 대역폭을 제공하여 메모리 집약적인 워크로드에 최적화되어 있습니다. **생산성 향상을 위한 AI 에이전트 및 도구** * AI 에이전트 동료인 'Amazon Quick Suite'를 통해 비즈니스 질문에 답을 구하고 인사이트를 행동으로 전환하는 생산성 활용 사례가 공유되었습니다. * GitHub Actions를 사용하여 Amazon Bedrock AgentCore에 AI 에이전트를 자동 배포하는 방법이 소개되어, 개발자들이 더욱 효율적으로 AI 기능을 운영 환경에 적용할 수 있게 되었습니다. 이번 업데이트는 강력한 보안과 규제 준수가 필요한 유럽 시장부터, 고성능 컴퓨팅이 요구되는 엔터프라이즈 환경, 그리고 실무 효율을 높이는 AI 에이전트 기술까지 폭넓은 영역을 아우르고 있습니다. 기술 조직은 특히 강화된 Kiro CLI와 Bedrock AgentCore 배포 자동화 가이드를 참고하여 사내 AI 에이전트 운영 환경을 최적화하고 개발 생산성을 한 단계 더 끌어올릴 수 있을 것입니다.

aws

AWS Weekly Roundup: AWS re:Invent keynote recap, on-demand videos, and more (December 8, 2025) (새 탭에서 열림)

AWS re:Invent 2025는 단순한 기술 발표를 넘어 AI 어시스턴트가 자율적인 'AI 에이전트'로 진화하는 중대한 변곡점을 시사했습니다. AWS는 개발자들에게 발명의 자유를 제공한다는 핵심 미션을 재확인하며, 자연어로 복잡한 작업을 수행하고 코드를 실행하는 에이전트 중심의 미래 비전을 제시했습니다. 이번 행사는 AI 투자가 실질적인 비즈니스 가치로 전환되는 시점에서 보안, 가용성, 성능이라는 클라우드의 본질적 가치를 다시 한번 강조했습니다. **AI 에이전트 중심의 비즈니스 혁신** * **어시스턴트에서 에이전트로의 진화:** 단순한 답변 제공을 넘어 스스로 계획을 세우고, 코드를 작성하며, 필요한 도구를 호출해 작업을 완수하는 자율형 에이전트가 핵심 기술로 부상했습니다. * **실질적 비즈니스 수익 창출:** AI가 단순한 실험 단계를 지나 기업의 업무를 자동화하고 효율성을 높임으로써 구체적인 재무적 성과를 내기 시작하는 단계에 진입했습니다. * **비결정적 특성에 최적화된 인프라:** 결과가 매번 다를 수 있는 AI 에이전트의 특성(Non-deterministic)을 고려하여, 안전하고 신뢰할 수 있으며 확장이 용이한 전용 인프라를 구축하고 있습니다. **아키텍트의 르네상스와 개발자 생태계** * **설계 역량의 재발견:** 기술적 세부 사항에 매몰되기보다 시스템 전체를 조망하고 설계하는 고수준 아키텍처 역량이 중요해진 '아키텍트의 르네상스' 시대가 도래했습니다. * **커뮤니티 기여의 가치:** 필리핀의 AWS 히어로 라피(Rafi)가 'Now Go Build' 상을 수상한 사례를 통해, 기술 혁신만큼이나 커뮤니티 빌딩과 개발자 역량 강화가 중요함을 강조했습니다. * **발명의 자유(Freedom to Invent):** 지난 20년간 AWS의 중심이었던 개발자들이 창의성을 발휘할 수 있도록 도구와 환경을 제공하는 것이 AWS의 변함없는 목표임을 천명했습니다. **클라우드 기반 기술의 지속적 고도화** * **커스텀 실리콘과 인프라:** 보안, 가용성, 성능이라는 클라우드의 기본 속성을 유지하면서도 AI 워크로드에 최적화된 하드웨어 혁신을 지속하고 있습니다. * **자연어 기반 솔루션 구현:** 사용자가 달성하고자 하는 목적을 자연어로 설명하면 시스템이 실행 가능한 솔루션으로 변환하는 인터페이스의 혁신이 가속화되고 있습니다. AI 에이전트가 주도하는 기술 환경 변화에 대응하기 위해, 기업들은 단순한 챗봇 도입을 넘어 비즈니스 프로세스 자체를 자동화할 수 있는 에이전트 활용 전략을 수립해야 합니다. AWS re:Invent 2025의 주요 세션 영상과 발표 자료가 온디맨드로 제공되고 있으므로, 조직의 요구 사항에 맞는 AI 아키텍처를 재설계하고 새로운 기술 도구들을 선제적으로 검토해 보시길 권장합니다.

aws

Amazon Bedrock AgentCore adds quality evaluations and policy controls for deploying trusted AI agents (새 탭에서 열림)

Amazon Bedrock AgentCore는 AI 에이전트가 자율적으로 동작할 때 발생할 수 있는 보안 및 품질 제어 문제를 해결하기 위해 정책 제어와 품질 평가 등 새로운 기능을 도입했습니다. 이를 통해 개발자는 에이전트의 권한을 세밀하게 제한하고 실제 운영 환경에서의 성능을 지속적으로 모니터링함으로써, 기업용 수준의 신뢰할 수 있는 AI 에이전트를 대규모로 안전하게 배포할 수 있습니다. **신규 정책 제어(Policy)를 통한 보안 경계 구축** * AgentCore Gateway를 활용하여 에이전트가 도구(Tool)를 호출하기 직전에 정책에 따른 세밀한 권한 검사를 수행함으로써 부적절한 데이터 접근이나 승인되지 않은 작업을 차단합니다. * 정책 제어는 에이전트의 자체 추론 루프(Reasoning Loop) 외부에서 독립적으로 작동하므로, 에이전트의 판단과 상관없이 비즈니스 가드레일을 강제로 적용할 수 있습니다. * 에이전트를 통제 가능한 자율적 행위자로 정의하여 민감한 시스템이나 데이터와 상호작용할 때 발생할 수 있는 리스크를 최소화합니다. **품질 평가(Evaluations)를 활용한 에이전트 신뢰도 검증** * 에이전트의 실제 행동 데이터를 기반으로 정확성(Correctness)과 유용성(Helpfulness) 등의 핵심 지표를 측정할 수 있는 기본 평가 도구를 제공합니다. * 기업의 특정 비즈니스 요구사항에 맞춘 커스텀 평가 지표를 생성하여 실제 고객 대응이나 내부 업무 프로세스에 적합한지 정밀하게 분석할 수 있습니다. * 에이전트 배포 전후의 성능을 정량화함으로써 불확실성을 제거하고 지속적인 품질 개선을 위한 데이터 기반의 인사이트를 확보합니다. **메모리 및 런타임 기능 확장을 통한 사용자 경험 강화** * **에피소드형 메모리(Episodic Memory):** 에이전트가 과거의 경험을 장기적으로 기억하고 학습하여, 유사한 상황이 발생했을 때 일관성 있고 최적화된 해결책을 제시할 수 있도록 돕습니다. * **양방향 스트리밍(Bidirectional Streaming):** 사용자와 에이전트가 동시에 말을 주고받는 자연스러운 대화 흐름을 지원하여 실시간 음성 에이전트 서비스의 반응성을 높였습니다. AI 에이전트의 강력한 자율성을 비즈니스 현장에 도입하려는 조직은 AgentCore의 새로운 정책 제어와 평가 기능을 통해 운영 안정성을 확보해야 합니다. 특히 대규모 데이터 처리나 실시간 고객 응대가 필요한 환경에서는 에피소드형 메모리와 양방향 스트리밍 기능을 결합하여 단순한 챗봇 이상의 고도화된 에이전트 서비스를 구축할 것을 추천합니다.