amazon-corretto

2 개의 포스트

AWS 주간 소식: Amazon Bedrock의 NVIDIA Nemotron 3 Super, Nova Forge SDK, Amazon Corretto 26 등(2026년 3월 23일) | Amazon Web Services (새 탭에서 열림)

AWS는 최근 NVIDIA Nemotron 3 Super 모델의 Amazon Bedrock 추가와 Nova Forge SDK 출시를 통해 생성형 AI 생태계를 대폭 확장하고, 엔터프라이즈급 AI 맞춤화 기능을 강화했습니다. 동시에 Amazon Redshift의 쿼리 성능을 최대 7배 향상시키고 Amazon EKS의 가용성 실효 수준(SLA)을 99.99%로 높이는 등 클라우드 인프라의 성능과 신뢰성 측면에서도 유의미한 진전을 이루었습니다. 이번 업데이트는 개발자 중심의 도구 개선과 고성능 워크로드 지원이라는 AWS의 핵심 전략을 잘 보여줍니다. **생성형 AI 모델 및 맞춤화 도구 확장** * **NVIDIA Nemotron 3 Super 출시:** Amazon Bedrock API를 통해 NVIDIA의 고성능 언어 모델인 Nemotron 3 Super를 사용할 수 있게 되었습니다. 텍스트 생성, 복잡한 추론, 요약, 코드 생성에 최적화되어 있으며 별도의 인프라 관리 없이 기존 워크플로우에 통합 가능합니다. * **Nova Forge SDK 도입:** 기업용 Nova 모델을 도메인 특화 데이터에 맞게 미세 조정(Fine-tuning)하고 배포할 수 있는 간소화된 수단을 제공하여 맞춤형 AI 솔루션 구축의 복잡성을 낮췄습니다. * **에이전트 정확도 향상:** Strands 에이전트 팀이 발표한 'Steering Hooks' 기법을 통해 AI 에이전트의 정확도를 100%까지 달성했으며, 이는 기존 프롬프트 엔지니어링보다 뛰어난 제어 능력을 보여줍니다. **데이터 분석 및 컴퓨팅 인프라 성능 고도화** * **Amazon Redshift 성능 개선:** 대시보드 및 ETL 워크로드에서 캐시되지 않은 새로운 쿼리의 실행 속도가 최대 7배 빨라졌습니다. 이는 쿼리 변동성이 큰 대화형 대시보드의 대기 시간을 획기적으로 줄여줍니다. * **Amazon EKS SLA 및 확장성 강화:** 프로비저닝된 컨트롤 플레인 클러스터의 SLA가 99.99%로 상향되었으며, 4XL 대비 처리 용량이 2배인 8XL 스케일링 티어를 도입하여 대규모 AI/ML 학습 및 데이터 처리 환경을 지원합니다. * **AWS Lambda 가용 영역(AZ) 메타데이터 지원:** 함수 호출 시 실행 중인 AZ 정보를 확인할 수 있게 되어, 지연 시간에 민감한 멀티 AZ 워크로드의 관찰 가능성과 문제 해결 능력이 향상되었습니다. **개발자 편의성 및 운영 효율성 증대** * **Amazon Corretto 26 정식 출시:** OpenJDK의 최신 장기 지원(LTS) 버전인 Corretto 26이 출시되어 최신 Java 기능과 보안 패치를 다양한 운영체제에서 무료로 사용할 수 있습니다. * **CloudWatch Logs HTTP 기반 로그 수집:** 커스텀 에이전트나 SDK 없이 표준 HTTP 엔드포인트를 통해 로그를 직접 전송할 수 있게 되어 중앙 집중식 로그 관리 장벽이 낮아졌습니다. * **학생용 Kiro 지원:** 미래의 개발자들이 AI 기반 개발 도구를 무료로 경험할 수 있도록 Kiro 서비스를 학생들에게 개방했습니다. 이번 업데이트를 통해 엔터프라이즈 환경에서는 Nova Forge SDK를 활용한 도메인 특화 AI 모델 구축을 검토해 볼 가치가 있으며, 고가용성이 필요한 대규모 워크로드 운영 시 강화된 EKS 8XL 티어와 99.99% SLA를 적극 활용하는 것을 추천합니다. 또한 2026년 4월부터 시작되는 파리, 런던 등 전 세계 AWS 서밋 일정을 확인하여 최신 기술 트렌드를 직접 확인하시기 바랍니다.

AWS 주간 요약: Amazon EC2 G7e 인스턴스, Amazon Corretto 업데이트 등 (2026년 1월 26일) | 아마존 웹 서비스 (새 탭에서 열림)

2026년 첫 AWS 주간 소식은 NVIDIA의 최신 Blackwell 아키텍처를 채택한 EC2 G7e 인스턴스의 정식 출시와 함께 시작되었습니다. 이번 업데이트는 생성형 AI 추론 성능의 비약적인 향상뿐만 아니라 개발자 도구의 보안 강화, 컨테이너 저장소의 효율성 개선 등 클라우드 운영 전반을 아우르는 주요 개선 사항들을 담고 있습니다. 이를 통해 사용자는 더 복잡한 인공지능 모델과 워크로드를 고성능 환경에서 더욱 경제적으로 실행할 수 있게 되었습니다. **NVIDIA Blackwell 기반 EC2 G7e 인스턴스 출시** * NVIDIA RTX PRO 6000 Blackwell Server Edition GPU를 탑재하여 이전 세대(G6e) 대비 추론 성능이 최대 2.3배 향상되었습니다. * 기존 대비 2배 늘어난 GPU 메모리를 제공하며, 최대 8개의 GPU 구성을 통해 총 768GB의 대용량 GPU 메모리를 활용할 수 있습니다. * FP8 정밀도를 지원하여 단일 GPU에서도 최대 700억(70B) 개의 매개변수를 가진 중형 모델을 실행할 수 있어 생성형 AI, 공간 컴퓨팅, 과학 계산 워크로드에 최적화되었습니다. **개발 도구 업데이트 및 컨테이너 스토리지 최적화** * **Amazon Corretto 분기별 업데이트**: OpenJDK LTS 버전(25, 21, 17, 11, 8)에 대한 2026년 1월 보안 및 성능 패치가 배포되어 Java 애플리케이션의 안정성을 높였습니다. * **Amazon ECR 레이어 공유 지원**: Blob 마운팅 방식을 통해 리포지토리 간 공통 이미지 레이어를 공유할 수 있게 되었습니다. 이를 통해 이미지를 업로드(Push)하는 속도를 높이고, 중복 저장을 방지하여 스토리지 비용을 절감할 수 있습니다. **운영 인사이트 및 고객 서비스 기능 강화** * **CloudWatch Database Insights 지역 확장**: 뉴질랜드, 타이베이, 태국, 멕시코 리전으로 서비스가 확대되었습니다. 머신러닝을 기반으로 데이터베이스 성능 병목 현상을 식별하고 구체적인 해결 방안을 제공합니다. * **Amazon Connect 단계별 가이드 개선**: 상담원용 가이드에 조건부 로직을 도입하여 사용자 입력에 따라 UI가 동적으로 변하도록 설정할 수 있습니다. 또한 실시간 데이터 새로고침 기능을 통해 상담원이 항상 최신 정보를 바탕으로 고객을 지원할 수 있습니다. **AWS 기술 교육 및 커뮤니티 이벤트** * **Best of AWS re:Invent (1월 28-29일)**: 작년 re:Invent의 핵심 발표와 기술 세션을 요약하여 전달하는 무료 가상 이벤트가 개최됩니다. * **AWS Community Day Ahmedabad (2월 28일)**: 인도에서 열리는 커뮤니티 중심의 컨퍼런스로, 전문가 세션과 실시간 데모를 통해 실무 지식을 공유하는 자리가 마련됩니다. 이번 업데이트 중 특히 G7e 인스턴스의 출시는 대규모 언어 모델(LLM)을 실무에 도입하려는 기업들에게 중요한 전환점이 될 것입니다. FP8 정밀도를 활용해 단일 GPU에서 70B 규모의 모델을 구동할 수 있게 된 만큼, 생성형 AI 서비스의 아키텍처 설계 시 비용과 성능의 균형을 재검토해 보시길 추천합니다.