agentic-coding

3 개의 포스트

ODW #4: 코파일럿에서 파일럿으로, 에이전틱 코딩으로 구현부터 PR까지 자동화 (새 탭에서 열림)

LY Corporation의 'Orchestration 길드'는 단순한 코드 보조를 넘어 AI가 자율적으로 개발 사이클을 주도하는 '에이전틱 코딩(Agentic Coding)'으로의 전환을 제안합니다. 명세 주도 개발(SDD)과 MCP(Model Context Protocol)를 결합하여 AI 에이전트가 기획 문서를 읽고 구현 계획 수립부터 풀 리퀘스트(PR) 작성까지 수행하도록 하는 것이 핵심입니다. 이를 통해 개발자는 단순 반복 업무에서 벗어나 고차원적인 설계와 검토에 집중함으로써 전체적인 생산성을 비약적으로 높일 수 있습니다. **단순 보조를 넘어선 에이전틱 코딩의 정의** * 기존 AI 도구가 코드 자동 완성 수준에 머물렀다면, 에이전틱 코딩은 고수준의 목표를 스스로 분해하고 자율적으로 실행하며 피드백을 통해 조정하는 방식입니다. * AI 에이전트가 전체 코드베이스와 파일 간 관계를 이해하고, 테스트 실패 시 스스로 수정하며 빌드 성공까지 반복하는 '파일럿' 역할을 수행합니다. * Jira와 Confluence 같은 사내 시스템을 MCP로 연결하여 AI가 최신 요구 사항 명세서를 직접 참조할 수 있는 환경을 구축하는 것이 기술적 토대가 됩니다. **1단계: MCP 기반의 구현 계획 수립과 리뷰** * 에이전틱 코딩의 성패는 초기 구현 계획의 정교함에 달려 있으며, 이를 위해 Jira와 Confluence URL에서 정보를 수집하는 커스텀 슬래시 명령어를 활용합니다. * Claude Code의 'Explore Agent' 기능을 병렬로 사용하여 메인 컨텍스트를 유지하면서도 광범위한 코드 분석과 문서 조사를 동시에 수행합니다. * 분석 결과는 `plan.md`와 같은 독립된 파일로 출력하여 사람이 미리 리뷰할 수 있게 함으로써, AI가 엉뚱한 방향으로 구현을 시작하는 리스크를 방지합니다. **2단계: 자율적 구현과 품질 검증 및 PR 작성** * 확정된 구현 계획서를 바탕으로 AI가 코드를 작성하며, 단순 생성을 넘어 테스트 코드 추가, 린트(Lint), 빌드(Build) 과정을 스스로 반복합니다. * 작업 단계를 명시한 커스텀 명령어를 통해 AI가 할 일 목록(To-do list)을 생성하고 누락 없이 작업을 완수하도록 가이드합니다. * 구현 완료 후에는 미리 정의된 템플릿에 따라 배경, 대응 영역, 테스트 관점 등을 포함한 상세한 PR 설명을 자동으로 작성하여 공유합니다. **3단계: AI 셀프 리뷰와 피드백 대응** * 작성된 PR에 대해 AI가 스스로 스크리닝 리뷰를 수행하고, 잠재적인 오류나 개선 사항에 대해 코멘트를 남깁니다. * AI는 자신의 셀프 코멘트뿐만 아니라 다른 팀원이 남긴 리뷰 내용까지 파악하여 수정안을 제시하고 실제 코드에 반영합니다. * 이 과정에서 사람은 AI가 내린 판단의 적절성만 최종 승인함으로써 리뷰 및 수정에 드는 비용을 획기적으로 줄입니다. **에이전틱 코딩 도입의 성과와 과제** * **장점:** 여러 에이전트를 병렬로 실행하여 코드 생성 속도를 높일 수 있으며, 사전 계획 수립 과정을 통해 잠재적 리스크를 조기에 발견할 수 있습니다. * **주의 사항:** AI가 생성한 대량의 코드를 검토해야 하는 리뷰어의 부담이 커질 수 있으므로, '최종 책임은 사람에게 있다'는 인식과 품질 유지 프로세스가 필수적입니다. * **워크숍 결과:** 약 2,500명의 엔지니어가 참여하여 40% 이상이 실무에 적용하거나 활용할 의사를 밝히는 등 긍정적인 확산 효과를 확인했습니다. 에이전틱 코딩을 성공적으로 도입하기 위해서는 명확한 명세서 작성을 선행하고, AI가 작업 계획을 파일 형태로 기록하게 하여 사람과의 접점을 만드는 것이 중요합니다. 기술 부채를 방지하기 위해 AI가 작성한 코드의 품질을 엄격히 관리하는 체계를 병행할 것을 권장합니다.

Introducing Anthropic’s Claude Opus 4.7 model in Amazon Bedrock | Amazon Web Services (새 탭에서 열림)

Amazon Bedrock에 Anthropic의 가장 지능적인 모델인 Claude Opus 4.7이 정식 출시되었습니다. 이 모델은 코딩, 장기 실행 에이전트, 전문 지식 작업 전반에서 이전 모델보다 뛰어난 성능을 발휘하며, Bedrock의 차세대 추론 엔진을 통해 기업급 인프라와 보안성을 보장합니다. 사용자는 이를 통해 복잡한 모호성을 해결하고 더 정교한 자율적 문제 해결 능력을 워크플로우에 도입할 수 있습니다. ### Claude Opus 4.7의 주요 성능 향상 - **에이전트 코딩 능력**: 자율적인 시스템 엔지니어링 및 복잡한 코드 추론 능력이 대폭 강화되었습니다. SWE-bench Verified(87.6%)와 Terminal-Bench 2.0(69.4%) 등 주요 벤치마크에서 업계 최고 수준의 성적을 기록했습니다. - **고도화된 지식 업무**: 금융 분석 및 다단계 연구 워크플로우에 최적화되었습니다. 모호한 요청에 대해 합리적인 가정을 스스로 세우고 출력을 자가 검증(Self-verify)함으로써 첫 단계부터 높은 품질의 결과물을 생성합니다. - **장기 작업 및 컨텍스트 처리**: 100만 토큰의 넓은 컨텍스트 윈도우 전체에서 일관성을 유지합니다. 긴 호흡의 작업 중에도 목표를 벗어나지 않고 모호한 상황을 추론하며 안정적으로 과업을 수행합니다. - **시각 지각 능력 강화**: 고해상도 이미지를 지원하여 차트, 밀집된 텍스트 문서, 정밀한 화면 UI 등 미세한 디테일이 중요한 시각 자료 분석 정확도가 개선되었습니다. ### 차세대 추론 엔진과 엔터프라이즈 보안 - **동적 용량 할당**: 새로운 스케줄링 및 확장 로직을 도입하여 워크로드 수요에 따라 용량을 동적으로 할당합니다. 이는 서비스 가용성을 높이고 급격한 트래픽 증가에도 유연하게 대응하게 해줍니다. - **제로 오퍼레이터 액세스**: 고객의 프롬프트와 응답 데이터에 대해 Anthropic이나 AWS 운영자가 접근할 수 없도록 설계되어, 민감한 데이터를 다루는 기업의 프라이버시를 철저히 보호합니다. - **효율적인 수요 관리**: 수요가 급증하는 시기에는 요청을 즉시 거절하는 대신 큐(Queue)에 대기시켜 처리합니다. 기본적으로 리전당 계정별 분당 최대 10,000건(RPM)의 요청을 즉시 처리할 수 있는 성능을 제공합니다. ### 개발자 편의 기능 및 활용 방법 - **적응형 사고(Adaptive Thinking)**: 요청의 복잡도에 따라 모델이 스스로 '사고 토큰(Thinking tokens)' 예산을 동적으로 할당합니다. 이를 통해 복잡한 논리 구성이 필요한 질문에 대해 더 깊은 추론 과정을 거칠 수 있습니다. - **다양한 API 선택지**: 대화형 인터페이스를 위한 Converse API, 직접 제어가 가능한 Invoke API, 그리고 Anthropic SDK를 통한 Messages API 등을 지원하여 기존 환경에 쉽게 통합할 수 있습니다. - **즉각적인 시작**: Amazon Bedrock 콘솔의 플레이그라운드에서 바로 테스트할 수 있으며, OpenAI 호환 API를 사용하거나 AWS CLI를 통해 프로그래밍 방식으로 모델을 호출하는 것도 가능합니다. 현재 Claude Opus 4.7은 미국 동부(버지니아 북부), 아시아 태평양(도쿄), 유럽(아일랜드, 스톡홀름) 리전에서 즉시 사용할 수 있습니다. 복잡한 코딩 에이전트를 구축하거나 고도의 추론이 필요한 엔터프라이즈 애플리케이션을 개발 중이라면, 이전 버전인 4.6에서 프롬프트를 미세 조정하여 Opus 4.7의 향상된 성능을 극대화해 보시기 바랍니다.

생성형 UI: 모든 프롬 (새 탭에서 열림)

구글 리서치가 발표한 '제너레이티브 UI(Generative UI)'는 AI 모델이 단순한 텍스트 답변을 넘어 웹페이지, 게임, 도구, 시뮬레이션 등 완전한 사용자 경험(UX)을 실시간으로 생성하는 새로운 기술 패러다임입니다. 이 기술은 사용자의 질문이나 지시사항의 의도를 파악하여 고정된 형식이 아닌, 목적에 최적화된 맞춤형 인터페이스를 즉석에서 설계하고 코딩합니다. 현재 제미나이(Gemini) 앱과 구글 검색의 AI 모드에 통합되어 정적 인터페이스를 동적이고 상호작용 가능한 디지털 환경으로 변모시키고 있습니다. **정적 인터페이스를 넘어서는 새로운 패러다임** * 사용자가 카탈로그에서 기존 앱을 선택하는 대신, AI가 사용자의 니즈에 맞춰 동적으로 인터페이스를 생성하여 제공합니다. * 단일 단어부터 상세한 지침까지 모든 형태의 프롬프트에 대응하며, 단순한 정보 전달을 넘어 학습, 놀이, 탐색이 가능한 상호작용 환경을 구축합니다. * 사용자 평가 결과, 생성 속도를 제외한 품질 측면에서 일반적인 LLM의 텍스트 출력보다 제너레이티브 UI에 대한 선호도가 압도적으로 높게 나타났습니다. **실시간 제품 통합 및 활용 사례** * **제미나이 앱(Dynamic View):** 사용자의 대상층(예: 5세 아이 vs 성인)에 따라 콘텐츠와 기능을 다르게 설계하며, 패션 조언이나 이벤트 계획 등 실질적인 과업 수행을 돕습니다. * **구글 검색(AI Mode):** 제미나이 3의 멀티모달 이해 능력과 에이전트 코딩 역량을 활용하여 복잡한 과학적 시뮬레이션(예: RNA 중합효소 작용 기전) 등을 즉석에서 시각화합니다. * **맞춤형 도구 생성:** 소셜 미디어 포스트 갤러리 제작부터 수학 교육용 게임까지, 프롬프트의 의도에 따라 완전히 고유한 레이아웃과 기능을 갖춘 도구를 생성합니다. **제너레이티브 UI의 기술적 구현 원리** * **제미나이 3 Pro 기반:** 구글의 최신 모델을 핵심 엔진으로 사용하며 세 가지 주요 구성 요소를 추가하여 완성도를 높였습니다. * **도구 액세스(Tool Access):** 서버를 통해 이미지 생성 및 웹 검색 도구에 접근하며, 이를 통해 생성된 결과물을 브라우저에 직접 전송하여 효율성을 극대화합니다. * **정교한 시스템 지침:** 목표 설정, 계획 수립, 기술 사양 및 오류 방지 팁이 포함된 상세한 가이드를 통해 모델이 기능적인 UI를 설계하도록 유도합니다. * **사후 처리(Post-processing):** 모델이 출력한 결과물을 사후 처리 프로세스에 통과시켜 흔히 발생하는 기술적 오류를 수정하고 안정성을 확보합니다. 제너레이티브 UI는 소프트웨어가 사용자의 언어만큼이나 유연하고 적응력 있게 변화하는 미래를 보여줍니다. 구글 검색의 AI 모드나 제미나이 앱의 실험적 기능들을 통해, 정해진 틀에 갇히지 않은 진정한 개인화된 인터페이스를 직접 경험해 보시길 권장합니다.