ai-safety

2 개의 포스트

Amazon Bedrock Guardrails, 중앙 집중식 제어 및 관리를 통한 교차 계정 보호 기능 지원 | Amazon Web Services (새 탭에서 열림)

Amazon Bedrock Guardrails에서 조직 전체의 여러 AWS 계정에 걸쳐 보안 제어 기능을 중앙 집중식으로 관리하고 강제할 수 있는 '교차 계정 보호(cross-account safeguards)' 기능이 정식 출시되었습니다. 이 기능을 통해 관리자는 단일 정책으로 모든 계정과 생성형 AI 애플리케이션에 일관된 안전 가이드라인을 적용하여 거버넌스를 강화하고 보안 팀의 운영 부담을 획기적으로 줄일 수 있습니다. 결과적으로 개별 계정의 설정을 일일이 확인하지 않고도 조직의 책임감 있는 AI(Responsible AI) 요건을 효과적으로 충족할 수 있게 되었습니다. **조직 및 계정 단위의 중앙 집중식 제어** * **조직 수준 강제:** AWS Organizations의 관리 계정에서 단일 가이드라인을 설정하여 조직 전체, 특정 조직 단위(OU), 또는 개별 계정에서 발생하는 모든 Amazon Bedrock 모델 호출에 보안 필터를 자동 적용합니다. * **계정 수준 강제:** 특정 AWS 계정 내에서 이루어지는 모든 추론 API 호출에 대해 보호 조치를 일괄 적용하도록 구성할 수 있습니다. * **유연한 계층 구조:** 조직 전체의 공통 가드레일을 적용하면서도, 필요에 따라 특정 사용 사례나 애플리케이션에 맞는 계정별 추가 제어 기능을 병행하여 운용할 수 있습니다. **정교한 가드레일 설정 및 적용 옵션** * **모델 선택적 적용:** 중앙에서 추론에 사용할 특정 모델을 포함(Include)하거나 제외(Exclude)하도록 설정하여 관리 효율성을 높였습니다. * **콘텐츠 가드링 모드(Content Guarding):** * **포괄적 모드(Comprehensive):** 호출자의 태그 지정 여부와 관계없이 모든 시스템 프롬프트와 사용자 입력에 가드레일을 강제 적용하는 안전한 기본 방식입니다. * **선택적 모드(Selective):** 호출자가 태그를 지정한 특정 부분에만 가드레일을 적용하여 불필요한 처리를 줄이고 효율성을 높이는 방식입니다. * **변경 불가성 보장:** 가드레일 설정 시 특정 버전을 지정하여 생성함으로써, 하위 멤버 계정에서 보호 조치 내용을 임의로 수정하거나 우회할 수 없도록 보장합니다. **구현 방법 및 기술적 디테일** * **통합 관리 인터페이스:** Amazon Bedrock 콘솔이나 AWS Organizations 정책 메뉴를 통해 관리할 수 있으며, 가드레일 ARN과 버전을 지정한 'Bedrock 정책'을 대상 계정에 연결하는 방식으로 작동합니다. * **지원 API:** `InvokeModel`, `InvokeModelWithResponseStream`, `Converse`, `ConverseStream` 등 Amazon Bedrock의 주요 추론 API 호출 시 가드레일이 자동으로 개입합니다. * **검증 및 모니터링:** 멤버 계정에서 현재 강제 적용 중인 조직 수준 가드레일을 직접 확인할 수 있으며, API 응답에 포함된 가드레일 평가 정보를 통해 정상 작동 여부를 테스트할 수 있습니다. **실무 적용 시 유의 사항** * **정확한 ARN 지정:** 정책 설정 시 가드레일 ARN을 잘못 입력하면 정책 위반으로 간주되어 해당 계정에서 Bedrock 모델 추론 자체가 불가능해질 수 있으므로 정확한 식별자 입력이 필수적입니다. * **기능 제한 사항:** 현재 교차 계정 보호 기능은 '자동화된 추론(Automated Reasoning)' 검사는 지원하지 않으므로 보안 설계 시 이를 고려해야 합니다. * **비용 및 지역:** 가드레일이 적용될 때마다 구성된 보호 조치에 따른 비용이 발생하며, Bedrock Guardrails가 사용 가능한 모든 AWS 리전(Commercial 및 GovCloud)에서 즉시 사용할 수 있습니다.

AMIE를 위한 의사 (새 탭에서 열림)

구글 딥마인드가 발표한 g-AMIE(guardrailed-AMIE)는 환자의 병력을 청취하고 진단 정보를 정리하는 의료용 AI 시스템으로, 의사의 최종 감독을 전제로 설계되었습니다. 이 시스템은 환자에게 직접적인 의료 조언을 제공하지 못하도록 엄격한 가드레일을 적용하되, 대신 의사가 검토하고 승인할 수 있는 상세한 임상 보고서를 생성합니다. 가상 임상 시험 결과, g-AMIE의 진단 정확도와 환자 소통 능력은 동일한 제약 조건 하의 인간 의료 전문가보다 우수한 것으로 평가되어 의료 AI의 안전한 도입 가능성을 제시했습니다. ### 의사 중심의 감독 체계와 비동기식 협업 * 의료 행위의 법적 책임과 전문성을 보장하기 위해 AI가 독자적으로 진단하는 대신, 전문의가 AI의 결과물을 검토하고 승인하는 '의사 중심 감독' 프레임워크를 채택했습니다. * AI가 환자와 대화하며 병력을 청취하는 동안 전문의는 다른 업무를 수행할 수 있으며, 이후 AI가 요약한 정보를 비동기적으로 검토함으로써 진료 효율성을 극대화합니다. * Gemini 2.0 Flash를 기반으로 구축되었으며, 의사가 진단 및 관리 계획을 수정·승인할 수 있도록 설계된 전용 웹 인터페이스인 '클리니션 콕핏(Clinician Cockpit)'을 제공합니다. ### 세분화된 멀티 에이전트 시스템 구조 * **대화 에이전트:** 일반적인 병력 청취부터 초기 진단 가설 검증을 위한 맞춤 질문, 환자의 궁금증 해소에 이르는 3단계 프로세스를 통해 고품질의 대화를 수행합니다. * **가드레일 에이전트:** AI가 환자에게 개별화된 의료 조언이나 진단을 직접 내리지 않도록 실시간으로 모든 답변을 감시하고, 규정을 준수하도록 문구를 재구성합니다. * **SOAP 노트 에이전트:** 수집된 정보를 주관적 기술(Subjective), 객관적 자료(Objective), 평가(Assessment), 계획(Plan)의 SOAP 형식으로 자동 생성하며, 의사가 환자에게 전달할 메시지 초안까지 함께 작성합니다. ### 임상 수행 능력 평가 (OSCE) 결과 * 60개의 환자 시나리오를 활용해 일반의(PCP) 및 간호사/의사 보조사(NP/PA) 그룹과 g-AMIE의 성능을 무작위 대조 시험으로 비교했습니다. * 감독 의사들과 독립적인 평가단은 g-AMIE가 도출한 차별 진단(Differential Diagnosis)과 환자 관리 계획이 인간 전문가 그룹보다 더 우수하다고 평가했습니다. * 환자 역할을 맡은 연기자들 또한 인간 의료진이 작성한 메시지보다 g-AMIE가 작성한 환자용 메시지에 대해 더 높은 선호도와 만족도를 보였습니다. g-AMIE는 AI의 데이터 처리 효율성과 전문의의 임상적 책임감을 결합한 새로운 의료 협업 모델의 이정표를 제시합니다. 비록 AI 시스템에 특화된 환경에서 도출된 결과라는 점을 고려해야 하나, 가드레일을 통해 안전성을 확보하면서도 의사의 업무 부하를 줄이는 이러한 기술적 접근은 향후 실제 진료 현장에 AI를 도입할 때 핵심적인 표준이 될 것으로 보입니다.