line

Advancing Guardrail Models through Automated Vulnerability Collection and Generation Using Coding Agents (opens in new tab)

LLM 시대의 보호 장치, 가드레일 LLM 기반 서비스가 빠르게 확산되면서 LLM 모델의 응답을 공격자가 의도대로 ‘조종’하려는 시도도 함께 늘고 있습니다. 특히 다음과 같은 공격 유형은 실제 서비스 환경에서 지속적으로 관찰되는 시도입니다. 프롬프트 인젝션(prompt injection): 사용자의 입력에 “이전 지시를 무시하라” 같은 문장을 섞어 시스템/개발자 지시보다 공격자의 지시를 우선하도록 유도하는 공격 방식입니다. 탈옥(jailbreaking): 모델이 따라야 할 안전 정책이나 제한을…

toss

Metric Review, Driving Execution (opens in new tab)

안녕하세요, 토스플레이스에서 Data Platform Team을 이끌고 있는 박종익입니다. "인사이트는 분명히 나왔는데, 왜 실행은 느릴까요?" 데이터 조직에 있다 보면 이 질문을 자주 마주하게 됩니다. 분석은 쌓이고, 대시보드는 채워지는데 — 정작 제품이나 사업에 직접적인 변화가 일어나는 속도는 기대에 미치지 못하는 경우가 많아요. 저희도 같은 고민을 오랫동안 해왔습니다. 그 고민에서 시작한 것이 바로 Metric Review입니다. 오늘은 저희가 왜 Metric Review를 시작했고, 어떻…