기술

Anthropic의 격동의 주: 인간의 실수로 인해 두 가지 문제가 발생함

선도적인 AI 회사인 Anthropic은 잘못 구성된 클라우드 버킷의 데이터 노출과 Claude 3 Sonnet AI 모델의 일시적이고 기괴한 오작동으로 인해 내부 프로토콜에 대한 의문이 제기되는 두 가지 별도의 인적 오류 사건으로 격동의 한 주를 보냈습니다.

DailyWiz Editorial··5 읽기·378 조회
Anthropic의 격동의 주: 인간의 실수로 인해 두 가지 문제가 발생함

Anthropic의 강제 오류 일주일

캘리포니아주 샌프란시스코 – 선도적인 AI 연구 개발 회사인 Anthropic의 평온한 홀은 지난 주 전혀 평온하지 않았습니다. '헌법적 AI' 접근 방식과 주력 모델인 Claude 모델로 유명한 이 회사는 심각한 인적 오류로 인해 발생한 두 가지 개별 사건에 휘말렸습니다. 연이은 실수는 엄격한 안전 및 개인 정보 보호 표준을 유지하면서 고급 AI 운영을 확장하는 데 있어 본질적인 어려움이 주목을 받고 있습니다. 심지어 바로 이러한 원칙을 바탕으로 구축된 회사에서도 마찬가지입니다.

단 며칠 간격으로 발생한 이 사건은 내부 프로토콜에 대한 의문을 제기하고 빠르게 발전하는 AI 산업 내 압박점을 불러일으켰습니다. 최근 2024년 3월에 73억 달러라는 엄청난 자금을 확보하여 가치가 180억 달러를 넘어선 회사의 경우 이러한 실수는 OpenAI 및 Google과 같은 경쟁업체에 맞서 시장 리더십을 놓고 경쟁하는 중요한 시점에 발생합니다.

첫 번째 문제: 잘못 구성된 버킷에서 데이터 노출

이 주의 문제는 Anthropic의 보안 팀이 5월 27일 월요일에 시작했습니다. 잘못 구성된 클라우드 스토리지 버킷을 식별했습니다. 레거시 내부 테스트 환경의 일부인 Amazon S3 버킷에는 일상적인 인프라 마이그레이션 중에 의도치 않게 과도한 액세스 제어가 남겨졌습니다. 하급 엔지니어의 잘못된 권한 변경으로 인한 이러한 감독으로 인해 Claude 2.1의 비공개 베타에서 익명 처리되지 않은 사용자 메시지와 AI 응답이 일시적으로 노출되었습니다.

Dr. Anthropic의 새로 임명된 신뢰 및 안전 책임자인 Lena Petrov는 DailyWiz에 보낸 성명에서 이 사건을 언급했습니다. "우리는 구성 오류 발생 후 12시간 이내에 이를 감지하고 수정했습니다. 특정 Claude 2.1 베타 프로그램에 참여한 약 7,500명의 사용자가 잠재적으로 영향을 받았습니다. 우리는 영향을 받은 모든 개인에게 직접 통보하고 신용 모니터링 서비스를 제공했으며 모든 클라우드 스토리지 구성에 대한 포괄적인 감사를 시작했습니다. 우리는 이러한 실수를 깊이 후회하며 향후 발생을 방지하기 위해 교육 및 검토 프로세스를 강화하고 있습니다." 악의적인 액세스에 대한 증거는 발견되지 않았지만, 이 사건은 거대 기술 기업들에게도 항상 존재하는 데이터 유출 위협을 극명하게 상기시켜 주었습니다.

Claude 3 Sonnet의 브리핑, 기괴한 실수

불과 3일 후인 5월 30일 목요일, Anthropic은 또 다른 홍보 문제에 직면했습니다. Claude 3 Sonnet API 엔드포인트의 사소한 대기 시간 문제를 해결하기 위한 핫픽스가 불완전한 매개변수 조정과 함께 배포되어 모델에서 예상치 못한 이상한 동작이 발생했습니다. 약 55분 동안 Sonnet API를 사용하는 개발자들은 Claude 3 Sonnet이 복잡한 윤리적 딜레마 또는 추상적인 개념에 대해 메시지를 받을 때 매우 반복적이고 무의미한 단락을 생성하고 일부 경우에는 유해한 출력을 방지하도록 설계된 특정 콘텐츠 필터를 잠시 우회하는 사례를 보고했습니다.

이 문제는 개발자가 Claude의 특이한 응답 스크린샷을 공유한 X(이전의 Twitter)와 같은 플랫폼에서 빠르게 나타났습니다. 한 개발자인 Maya Singh은 “Claude가 문장 중간에 뇌졸중을 일으킨 것과 같았습니다.”라고 게시했습니다. "트롤리 문제에 대해 묻는 질문에는 '윤리적 프레임워크가 중요하다'는 다섯 문단이 계속해서 반복되었습니다." Anthropic은 신속하게 핫픽스를 롤백하여 모델을 이전의 안정적인 버전으로 복원했습니다. Petrov 박사는 “이는 성급한 배포 프로세스와 중요하지 않은 업데이트에 대한 QA 테스트 부족의 직접적인 결과였습니다.”라고 설명했습니다. "우리 내부 검토 결과 최종 검증 단계에서 인간의 감독이 확인되었습니다. 우리는 인식된 중요성에 관계없이 모든 모델 업데이트에 대해 보다 엄격한 다층 검토 정책을 시행하고 있습니다."

리더십 조사 및 향후 과제

이러한 이중 사건으로 인해 CEO Dario Amodei와 사장 Daniela Amodei를 포함한 Anthropic의 리더십에 대한 조사가 강화되었습니다. 회사는 AI 안전과 윤리적 개발에 대한 엄격한 노력을 바탕으로 명성을 쌓아왔지만, 이러한 '지루함'은 대규모 AI 시스템과 여전히 그 핵심에 있는 인간 요소를 관리하는 데 따른 엄청난 복잡성을 강조합니다. 이 사건은 빠르게 진압되기는 했지만 Anthropic이 기업 클라이언트 및 개발자 커뮤니티를 통해 공들여 구축한 신뢰를 미묘하게 약화시킬 수 있습니다.

Quantum Insights의 기술 분석가인 Alistair Finch 박사는 "이러한 사건은 걱정스럽기는 하지만 빠르게 변화하는 기술 세계, 특히 AI와 같은 초기 분야에서는 드문 일이 아닙니다."라고 말했습니다. "Anthropic의 핵심은 이러한 실수로부터 배우려는 투명성과 입증 가능한 헌신이 될 것입니다. 그들의 '헌법적 AI' 프레임워크는 강력한 시스템을 구축하는 것에 관한 것이지만 최고의 프레임워크라도 인간의 프로세스 실패로 인해 훼손될 수 있습니다."

일상 사용자에 대한 실제적 의미 및 권장 사항

Claude 또는 생성 AI와 같은 AI 모델과 상호 작용하는 일상적인 사용자에게 이러한 사건은 본질적인 사고를 상기시키는 중요한 역할을 합니다. 취약점. Anthropic의 모델은 일반적으로 견고하지만, 특히 인간의 손이 배포 및 유지 관리에 관여하는 경우 오류가 없는 시스템은 없습니다. 다음은 몇 가지 권장 사항입니다.

  • 정보 확인:특히 중요한 결정이나 사실적 정확성을 위해 항상 AI 생성 콘텐츠를 상호 참조하세요. 이번 주에 본 것처럼 AI 모델은 '환각'을 일으키거나 예기치 않게 행동할 수 있습니다.
  • 개인정보 보호정책 검토: AI 서비스가 수집하는 데이터와 사용 방법을 이해하세요. 투명하고 강력한 개인 정보 보호 정책을 갖춘 서비스를 선택하세요.
  • 강력한 보안 관행: 은행이나 이메일에서와 마찬가지로 고유하고 강력한 비밀번호를 사용하고 모든 AI 계정에 2FA(2단계 인증)를 활성화하세요.
  • 최신 정보 유지: 보안 사고 또는 모델 행동 변경과 관련하여 AI 제공업체의 뉴스 및 업데이트를 항상 확인하세요.
  • 고려하세요. 다양화: 모든 중요한 작업을 하나의 AI 도구에만 의존하지 마십시오. 평판이 좋은 다양한 AI 플랫폼(예: Google Gemini, OpenAI의 ChatGPT)을 탐색하면 다양한 관점을 제공하고 단일 지점 실패 위험을 줄일 수 있습니다.

Anthropic의 어려운 한 주는 가장 발전된 AI 회사조차도 운영에서 여전히 인간 요소와 씨름하고 있음을 강조합니다. AI 통합이 모든 부문에 걸쳐 심화됨에 따라 대중의 신뢰를 유지하고 보다 안전한 디지털 미래를 보장하기 위해서는 강력한 내부 통제, 지속적인 감사, 투명한 커뮤니케이션이 무엇보다 중요해질 것입니다.

Recommended

* We may earn a commission from qualifying purchases at no extra cost to you.

Comments

No comments yet. Be the first!

관련 글

Bennu의 숨겨진 화학: 소행성 샘플을 통해 패치워크 과거가 드러남

Bennu의 숨겨진 화학: 소행성 샘플을 통해 패치워크 과거가 드러남

NASA의 OSIRIS-REx 소행성 Bennu 샘플에 대한 새로운 분석에서는 복잡하고 국부적인 수분 활동과 유기 분자의 탄력 있는 생존을 나타내는 놀라운 화학적 패치워크가 밝혀져 생명의 우주 기원에 대한 새로운 단서를 제공합니다.

IndiGo, 격동의 하늘을 조종하기 위해 항공 베테랑 Willie Walsh를 활용

IndiGo, 격동의 하늘을 조종하기 위해 항공 베테랑 Willie Walsh를 활용

인도 최대 항공사인 IndiGo가 Pieter Elbers의 후임으로 항공 베테랑 Willie Walsh를 새로운 CEO로 임명했습니다. Walsh의 임명은 중대한 항공편 취소 위기에 따른 것입니다.

방탄소년단, '2.0' MV 공개: 유쾌한 '올드보이' 오마주

방탄소년단, '2.0' MV 공개: 유쾌한 '올드보이' 오마주

K팝 타이탄 방탄소년단이 박찬욱 감독의 대표 영화 '올드보이'에서 영감을 받아 코미디 변신을 가미한 수록곡 '2.0'의 새로운 뮤직비디오로 팬들을 깜짝 놀라게 했다.

판사는 Heritage, Environment Row에서 Sugarloaf Zipline을 중단합니다.

판사는 Heritage, Environment Row에서 Sugarloaf Zipline을 중단합니다.

리우데자네이루 연방 판사는 환경 및 문화유산 문제를 이유로 슈가로프산(Sugarloaf Mountain)과 모로 다 우르카(Morro da Urca)를 연결하는 논란의 여지가 있는 집라인 프로젝트를 차단했습니다.

최저 임금을 £12.71로 인상하면 전 세계적으로 가격 인상 경고가 발령됩니다

최저 임금을 £12.71로 인상하면 전 세계적으로 가격 인상 경고가 발령됩니다

최저 임금이 시간당 £12.71로 인상됨에 따라 다양한 분야의 기업들이 운영 비용 상승에 대한 우려를 표명하고 있으며, 이는 소비자의 잠재적인 가격 인상과 복잡한 경제적 파급 효과를 예고하고 있습니다.

Bennu 소행성 샘플에서 숨겨진 화학 패치워크 발견

Bennu 소행성 샘플에서 숨겨진 화학 패치워크 발견

NASA의 OSIRIS-REx 임무는 소행성 Bennu의 화학이 균일하지 않고 복잡한 패치워크임을 보여줍니다. 과학자들은 생명의 기원을 이해하는 데 필수적인 섬세한 유기 분자를 보존하면서 국지적인 수분 활동에 의해 형성된 세 개의 뚜렷한 영역을 발견했습니다.