기술

Microsoft, 인종을 강화하는 기본 AI 모델 3종 공개

Microsoft는 단 6개월 만에 AI Innovations 그룹에서 개발한 3가지 새로운 기본 AI 모델(MAI-VoiceText, MAI-AudioWave 및 MAI-VisionForge)을 공개하여 멀티모달 AI 경쟁을 심화시켰습니다.

DailyWiz Editorial··4 읽기·633 조회
Microsoft, 인종을 강화하는 기본 AI 모델 3종 공개

Microsoft, 세 가지 기본 AI 모델 출시, 경쟁 심화

워싱턴주 레드몬드 – 빠르게 진화하는 인공 지능 환경에 대한 공격적인 추진을 알리는 대담한 움직임으로 Microsoft는 세 가지 새로운 기본 AI 모델을 공식적으로 공개했습니다. 전담 AI 혁신(MAI) 그룹이 결성된 지 불과 6개월 만에 이루어진 이번 전략적 출시를 통해 거대 기술 기업은 급성장하는 멀티모달 AI 분야에서 Google, Meta, 심지어 긴밀한 파트너인 OpenAI와 같은 경쟁업체에 직접 도전할 수 있게 되었습니다.

이번 주 초 가상 언론 행사에서 소개된 새 모델은 음성-텍스트 변환, 오디오 생성 및 이미지 생성 분야의 고급 기능을 보여줍니다. 이는 최첨단 생성 AI를 광범위한 제품 및 서비스 생태계에 직접 통합하는 것을 목표로 하는 Microsoft의 내부 AI 개발에 있어 중요한 도약을 나타냅니다.

Microsoft의 기본 트리오 공개

내부적으로 MAI-VoiceText, MAI-AudioWaveMAI-VisionForge라는 브랜드가 붙은 세 가지 모델은 작동하도록 설계되었습니다. 독립적이고 시너지적으로 포괄적인 생성 기능 제품군을 제공합니다.

  • MAI-VoiceText: 이 고급 음성-텍스트 모델은 까다로운 음향 환경에서도 탁월한 정확성과 속도를 자랑합니다. Microsoft는 글로벌 애플리케이션의 중요한 기능인 다양한 악센트와 방언을 전사하는 데 있어 98.5% 이상의 정확도를 달성했다고 주장합니다. 지연 시간이 짧기 때문에 실시간 전사에 이상적입니다.
  • MAI-AudioWave: 정교한 오디오 생성 모델인 MAI-AudioWave는 텍스트 프롬프트나 기존 오디오 입력에서 사실적인 인간 음성, 음악 조각 및 환경 사운드스케이프를 생성할 수 있습니다. 개발자들은 사용자 정의 가능한 감정 톤과 보컬 스타일로 음성을 생성하는 능력을 강조하고 고도로 개인화된 음성 비서 및 콘텐츠 생성을 위한 문을 열었습니다.
  • MAI-VisionForge: Microsoft가 텍스트-이미지 생성 분야에 진출한 MAI-VisionForge를 통해 사용자는 자연어 설명에서 고해상도 이미지를 생성할 수 있습니다. 이 모델은 사실적부터 인상주의까지 다양한 예술적 스타일을 지원하며 인페인팅 및 아웃페인팅 기능을 포함하여 원활한 이미지 편집 및 확장이 가능합니다.

Dr. 2023년 11월 결성된 마이크로소프트 AI 혁신 그룹 대표인 에블린 리드(Evelyn Reed)는 개발 속도를 강조했다. "우리의 임무는 분명했습니다. 핵심 AI 연구를 가속화하고 전례 없는 속도로 이러한 강력한 기능을 사용자에게 제공하는 것입니다."라고 Reed는 말했습니다. "이 세 가지 모델은 MAI의 놀라운 재능과 헌신에 대한 증거이며 모든 Microsoft 플랫폼 전반에 걸쳐 지능형 상호 작용의 새로운 시대를 위한 토대를 마련합니다."

일상 경험 혁신

일상적인 사용자를 위한 이러한 새로운 모델의 실질적인 의미는 상당하며 Microsoft의 유비쿼터스 소프트웨어 및 하드웨어에 더 스마트하고 직관적인 AI 기능을 주입할 것을 약속합니다. 다음과 같은 미래를 상상해 보십시오.

  • 생산성 향상: MAI-VoiceText는 Microsoft Word에서 더욱 정확한 받아쓰기, Teams 회의에서 실시간 전사 및 번역, Windows용 더욱 안정적인 음성 명령을 지원하여 생각과 행동 사이의 마찰을 줄여줍니다.
  • 창의적 역량 강화: MAI-VisionForge를 사용하면 누구나 PowerPoint 프레젠테이션, 고유한 프로필 사진 또는 심지어 개인화된 디지털용 사용자 정의 그래픽을 생성할 수 있습니다. 간단한 텍스트 프롬프트가 포함된 데스크톱 배경용 아트입니다. 콘텐츠 제작자는 소셜 미디어 또는 마케팅 캠페인을 위한 시각적 프로토타입을 신속하게 제작할 수 있습니다.
  • 몰입형 오디오: MAI-AudioWave는 개인 비디오를 위한 역동적인 AI 생성 사운드트랙을 활성화하고, 프레젠테이션을 위한 맞춤형 음성 해설을 만들거나, 접근성 도구 및 디지털 보조 장치에 보다 자연스럽고 감정적으로 공감하는 음성을 제공하여 기술을 더욱 인간적인 느낌으로 만들 수 있습니다.

이러한 모델은 Microsoft의 Azure AI 서비스에 통합될 것으로 예상됩니다. 전 세계 개발자가 자신의 능력을 활용할 수 있도록 합니다. 또한 Windows Copilot, Microsoft 365 애플리케이션, 동적 게임 콘텐츠 생성을 위한 Xbox 등 기존 Microsoft 제품을 향상시킬 준비가 되어 있습니다.

과대 광고를 넘어서: 소비자를 위한 권장 사항

전체 출시에는 시간이 걸리겠지만 소비자는 Microsoft 기반 환경에서 상당한 업그레이드를 기대할 수 있습니다. 이러한 발전을 활용하려는 경우:

  • 생산성 향상을 위해: Microsoft Surface Pro 10 또는 최신 버전의 Windows 11을 실행하는 호환 노트북으로 업그레이드하는 것이 좋습니다. 이러한 장치는 온디바이스 AI 처리에 점점 더 최적화되어 실시간 전사 및 이미지 생성이 더욱 빠르고 효율적으로 이루어집니다. Microsoft 365 Copilot 구독과 함께 사용자는 일상적인 작업 흐름 내에서 이러한 모델의 잠재력을 최대한 활용할 수 있습니다.
  • 창의적인 탐험가의 경우: 디지털 아트 및 콘텐츠 제작에 큰 관심이 있는 사용자는 Microsoft Designer와 같은 도구에 대한 MAI-VisionForge의 통합 또는 심지어 PowerPoint 내에서 직접 통합되는 기능을 탐색해야 합니다. Xbox Series X의 업데이트를 주시하면 역동적인 게임 환경과 개인화된 경험에서 놀라운 응용 프로그램을 발견할 수도 있습니다.
  • 접근성 및 커뮤니케이션: MAI-VoiceText 및 MAI-AudioWave의 개선 사항은 커뮤니케이션 앱에서 가장 눈에 띄게 나타납니다. 기기에 최신 오디오 하드웨어가 있고 안정적인 인터넷 연결이 있는지 확인하면 이러한 실시간 AI 기능의 이점을 극대화할 수 있습니다.

Microsoft의 최신 AI 공세는 생성적 AI 혁명을 주도하려는 회사의 의지를 강조합니다. MAI의 급속한 발전으로 경쟁이 더욱 치열해지고 있으며, AI 기반 도구가 디지털 생활에서 더욱 필수적인 부분이 되는 흥미로운 미래를 약속하고 있습니다.

Recommended

* We may earn a commission from qualifying purchases at no extra cost to you.

Comments

No comments yet. Be the first!

관련 글

유령 변호사: 초자연적 기믹이 법적인 투지를 능가하는가?

유령 변호사: 초자연적 기믹이 법적인 투지를 능가하는가?

유연석이 출연하는 '유령변호사'는 죽은 자와 대화하는 변호사라는 독특한 설정으로 시청자들을 사로잡고 있다. 그러나 중간 지점에 도달하면서 일부 시청자는 초자연적 기믹에 대한 불일치와 과도한 의존에 주목하고 있습니다.

KU의 Flory Bidunga가 NBA 드래프트 및 이적 포털을 뒤흔들었습니다.

KU의 Flory Bidunga가 NBA 드래프트 및 이적 포털을 뒤흔들었습니다.

NBA 2라운드 지명자로 예상되는 고대 고려대의 플로리 비둥가(Flory Bidunga)가 드래프트를 선언하고 이적 포털에 들어가 800명이 넘는 지원자 중 즉시 최고의 선수가 되었습니다.

관세의 해: 자동차 산업은 변화하는 모래를 탐색합니다

관세의 해: 자동차 산업은 변화하는 모래를 탐색합니다

트럼프 행정부의 철강 및 알루미늄 관세 부과 1년 후, 글로벌 자동차 산업은 비용 증가, 공급망 중단, 투자 전략 전환 등 생산 라인부터 소비자 가격까지 모든 것에 영향을 미치는 상황에 직면해 있습니다.

시그니처 향의 잠금 해제: 향수 레이어링의 부상

시그니처 향의 잠금 해제: 향수 레이어링의 부상

바디 로션, 오일, 향수를 혼합하여 개인이 독특하고 개인화된 향기를 만들 수 있도록 지원하는 향수 레이어링의 급성장하는 트렌드를 알아보세요.

미국, 가격 대립 속에 브랜드 의약품에 100% 관세 위협

미국, 가격 대립 속에 브랜드 의약품에 100% 관세 위협

미국은 제약회사들이 약가를 낮추고 국내 생산을 늘리기 위해 2025년 1월 31일까지 새로운 거래에 동의하지 않는 한 수입 브랜드 처방약에 대해 100% 관세를 부과하겠다고 위협했습니다. 제네릭 의약품은 제안된 관세에서 면제됩니다.

SB19의 'Wakas At Simula': 5주년을 기념하는 24트랙 오디세이

SB19의 'Wakas At Simula': 5주년을 기념하는 24트랙 오디세이

SB19의 24개 트랙 앨범인 "Wakas At Simula"는 "GENTO"와 같은 획기적인 히트작과 P-Pop의 글로벌 범위를 재정의하는 새로운 콜라보레이션을 특징으로 하는 중요한 5주년 이정표입니다.