テクノロジー

Microsoft、3つの基礎AIモデルを発表、競争激化

Microsoft は、同社の AI Innovations グループがわずか 6 か月で開発した 3 つの新しい基本 AI モデル、MAI-VoiceText、MAI-AudioWave、MAI-VisionForge を発表し、マルチモーダル AI における競争を激化させています。

DailyWiz Editorial··4 読了·633 閲覧
Microsoft、3つの基礎AIモデルを発表、競争激化

マイクロソフト、3 つの基礎 AI モデルを発表、競争激化

ワシントン州レドモンド – 急速に進化する人工知能の世界への積極的な進出を示す大胆な動きとして、マイクロソフトは 3 つの新しい基礎 AI モデルを正式に発表しました。専用の AI Innovations (MAI) グループの設立からわずか 6 か月後に行われたこの戦略的発表により、ハイテク巨人は、マルチモーダル AI の急成長分野において、Google、Meta、さらには緊密なパートナーである OpenAI などのライバルに直接挑戦する立場にあります。

今週初めにバーチャルプレスイベントで発表された新モデルは、音声からテキストへの転写、オーディオ生成、および画像生成における高度な機能を実証します。これらは、最先端の生成 AI を製品とサービスの広大なエコシステムに直接統合することを目的としており、Microsoft の社内 AI 開発にとって大きな飛躍を表しています。

Microsoft の基礎トリオを紐解く

社内で MAI-VoiceTextMAI-AudioWave、および MAI-VisionForge としてブランド化されている 3 つのモデルは、独立して動作するように設計されています。相乗効果により、包括的な生成機能スイートを提供します。

  • MAI-VoiceText: この高度な音声テキスト変換モデルは、困難な音響環境でも優れた精度と速度を誇ります。 Microsoft は、多様なアクセントや方言の転写において 98.5% 以上の精度を達成しており、これはグローバル アプリケーションにとって重要な機能であると主張しています。遅延が少ないため、リアルタイムの文字起こしに最適です。
  • MAI-AudioWave: 洗練されたオーディオ生成モデルである MAI-AudioWave は、テキスト プロンプトまたは既存のオーディオ入力から、リアルな人間の音声、音楽の断片、環境サウンドスケープを作成できます。開発者は、カスタマイズ可能な感情のトーンとボーカル スタイルで音声を生成する機能を強調し、高度にパーソナライズされた音声アシスタントとコンテンツ作成への扉を開きます。
  • MAI-VisionForge: Microsoft がテキストから画像への生成分野に参入した MAI-VisionForge により、ユーザーは自然言語の記述から高解像度の画像を作成できます。このモデルは、フォトリアリスティックから印象派まで、幅広い芸術スタイルをサポートしており、インペイントとアウトペイントの機能が含まれているため、シームレスな画像編集と拡張が可能です。

Dr. 2023年11月に設立されたマイクロソフトAIイノベーショングループの責任者エブリン・リード氏は開発のスピードを強調した。 「私たちの使命は明確でした。中核となる AI 研究を加速し、これらの強力な機能を前例のないスピードでユーザーに提供するということです」とリード氏は述べました。 「これら 3 つのモデルは、MAI の驚くべき才能と献身的な取り組みの証であり、すべての Microsoft プラットフォームにわたるインテリジェントなインタラクションの新時代の基礎を築きます。」

日常エクスペリエンスの変革

これらの新しいモデルが日常ユーザーに与える実際的な影響は大きく、マイクロソフトのユビキタス ソフトウェアとハ​​ードウェアに、よりスマートで直感的な AI 機能を注入することが期待されます。次のような未来を想像してみてください。

  • 生産性の向上: MAI-VoiceText は、Microsoft Word でのより正確なディクテーション、Teams 会議でのリアルタイムの文字起こしと翻訳、Windows でのより信頼性の高い音声コマンドを強化し、思考と行動の間の摩擦を軽減します。
  • クリエイティブな強化: MAI-VisionForge を使用すると、誰でも PowerPoint プレゼンテーション用のカスタム グラフィック、独自のプロフィール写真、さらにはパーソナライズされたグラフィックを生成できるようになります。デスクトップの背景にデジタル アートを使用し、すべてシンプルなテキスト プロンプトを備えています。コンテンツ作成者は、ソーシャル メディアやマーケティング キャンペーン用のビジュアルのプロトタイプを迅速に作成できます。
  • イマーシブ オーディオ: MAI-AudioWave を使用すると、個人用ビデオ用の AI 生成の動的なサウンドトラックを有効にしたり、プレゼンテーション用のカスタム ナレーションを作成したり、アクセシビリティ ツールやデジタル アシスタントにより自然で感情的に共鳴する音声を提供したりすることもでき、テクノロジーをより人間らしく感じさせることができます。

これらのモデルは Microsoft の Azure AI サービスに統合される予定で、開発者はこれを利用できるようになります。世界中でその力を活用します。さらに、Windows Copilot、Microsoft 365 アプリケーション、さらには動的なゲーム コンテンツ生成のための Xbox など、既存の Microsoft 製品を強化する準備ができています。

誇大広告の向こう側: 消費者への推奨事項

完全な展開には時間がかかりますが、消費者は Microsoft によるエクスペリエンスの大幅なアップグレードを期待できます。これらの進歩を活用したい方:

  • 生産性の向上:Microsoft Surface Pro 10 または最新バージョンの Windows 11 を実行する互換性のあるラップトップへのアップグレードを検討してください。これらのデバイスはオンデバイス AI 処理向けにますます最適化されており、リアルタイムの文字起こしと画像生成がさらに高速かつ効率的に行われます。 Microsoft 365 Copilot サブスクリプションと組み合わせることで、ユーザーは日常のワークフロー内でこれらのモデルの可能性を最大限に引き出すことができます。
  • クリエイティブ エクスプローラー向け: デジタル アートやコンテンツ作成に強い関心を持つユーザーは、今後の MAI-VisionForge の Microsoft Designer などのツールへの統合、さらには PowerPoint 内での直接統合を検討する必要があります。 Xbox Series X のアップデートに注目すると、動的なゲーム環境やパーソナライズされたエクスペリエンスで驚くべきアプリケーションが見つかる可能性もあります。
  • アクセシビリティとコミュニケーション: MAI-VoiceText と MAI-AudioWave による改善は、コミュニケーション アプリで最も顕著になります。デバイスに最新のオーディオ ハードウェアと安定したインターネット接続が備わっていることを確認することで、これらのリアルタイム AI 機能の利点を最大限に活用できます。

Microsoft の最新の AI 攻勢は、生成 AI 革命をリードするという同社の取り組みを強調しています。 MAI の急速な進歩に伴い、競争は激化しており、AI を活用したツールが私たちのデジタル ライフにさらに不可欠な部分となるエキサイティングな未来が約束されています。

Recommended

* We may earn a commission from qualifying purchases at no extra cost to you.

Comments

No comments yet. Be the first!

関連記事

ファントム弁護士: 超常現象のギミックは法律の根性を上回っているのか?

ファントム弁護士: 超常現象のギミックは法律の根性を上回っているのか?

ユ・ヨンソク主演の韓国ドラマ「幻の弁護士」は、死者に語りかける弁護士というユニークな設定で視聴者を魅了している。しかし、中盤に差し掛かるにつれ、一部の視聴者はその矛盾や超自然的なギミックへの過度の依存に気づいている。

KUのフローリー・ビドゥンガがNBAドラフトと移籍ポータルを揺るがす

KUのフローリー・ビドゥンガがNBAドラフトと移籍ポータルを揺るがす

NBAの2巡目指名と予想されているKUのフローリー・ビドゥンガがドラフトへの参加を宣言し、移籍ポータルに入り、即座に800人以上のエントリーの中で獲得可能なトッププレーヤーとなった。

関税の年: 自動車業界は変化する砂を乗り越える

関税の年: 自動車業界は変化する砂を乗り越える

トランプ政権の鉄鋼・アルミニウム関税から1年、世界の自動車産業はコスト高、サプライチェーンの混乱、投資戦略の変化に直面しており、生産ラインから消費者物価に至るまであらゆるものに影響を与えている。

あなたの特徴的な香りを解き放つ: フレグランスのレイヤリングの台頭

あなたの特徴的な香りを解き放つ: フレグランスのレイヤリングの台頭

ボディ ローション、オイル、香水を混ぜ合わせて、個人がユニークでパーソナライズされた香りを作成できるようにする、フレグランスのレイヤリングの急成長するトレンドを発見してください。

米国、価格対立の中でブランド医薬品に100%関税をかけると脅す

米国、価格対立の中でブランド医薬品に100%関税をかけると脅す

米国は、医薬品価格を引き下げ国内生産を拡大するため、製薬会社が2025年1月31日までに新たな協定に合意しなければ、輸入ブランド処方薬に100%の関税を課すと脅している。ジェネリック医薬品は提案されている関税から免除されます。

SB19 の「Wakas At Simula」: 5 周年を記念する 24 トラックのオデッセイ

SB19 の「Wakas At Simula」: 5 周年を記念する 24 トラックのオデッセイ

SB19 の 24 曲入りアルバム『Wakas At Simula』は、5 年間の重要な節目を記念するもので、「GENTO」などの大ヒット曲や、P-POP の世界的な広がりを再定義する新しいコラボレーションをフィーチャーしています。