This article is displayed in its original language.
Technology

مايكروسوفت تطلق العنان لثلاثية من نماذج الذكاء الاصطناعي التأسيسية، لتكثيف السباق

كشفت Microsoft النقاب عن ثلاثة نماذج أساسية جديدة للذكاء الاصطناعي - MAI-VoiceText، وMAI-AudioWave، وMAI-VisionForge - التي طورتها مجموعة AI Innovations في ستة أشهر فقط، مما أدى إلى تكثيف المنافسة في الذكاء الاصطناعي متعدد الوسائط.

DailyWiz Editorial··4 min read·633 views
مايكروسوفت تطلق العنان لثلاثية من نماذج الذكاء الاصطناعي التأسيسية، لتكثيف السباق

تطلق Microsoft العنان لثلاثية من نماذج الذكاء الاصطناعي التأسيسية، وسباق مكثف

ريدموند، واشنطن - في خطوة جريئة تشير إلى دفعة قوية في مشهد الذكاء الاصطناعي سريع التطور، كشفت Microsoft رسميًا عن ثلاثة نماذج أساسية جديدة للذكاء الاصطناعي. يأتي هذا الإطلاق الاستراتيجي بعد ستة أشهر فقط من تشكيل مجموعتها المخصصة لابتكارات الذكاء الاصطناعي (MAI)، مما يضع عملاق التكنولوجيا في تحدي المنافسين بشكل مباشر مثل Google وMeta وحتى شريكها الوثيق OpenAI في مجال الذكاء الاصطناعي متعدد الوسائط المزدهر.

تظهر النماذج الجديدة، التي تم تقديمها في وقت سابق من هذا الأسبوع في حدث صحفي افتراضي، قدرات متقدمة في تحويل الصوت إلى نص، وتوليد الصوت، وتوليد الصور. إنها تمثل قفزة كبيرة لتطوير الذكاء الاصطناعي داخل شركة Microsoft، بهدف دمج الذكاء الاصطناعي المتطور مباشرة في نظامها البيئي الواسع من المنتجات والخدمات.

الكشف عن الثلاثي التأسيسي لشركة Microsoft

تم تصميم النماذج الثلاثة، التي تحمل علامة تجارية داخلية باسم MAI-VoiceText، وMAI-AudioWave، وMAI-VisionForge، للعمل بشكل مستقل وتآزري، مما يوفر مجموعة شاملة من القدرات التوليدية:

  • MAI-VoiceText: يتميز نموذج تحويل الكلام إلى نص المتقدم هذا بدقة وسرعة استثنائيتين، حتى في البيئات الصوتية الصعبة. تدعي مايكروسوفت أنها حققت دقة تزيد عن 98.5% في نسخ اللهجات واللهجات المتنوعة، وهي ميزة مهمة للتطبيقات العالمية. زمن الاستجابة المنخفض يجعلها مثالية للنسخ في الوقت الفعلي.
  • MAI-AudioWave: نموذج متطور لتوليد الصوت، يمكن لـ MAI-AudioWave إنشاء خطاب بشري واقعي، ومقتطفات موسيقية، ومقاطع صوتية بيئية من المطالبات النصية أو المدخلات الصوتية الموجودة. أبرز المطورون قدرتها على توليد الكلام باستخدام نغمات عاطفية وأنماط صوتية قابلة للتخصيص، وفتح الأبواب أمام مساعدين صوتيين مخصصين للغاية وإنشاء المحتوى.
  • MAI-VisionForge: يسمح دخول Microsoft إلى ساحة تحويل النص إلى صورة، MAI-VisionForge، للمستخدمين بإنشاء صور عالية الدقة من أوصاف اللغة الطبيعية. يدعم النموذج مجموعة واسعة من الأساليب الفنية، بدءًا من الصور الواقعية وحتى الانطباعية، ويتضمن ميزات للرسم الداخلي والخارجي، مما يتيح تحرير الصور وتوسيعها بسلاسة.

د. وأكدت إيفلين ريد، رئيسة مجموعة مايكروسوفت لابتكارات الذكاء الاصطناعي، والتي تم تشكيلها في نوفمبر 2023، على سرعة التطور. صرح ريد قائلاً: "كان تفويضنا واضحًا: تسريع أبحاث الذكاء الاصطناعي الأساسية وتقديم هذه القدرات القوية لمستخدمينا بسرعة غير مسبوقة". "تمثل هذه النماذج الثلاثة شهادة على الموهبة المذهلة والتفاني داخل MAI، كما أنها تضع الأساس لعصر جديد من التفاعل الذكي عبر جميع منصات Microsoft."

تحويل التجارب اليومية

إن الآثار العملية لهذه النماذج الجديدة بالنسبة للمستخدمين العاديين كبيرة، وتبشر بتزويد برامج وأجهزة Microsoft المنتشرة في كل مكان بقدرات ذكاء اصطناعي أكثر ذكاءً وبديهية. تخيل مستقبلًا حيث:

  • الإنتاجية المحسنة: يمكن لـ MAI-VoiceText أن يدعم الإملاء الأكثر دقة في Microsoft Word، والنسخ والترجمة في الوقت الفعلي في اجتماعات Teams، وأوامر صوتية أكثر موثوقية لنظام التشغيل Windows، مما يقلل الاحتكاك بين الفكر والعمل.
  • التمكين الإبداعي: يمكن أن يسمح MAI-VisionForge لأي شخص بإنشاء رسومات مخصصة لعروض PowerPoint التقديمية، أو صور ملفات شخصية فريدة، أو حتى أعمال فنية رقمية مخصصة. لخلفية سطح المكتب، كل ذلك بمطالبات نصية بسيطة. يمكن لمنشئي المحتوى إنشاء نماذج أولية سريعة للمرئيات لوسائل التواصل الاجتماعي أو الحملات التسويقية.
  • الصوت الغامر: يمكن لـ MAI-AudioWave تمكين مسارات صوتية ديناميكية تم إنشاؤها بواسطة الذكاء الاصطناعي لمقاطع الفيديو الشخصية، أو إنشاء تعليقات صوتية مخصصة للعروض التقديمية، أو حتى توفير أصوات أكثر طبيعية وعاطفية لأدوات إمكانية الوصول والمساعدين الرقميين، مما يجعل التكنولوجيا تبدو أكثر إنسانية.

من المتوقع أن يتم دمج هذه النماذج في خدمات Azure AI من Microsoft، مما يسمح المطورين في جميع أنحاء العالم للاستفادة من قوتهم. علاوة على ذلك، فإنهم على استعداد لتعزيز منتجات Microsoft الحالية، بما في ذلك Windows Copilot، وتطبيقات Microsoft 365، وربما حتى Xbox لإنشاء محتوى الألعاب الديناميكي.

ما وراء الضجيج: توصيات للمستهلكين

على الرغم من أن الطرح الكامل سيستغرق وقتًا، يمكن للمستهلكين توقع ترقية كبيرة في تجاربهم التي تدعمها Microsoft. بالنسبة لأولئك الذين يتطلعون إلى الاستفادة من هذه التطورات:

  • لتعزيز الإنتاجية: فكر في الترقية إلى Microsoft Surface Pro 10 أو كمبيوتر محمول متوافق يعمل بأحدث إصدار من Windows 11. يتم تحسين هذه الأجهزة بشكل متزايد لمعالجة الذكاء الاصطناعي على الجهاز، مما سيجعل النسخ في الوقت الفعلي وإنشاء الصور أسرع وأكثر كفاءة. عند الاقتران مع اشتراك Microsoft 365 Copilot، سيطلق المستخدمون الإمكانات الكاملة لهذه النماذج ضمن سير عملهم اليومي.
  • بالنسبة للمستكشفين المبدعين: يجب على المستخدمين الذين لديهم اهتمام قوي بالفن الرقمي وإنشاء المحتوى استكشاف عمليات التكامل القادمة لـ MAI-VisionForge في أدوات مثل Microsoft Designer أو حتى مباشرة داخل PowerPoint. يمكن أن تكشف مراقبة تحديثات جهاز Xbox Series X أيضًا عن تطبيقات مذهلة في بيئات الألعاب الديناميكية والتجارب المخصصة.
  • بالنسبة لإمكانية الوصول والتواصل: ستكون التحسينات من MAI-VoiceText وMAI-AudioWave أكثر وضوحًا في تطبيقات الاتصال. سيؤدي التأكد من أن أجهزتك تحتوي على أجهزة صوتية حديثة واتصال مستقر بالإنترنت إلى زيادة فوائد إمكانات الذكاء الاصطناعي هذه في الوقت الفعلي.

يؤكد أحدث هجوم للذكاء الاصطناعي من Microsoft على التزام الشركة بقيادة ثورة الذكاء الاصطناعي التوليدي. ومع التقدم السريع الذي حققته MAI، تشتد المنافسة، مما يعد بمستقبل مثير حيث تصبح الأدوات التي تعمل بالذكاء الاصطناعي جزءًا لا يتجزأ من حياتنا الرقمية.

Recommended

* We may earn a commission from qualifying purchases at no extra cost to you.

Comments

No comments yet. Be the first!

Related Posts

المحامي الوهمي: هل تتفوق وسيلة التحايل الخارقة على الجرأة القانونية؟

المحامي الوهمي: هل تتفوق وسيلة التحايل الخارقة على الجرأة القانونية؟

الدراما الكورية "Phantom Lawyer"، بطولة "Yoo Yeon Seok"، تأسر الجماهير بفرضيتها الفريدة التي تدور حول المحامي الذي يتحدث إلى الموتى. ومع ذلك، مع وصوله إلى منتصف الطريق، لاحظ بعض المشاهدين التناقضات والاعتماد المفرط على حيلته الخارقة للطبيعة.

KU's Flory Bidunga Shakes Up NBA Draft and Transfer Portal

KU's Flory Bidunga Shakes Up NBA Draft and Transfer Portal

KU's Flory Bidunga, projected as a second-round NBA pick, has declared for the draft and entered the transfer portal, instantly becoming the top player available among 800+ entries.

عام من التعريفات: صناعة السيارات تتنقل في الرمال المتحركة

عام من التعريفات: صناعة السيارات تتنقل في الرمال المتحركة

بعد مرور عام على التعريفات الجمركية التي فرضتها إدارة ترامب على الصلب والألومنيوم، تواجه صناعة السيارات العالمية تكاليف أعلى، واضطرابات في سلسلة التوريد، وتحول في استراتيجيات الاستثمار، مما يؤثر على كل شيء من خطوط الإنتاج إلى أسعار المستهلك.

Unlocking Your Signature Scent: The Rise of Fragrance Layering

Unlocking Your Signature Scent: The Rise of Fragrance Layering

Discover the burgeoning trend of fragrance layering, empowering individuals to create unique, personalized scents by mixing body lotions, oils, and perfumes.

الولايات المتحدة تهدد بفرض رسوم جمركية بنسبة 100% على الأدوية ذات العلامات التجارية وسط أزمة الأسعار

الولايات المتحدة تهدد بفرض رسوم جمركية بنسبة 100% على الأدوية ذات العلامات التجارية وسط أزمة الأسعار

هددت الولايات المتحدة بفرض رسوم جمركية بنسبة 100% على الأدوية الطبية المستوردة ذات العلامات التجارية ما لم توافق شركات الأدوية على صفقات جديدة بحلول 31 يناير 2025، لخفض أسعار الأدوية وتعزيز الإنتاج المحلي. الأدوية الجنيسة معفاة من التعريفات المقترحة.

SB19's 'Wakas At Simula': A 24-Track Odyssey Marking Five Years

SB19's 'Wakas At Simula': A 24-Track Odyssey Marking Five Years

SB19's 24-track album, "Wakas At Simula," marks a pivotal five-year milestone, featuring breakout hits like "GENTO" and new collaborations that redefine P-Pop's global reach.