प्रौद्योगिकी

माइक्रोसॉफ्ट ने रेस को तेज करते हुए फाउंडेशनल एआई मॉडल की तिकड़ी जारी की

माइक्रोसॉफ्ट ने अपने एआई इनोवेशन ग्रुप द्वारा केवल छह महीनों में विकसित तीन नए मूलभूत एआई मॉडल- एमएआई-वॉयसटेक्स्ट, एमएआई-ऑडियोवेव और एमएआई-विज़नफोर्ज का अनावरण किया है, जिससे मल्टीमॉडल एआई में प्रतिस्पर्धा तेज हो गई है।

DailyWiz Editorial··4 मिनट पठन·633 दृश्य
माइक्रोसॉफ्ट ने रेस को तेज करते हुए फाउंडेशनल एआई मॉडल की तिकड़ी जारी की

माइक्रोसॉफ्ट ने रेस तेज करते हुए फाउंडेशनल एआई मॉडल की तिकड़ी पेश की

रेडमंड, वाशिंगटन - तेजी से विकसित हो रहे कृत्रिम बुद्धिमत्ता परिदृश्य में एक आक्रामक धक्का का संकेत देते हुए, माइक्रोसॉफ्ट ने आधिकारिक तौर पर तीन नए फाउंडेशनल एआई मॉडल का अनावरण किया है। यह रणनीतिक लॉन्च, इसके समर्पित एआई इनोवेशन (एमएआई) समूह के गठन के ठीक छह महीने बाद हो रहा है, जो तकनीकी दिग्गज को मल्टीमॉडल एआई के उभरते क्षेत्र में Google, मेटा और यहां तक ​​कि इसके करीबी साझेदार ओपनएआई जैसे प्रतिद्वंद्वियों को सीधे चुनौती देने की स्थिति में रखता है।

इस सप्ताह की शुरुआत में एक वर्चुअल प्रेस इवेंट में पेश किए गए नए मॉडल, वॉयस-टू-टेक्स्ट ट्रांसक्रिप्शन, ऑडियो जेनरेशन और इमेज जेनरेशन में उन्नत क्षमताओं का प्रदर्शन करते हैं। वे माइक्रोसॉफ्ट के इन-हाउस एआई विकास के लिए एक महत्वपूर्ण छलांग का प्रतिनिधित्व करते हैं, जिसका लक्ष्य अत्याधुनिक जेनरेटिव एआई को सीधे अपने उत्पादों और सेवाओं के विशाल पारिस्थितिकी तंत्र में एकीकृत करना है।

माइक्रोसॉफ्ट की फाउंडेशनल तिकड़ी को खोलना

आंतरिक रूप से MAI-VoiceText, MAI-AudioWave, और MAI-VisionForge के रूप में ब्रांडेड तीन मॉडलों को डिज़ाइन किया गया है। स्वतंत्र रूप से और सहक्रियात्मक रूप से काम करें, जेनरेटिव क्षमताओं का एक व्यापक सूट पेश करें:

  • MAI-VoiceText: यह उन्नत भाषण-से-पाठ मॉडल चुनौतीपूर्ण ध्वनिक वातावरण में भी असाधारण सटीकता और गति का दावा करता है। माइक्रोसॉफ्ट का दावा है कि वह विविध उच्चारणों और बोलियों को लिखने में 98.5% से अधिक सटीकता हासिल करता है, जो वैश्विक अनुप्रयोगों के लिए एक महत्वपूर्ण विशेषता है। इसकी कम विलंबता इसे वास्तविक समय प्रतिलेखन के लिए आदर्श बनाती है।
  • MAI-ऑडियोवेव: एक परिष्कृत ऑडियो पीढ़ी मॉडल, MAI-ऑडियोवेव टेक्स्ट प्रॉम्प्ट या मौजूदा ऑडियो इनपुट से यथार्थवादी मानव भाषण, संगीत स्निपेट्स और पर्यावरणीय ध्वनि परिदृश्य बना सकता है। डेवलपर्स ने अनुकूलन योग्य भावनात्मक स्वर और मुखर शैलियों के साथ भाषण उत्पन्न करने की इसकी क्षमता पर प्रकाश डाला, जो अत्यधिक वैयक्तिकृत आवाज सहायकों और सामग्री निर्माण के लिए दरवाजे खोलता है।
  • MAI-VisionForge: टेक्स्ट-टू-इमेज जेनरेशन क्षेत्र में Microsoft का प्रवेश, MAI-VisionForge, उपयोगकर्ताओं को प्राकृतिक भाषा विवरणों से उच्च-रिज़ॉल्यूशन वाली छवियां बनाने की अनुमति देता है। मॉडल फोटोरिअलिस्टिक से लेकर इंप्रेशनिस्टिक तक कलात्मक शैलियों की एक विस्तृत श्रृंखला का समर्थन करता है, और इसमें इन-पेंटिंग और आउट-पेंटिंग की विशेषताएं शामिल हैं, जो निर्बाध छवि संपादन और विस्तार को सक्षम करती हैं।

डॉ. नवंबर 2023 में गठित माइक्रोसॉफ्ट एआई इनोवेशन समूह के प्रमुख एवलिन रीड ने विकास की गति पर जोर दिया। रीड ने कहा, "हमारा आदेश स्पष्ट था: मुख्य एआई अनुसंधान में तेजी लाना और इन शक्तिशाली क्षमताओं को अभूतपूर्व गति के साथ हमारे उपयोगकर्ताओं तक पहुंचाना।" "ये तीन मॉडल एमएआई के भीतर अविश्वसनीय प्रतिभा और समर्पण का प्रमाण हैं, और वे सभी माइक्रोसॉफ्ट प्लेटफार्मों पर बुद्धिमान बातचीत के एक नए युग की नींव रखते हैं।"

हर दिन के अनुभवों को बदलना

रोजमर्रा के उपयोगकर्ताओं के लिए इन नए मॉडलों के व्यावहारिक निहितार्थ पर्याप्त हैं, जो माइक्रोसॉफ्ट के सर्वव्यापी सॉफ्टवेयर और हार्डवेयर को अधिक स्मार्ट, अधिक सहज एआई क्षमताओं से युक्त करने का वादा करते हैं। एक ऐसे भविष्य की कल्पना करें जहां:

  • उन्नत उत्पादकता: MAI-VoiceText माइक्रोसॉफ्ट वर्ड में अधिक सटीक श्रुतलेख, टीम मीटिंग में वास्तविक समय प्रतिलेखन और अनुवाद, और विंडोज़ के लिए अधिक विश्वसनीय वॉयस कमांड प्रदान कर सकता है, जिससे विचार और कार्रवाई के बीच घर्षण कम हो सकता है।
  • रचनात्मक सशक्तिकरण: MAI-VisionForge किसी को भी PowerPoint प्रस्तुतियों, अद्वितीय प्रोफ़ाइल चित्रों या यहां तक कि के लिए कस्टम ग्राफिक्स उत्पन्न करने की अनुमति दे सकता है। उनके डेस्कटॉप पृष्ठभूमि के लिए वैयक्तिकृत डिजिटल कला, सभी सरल पाठ संकेतों के साथ। सामग्री निर्माता तेजी से सोशल मीडिया या मार्केटिंग अभियानों के लिए दृश्यों का प्रोटोटाइप बना सकते हैं।
  • इमर्सिव ऑडियो: MAI-ऑडियोवेव व्यक्तिगत वीडियो के लिए गतिशील, AI-जनित साउंडट्रैक सक्षम कर सकता है, प्रस्तुतियों के लिए कस्टम वॉयसओवर बना सकता है, या यहां तक कि एक्सेसिबिलिटी टूल और डिजिटल सहायकों के लिए अधिक प्राकृतिक, भावनात्मक रूप से गूंजने वाली आवाजें प्रदान कर सकता है, जिससे तकनीक अधिक मानवीय लगती है।

इन मॉडलों को Microsoft की Azure AI सेवाओं में एकीकृत किए जाने की उम्मीद है। दुनिया भर के डेवलपर्स को अपनी शक्ति का लाभ उठाने की अनुमति देना। इसके अलावा, वे मौजूदा Microsoft उत्पादों को बढ़ाने के लिए तैयार हैं, जिनमें Windows Copilot, Microsoft 365 एप्लिकेशन और संभावित रूप से गतिशील गेम सामग्री निर्माण के लिए Xbox भी शामिल है।

प्रचार से परे: उपभोक्ताओं के लिए अनुशंसाएँ

हालांकि पूर्ण रोलआउट में समय लगेगा, उपभोक्ता अपने Microsoft-संचालित अनुभवों में एक महत्वपूर्ण अपग्रेड की उम्मीद कर सकते हैं। उन लोगों के लिए जो इन प्रगतियों का लाभ उठाना चाहते हैं:

  • बढ़ी हुई उत्पादकता के लिए: Microsoft Surface Pro 10 या Windows 11 के नवीनतम संस्करण पर चलने वाले संगत लैपटॉप में अपग्रेड करने पर विचार करें। इन उपकरणों को ऑन-डिवाइस AI प्रोसेसिंग के लिए तेजी से अनुकूलित किया जा रहा है, जो वास्तविक समय ट्रांसक्रिप्शन और छवि निर्माण को और भी तेज और अधिक कुशल बना देगा। Microsoft 365 Copilot सदस्यता के साथ, उपयोगकर्ता अपने दैनिक वर्कफ़्लो के भीतर इन मॉडलों की पूरी क्षमता को अनलॉक करेंगे।
  • क्रिएटिव खोजकर्ताओं के लिए: डिजिटल कला और सामग्री निर्माण में गहरी रुचि रखने वाले उपयोगकर्ताओं को MAI-VisionForge के आगामी एकीकरणों को Microsoft डिज़ाइनर जैसे टूल में या सीधे PowerPoint के भीतर भी तलाशना चाहिए। आपके Xbox Series यह सुनिश्चित करना कि आपके डिवाइस में नवीनतम ऑडियो हार्डवेयर और स्थिर इंटरनेट कनेक्टिविटी है, इन वास्तविक समय AI क्षमताओं का लाभ अधिकतम होगा।

माइक्रोसॉफ्ट का नवीनतम एआई आक्रामक जनरेटिव एआई क्रांति का नेतृत्व करने के लिए कंपनी की प्रतिबद्धता को रेखांकित करता है। एमएआई की तीव्र प्रगति के साथ, प्रतिस्पर्धा बढ़ रही है, जो एक रोमांचक भविष्य का वादा करती है जहां एआई-संचालित उपकरण हमारे डिजिटल जीवन का और भी अधिक अभिन्न अंग बन जाते हैं।

Recommended

* We may earn a commission from qualifying purchases at no extra cost to you.

साझा करें

Comments

No comments yet. Be the first!

संबंधित लेख

फैंटम वकील: क्या अलौकिक नौटंकी कानूनी धैर्य को मात दे रही है?

फैंटम वकील: क्या अलौकिक नौटंकी कानूनी धैर्य को मात दे रही है?

यू येओन सेओक अभिनीत के-ड्रामा "फैंटम वकील", एक वकील के अनूठे आधार के साथ दर्शकों को मंत्रमुग्ध कर रहा है जो मृतकों से बात करता है। हालाँकि, जैसे-जैसे यह अपने आधे रास्ते पर पहुँचता है, कुछ दर्शक इसकी अलौकिक नौटंकी पर विसंगतियों और अति-निर्भरता को नोटिस कर रहे हैं।

केयू के फ्लोरी बिडुंगा ने एनबीए ड्राफ्ट और ट्रांसफर पोर्टल को हिला दिया

केयू के फ्लोरी बिडुंगा ने एनबीए ड्राफ्ट और ट्रांसफर पोर्टल को हिला दिया

केयू के फ्लोरी बिदुंगा, जिसे दूसरे दौर के एनबीए पिक के रूप में पेश किया गया था, ने ड्राफ्ट के लिए घोषणा की है और ट्रांसफर पोर्टल में प्रवेश किया है, जो तुरंत 800+ प्रविष्टियों के बीच उपलब्ध शीर्ष खिलाड़ी बन गया है।

टैरिफ का एक वर्ष: ऑटो उद्योग शिफ्टिंग सैंड्स को नेविगेट करता है

टैरिफ का एक वर्ष: ऑटो उद्योग शिफ्टिंग सैंड्स को नेविगेट करता है

ट्रम्प प्रशासन के स्टील और एल्युमीनियम टैरिफ के एक साल बाद, वैश्विक ऑटो उद्योग को उच्च लागत, आपूर्ति श्रृंखला व्यवधान और निवेश रणनीतियों में बदलाव का सामना करना पड़ रहा है, जिससे उत्पादन लाइनों से लेकर उपभोक्ता कीमतों तक सब कुछ प्रभावित हो रहा है।

अपनी सिग्नेचर खुशबू को अनलॉक करना: खुशबू की परत का उदय

अपनी सिग्नेचर खुशबू को अनलॉक करना: खुशबू की परत का उदय

खुशबू फैलाने के बढ़ते चलन की खोज करें, जो व्यक्तियों को बॉडी लोशन, तेल और परफ्यूम को मिलाकर अद्वितीय, वैयक्तिकृत सुगंध बनाने के लिए सशक्त बनाता है।

मूल्य गतिरोध के बीच अमेरिका ने ब्रांडेड दवाओं पर 100% टैरिफ लगाने की धमकी दी है

मूल्य गतिरोध के बीच अमेरिका ने ब्रांडेड दवाओं पर 100% टैरिफ लगाने की धमकी दी है

अमेरिका ने दवा की कीमतें कम करने और घरेलू उत्पादन को बढ़ावा देने के लिए आयातित ब्रांडेड प्रिस्क्रिप्शन दवाओं पर 100% टैरिफ लगाने की धमकी दी है, जब तक कि फार्मास्युटिकल कंपनियां 31 जनवरी, 2025 तक नए सौदों पर सहमत नहीं हो जातीं। जेनेरिक दवाओं को प्रस्तावित टैरिफ से छूट दी गई है।

SB19 का 'वाकास एट सिमुला': पांच वर्षों का 24-ट्रैक ओडिसी

SB19 का 'वाकास एट सिमुला': पांच वर्षों का 24-ट्रैक ओडिसी

SB19 का 24-ट्रैक एल्बम, "वाकास एट सिमुला", पांच साल का एक महत्वपूर्ण मील का पत्थर है, जिसमें "जेंटो" जैसे ब्रेकआउट हिट और नए सहयोग शामिल हैं जो पी-पॉप की वैश्विक पहुंच को फिर से परिभाषित करते हैं।