
इससे यूजर्स के पैसे भी बच सकते हैं. प्रौद्योगिकी विश्लेषक कारमी लेवी ने कहा कि मौजूदा भुगतान-प्रति-टोकन मुद्रीकरण मॉडल “इष्टतम कुशल एआई समाधानों से कम के उपयोग को दंडित करता है।”
लेकिन डिफ्यूजनजेम्मा “कुशल, मिशन-विशिष्ट समाधानों की एक नई पीढ़ी की शुरुआत कर सकता है जो ऑपरेटिंग बजट को खत्म किए बिना कंप्यूटिंग शक्ति का विस्तार करेगा,” उन्होंने कहा।
बाएँ से दाएँ प्रसंस्करण के विपरीत
Google के जेम्मा 4 परिवार और जेमिनी डिफ्यूजन अनुसंधान पर निर्मित, डिफ्यूजनजेम्मा एक 26 अरब सदस्यीय मिश्रित विशेषज्ञ (एमओई) मॉडल है जिसे टेक्स्ट आउटपुट पीढ़ी को अधिकतम करने के लिए डिज़ाइन किया गया है।
यह महत्वपूर्ण रूप से बदलता है कि मॉडल हार्डवेयर का उपयोग कैसे करते हैं, जिससे प्रोसेसर को प्रत्येक चक्र में अधिक काम मिलता है ताकि वे लगातार 256 टोकन के पूर्ण पैराग्राफ बना सकें। Google के अनुसार, यह मॉडल को GPU पर 4 गुना तेजी से टेक्स्ट जेनरेट करने की अनुमति देता है। यह केवल अनुमान के दौरान 3.8 बिलियन मापदंडों को सक्रिय करता है और, जब मात्रा निर्धारित की जाती है, तो एनवीडिया आरटीएक्स 5090 जैसे उच्च-स्तरीय उपभोक्ता जीपीयू पर 18 जीबी वीआरएएम के भीतर फिट हो सकता है।