Gemma 3n: गूगल ने लॉन्च किया नया एआई मॉडल, बिना इंटरनेट भी करेगा काम

गूगल ने अपने नए ऑन-डिवाइस AI मॉडल Gemma 3n को लॉन्च कर दिया है, जिसकी घोषणा पहली बार मई 2025 में की गई थी। यह मॉडल बेहद कम मेमोरी वाले स्मार्टफोन और एज डिवाइसेस पर बिना इंटरनेट कनेक्शन के ऑडियो, इमेज, वीडियो और टेक्स्ट प्रोसेसिंग करने की क्षमता रखता है। यानी अब ऐसे AI फीचर्स जो पहले पावरफुल क्लाउड इंफ्रास्ट्रक्चर पर चलते थे, सीधे फोन और कम पावर वाले डिवाइस पर चलाए जा सकते हैं।
Gemma 3n की खास टेक्नोलॉजी है MatFormer
Gemma 3n का दिल है इसकी नई आर्किटेक्चर MatFormer, जिसका पूरा नाम है Matryoshka Transformer। यह रूसी नेस्टिंग डॉल्स की तरह काम करता है, जिसमें बड़े मॉडल के अंदर छोटे-छोटे फुली-फंक्शनल सब-मॉडल्स होते हैं। इसका फायदा यह है कि डेवलपर्स अपनी डिवाइस की क्षमता के हिसाब से मॉडल को स्केल कर सकते हैं। Gemma 3n को दो वेरिएंट में पेश किया गया है। एक E2B है जिसके लिए सिर्फ 2GB रैम की जरूरत होती है और दूसरा E4B जिसे लगभग 3GB रैम की जरूरत होती है।
छोटी RAM में भी कमाल की परफॉर्मेंस
Gemma 3n के पास 5 से 8 बिलियन रॉ पैरामीटर्स हैं, लेकिन इसकी डिजाइन इतनी एफिशिएंट है कि यह छोटे मॉडल्स की तरह संसाधन उपयोग करता है। इसका सीक्रेट है Per-Layer Embeddings (PLE) टेक्नोलॉजी, जो फोन के ग्राफिक्स प्रोसेसर (GPU) से काम हटाकर CPU पर ट्रांसफर कर देती है। इससे मेमोरी काफी बचती है। KV Cache Sharing फीचर की वजह से लंबे ऑडियो और वीडियो इनपुट को प्रोसेस करने की स्पीड 2 गुना तक बढ़ जाती है।
ऑडियो और वॉयस फीचर्स
इसमें गूगल का Universal Speech Model से लिया गया बिल्ट-इन ऑडियो एनकोडर है। फोन पर ही स्पीच-टू-टेक्स्ट और लैंग्वेज ट्रांसलेशन कर सकता है। खास तौर पर अंग्रेजी से स्पेनिश, फ्रेंच, इटालियन और पुर्तगाली जैसी यूरोपीय भाषाओं में ट्रांसलेशन में बेहतरीन रिजल्ट देता है। विजन साइड को पावर करता है गूगल का नया MobileNet-V5 लाइटवेट विजन एनकोडर।
यह 60 FPS तक के वीडियो स्ट्रीम्स को प्रोसेस कर सकता है, जिससे Google Pixel जैसे डिवाइसेस पर रीयल-टाइम वीडियो एनालिसिस बेहद स्मूद होता है। यह पिछले विजन मॉडल्स से तेज और सटीक दोनों है। सबसे खास बात यह है कि Gemma 3n पूरी तरह से ऑफलाइन काम कर सकता है, यानी इसे इंटरनेट की जरूरत नहीं है। यह उन जगहों के लिए बेहद फायदेमंद है जहां इंटरनेट नहीं है या गोपनीयता की ज्यादा जरूरत है