पिछले दो वर्षों में, एआई के बारे में लगभग सभी चर्चाएँ कंप्यूटिंग शक्ति पर केंद्रित रही हैं: पर्याप्त जीपीयू नहीं, अपर्याप्त कंप्यूटिंग क्षमता और कम आकार के क्लस्टर।ऐसा लगता है जैसे अधिक कंप्यूटिंग शक्ति जमा करने से हर समस्या का समाधान हो जाएगा।
लेकिन यह रिपोर्ट एक महत्वपूर्ण बिंदु पर बार-बार जोर देती है: जो चीज़ वास्तव में AI को धीमा करती है वह कभी भी गणना करने में असमर्थता नहीं है, बल्कि डेटा को कुशलतापूर्वक स्थानांतरित करने में असमर्थता है।
एक आँकड़ा समस्या को बिल्कुल स्पष्ट कर देता है: DRAM से डेटा पढ़ने पर SRAM की तुलना में सैकड़ों गुना अधिक ऊर्जा की खपत होती है।इस बीच, प्रोसेसर और मेमोरी के बीच प्रदर्शन अंतर हर साल लगभग 50% बढ़ रहा है।
हम जिस कंप्यूटिंग शक्ति का निर्माण कर रहे हैं उसका अधिकांश भाग केवल डेटा की प्रतीक्षा कर रहा है। उस क्षण, मुझे कुछ आश्चर्यजनक बात का एहसास हुआ: हो सकता है कि हम हमेशा से एआई के लिए ग़लत अड़चन को देखते रहे हों।
यदि समस्या स्वयं गणना नहीं है, बल्कि कंप्यूटिंग और मेमोरी का पृथक्करण है, तो वास्तविक उत्तर मजबूत जीपीयू नहीं हो सकता है। यह देना है मेमोरी स्वयं कंप्यूटिंग में भाग लेती है. यही असली कहानी है जो इस रिपोर्ट को बताना है।
एआई कंप्यूटिंग शक्ति की वास्तविक बाधा गणना से मेमोरी में स्थानांतरित हो रही है, और इसका समाधान गणना को मेमोरी में स्थानांतरित करना है।
एआई गणना बड़े पैमाने पर मैक (गुणा-संचित) संचालन पर निर्भर करती है और अत्यधिक डेटा-गहन है। हालाँकि, क्लासिक वॉन न्यूमैन वास्तुकला में एक घातक दोष है:
निष्कर्ष: एआई गणना करने में विफल नहीं होता है - यह डेटा को किफायती और तेज़ी से स्थानांतरित करने में विफल रहता है।
कंप्यूटिंग और मेमोरी का पृथक्करण निरंतर डेटा शट्लिंग को मजबूर करता है, जिससे दो महत्वपूर्ण समस्याएं पैदा होती हैं:
रिपोर्ट बिल्कुल यही कहती है वॉन न्यूमैन बॉटलनेक.
एक स्पष्ट उद्योग प्रवृत्ति उभर रही है: चिप्स दो तरह से विकसित हो रहे हैं:
इस बीच, एक क्रांतिकारी दिशा सामने आई है: इन-मेमोरी कंप्यूटिंग (आईएमसी).
इसका मूल विचार: सीधे मेमोरी के अंदर तर्क संचालन, अंकगणितीय गणना और मैट्रिक्स गुणन (एआई का मूल) निष्पादित करें।
मौलिक बदलाव: मेमोरी = स्टोरेज → मेमोरी = कंप्यूट इंजन
रिपोर्ट कई कार्यान्वयन मार्गों की रूपरेखा प्रस्तुत करती है:
1. SRAM / eDRAM (पारंपरिक पथ)
कंप्यूट-इन-कैश, न्यूरल कैश
पेशेवर: परिपक्व, उच्च गति
सीमाएँ: बड़ा क्षेत्र, सीमित मापनीयता
2. उभरती हुई स्मृति (मुख्यधारा की दिशा)
इसमें शामिल है:
एमआरएएम, पीसीएम, रेराम, फेरम
सामान्य लक्ष्य: मेमोरी एरेज़ को मैट्रिक्स मल्टीप्ली-एक्युमुलेट इंजन में बदलना इन-प्लेस कंप्यूटिंग और एनालॉग कंप्यूटिंग के साथ (उदाहरण के लिए, वेक्टर गुणन के लिए वर्तमान योग)।
सार: मेमोरी ऐरे = एआई एक्सेलेरेटर
लेकिन वास्तविक चुनौतियाँ अभी भी बनी हुई हैं: परिशुद्धता और शोर, डिवाइस भिन्नता, वजन बहाव (विशेषकर ReRAM में), और अवधारण मुद्दे। यह रास्ता व्यवहार्य है लेकिन इंजीनियरिंग में बेहद चुनौतीपूर्ण है।
रिपोर्ट इस बात पर जोर देती है कि केवल हार्डवेयर ही पर्याप्त नहीं है - एल्गोरिदम भी विकसित होना चाहिए।
मुख्य निष्कर्ष: एआई दक्षता अनुकूलन के लिए वास्तुकला, उपकरणों और एल्गोरिदम के संयुक्त डिजाइन की आवश्यकता होती है।
एआई की बाधा "पर्याप्त कंप्यूटिंग शक्ति नहीं" से "डेटा को पर्याप्त तेज़ी से स्थानांतरित करने में असमर्थ" में बदल रही है। अगली पीढ़ी के चिप्स का उत्तर मजबूत जीपीयू नहीं है, बल्कि मेमोरी जो स्वयं गणना कर सकती है.