घरसमाचारएआई की वास्तविक बाधा कंप्यूटिंग शक्ति नहीं, बल्कि डेटा मूवमेंट है - इन-मेमोरी कंप्यूटिंग समाधान बन जाती है

एआई की वास्तविक बाधा कंप्यूटिंग शक्ति नहीं, बल्कि डेटा मूवमेंट है - इन-मेमोरी कंप्यूटिंग समाधान बन जाती है

एआई की वास्तविक बाधा कंप्यूटिंग शक्ति नहीं, बल्कि डेटा मूवमेंट है - इन-मेमोरी कंप्यूटिंग समाधान बन जाती है


पिछले दो वर्षों में, एआई के बारे में लगभग सभी चर्चाएँ कंप्यूटिंग शक्ति पर केंद्रित रही हैं: पर्याप्त जीपीयू नहीं, अपर्याप्त कंप्यूटिंग क्षमता और कम आकार के क्लस्टर।ऐसा लगता है जैसे अधिक कंप्यूटिंग शक्ति जमा करने से हर समस्या का समाधान हो जाएगा।

लेकिन यह रिपोर्ट एक महत्वपूर्ण बिंदु पर बार-बार जोर देती है: जो चीज़ वास्तव में AI को धीमा करती है वह कभी भी गणना करने में असमर्थता नहीं है, बल्कि डेटा को कुशलतापूर्वक स्थानांतरित करने में असमर्थता है।

एक आँकड़ा समस्या को बिल्कुल स्पष्ट कर देता है: DRAM से डेटा पढ़ने पर SRAM की तुलना में सैकड़ों गुना अधिक ऊर्जा की खपत होती है।इस बीच, प्रोसेसर और मेमोरी के बीच प्रदर्शन अंतर हर साल लगभग 50% बढ़ रहा है।

हम जिस कंप्यूटिंग शक्ति का निर्माण कर रहे हैं उसका अधिकांश भाग केवल डेटा की प्रतीक्षा कर रहा है। उस क्षण, मुझे कुछ आश्चर्यजनक बात का एहसास हुआ: हो सकता है कि हम हमेशा से एआई के लिए ग़लत अड़चन को देखते रहे हों।

यदि समस्या स्वयं गणना नहीं है, बल्कि कंप्यूटिंग और मेमोरी का पृथक्करण है, तो वास्तविक उत्तर मजबूत जीपीयू नहीं हो सकता है। यह देना है मेमोरी स्वयं कंप्यूटिंग में भाग लेती है. यही असली कहानी है जो इस रिपोर्ट को बताना है।

रिपोर्ट का मूल संदेश

एआई कंप्यूटिंग शक्ति की वास्तविक बाधा गणना से मेमोरी में स्थानांतरित हो रही है, और इसका समाधान गणना को मेमोरी में स्थानांतरित करना है।

वास्तविक समस्या: एआई दक्षता डेटा मूवमेंट द्वारा सीमित है

एआई गणना बड़े पैमाने पर मैक (गुणा-संचित) संचालन पर निर्भर करती है और अत्यधिक डेटा-गहन है। हालाँकि, क्लासिक वॉन न्यूमैन वास्तुकला में एक घातक दोष है:

  • प्रोसेसर और DRAM के बीच प्रदर्शन अंतर बढ़ता जा रहा है (लगभग 50% प्रति वर्ष)
  • मेमोरी एक्सेस ऊर्जा लागत स्वयं गणना से कहीं अधिक है (DRAM रीड एनर्जी ≈ 100× SRAM की तुलना में)

निष्कर्ष: एआई गणना करने में विफल नहीं होता है - यह डेटा को किफायती और तेज़ी से स्थानांतरित करने में विफल रहता है।

मुख्य विरोधाभास: वॉन न्यूमैन बॉटलनेक

कंप्यूटिंग और मेमोरी का पृथक्करण निरंतर डेटा शट्लिंग को मजबूर करता है, जिससे दो महत्वपूर्ण समस्याएं पैदा होती हैं:

  • उच्च विलंबता
  • विस्फोटक ऊर्जा खपत

रिपोर्ट बिल्कुल यही कहती है वॉन न्यूमैन बॉटलनेक.

मुख्य प्रवृत्ति: मेमोरी नया कंप्यूटिंग केंद्र बन गया है

एक स्पष्ट उद्योग प्रवृत्ति उभर रही है: चिप्स दो तरह से विकसित हो रहे हैं:

  • ऑन-चिप मेमोरी (SRAM) का विस्तार होता रहता है
  • मेमोरी बैंडविड्थ बढ़ती रहती है

इस बीच, एक क्रांतिकारी दिशा सामने आई है: इन-मेमोरी कंप्यूटिंग (आईएमसी).

इसका मूल विचार: सीधे मेमोरी के अंदर तर्क संचालन, अंकगणितीय गणना और मैट्रिक्स गुणन (एआई का मूल) निष्पादित करें।

मौलिक बदलाव: मेमोरी = स्टोरेज → मेमोरी = कंप्यूट इंजन

तकनीकी पथ: SRAM से उभरती यादों तक

रिपोर्ट कई कार्यान्वयन मार्गों की रूपरेखा प्रस्तुत करती है:

1. SRAM / eDRAM (पारंपरिक पथ)
कंप्यूट-इन-कैश, न्यूरल कैश
पेशेवर: परिपक्व, उच्च गति
सीमाएँ: बड़ा क्षेत्र, सीमित मापनीयता

2. उभरती हुई स्मृति (मुख्यधारा की दिशा)
इसमें शामिल है: एमआरएएम, पीसीएम, रेराम, फेरम

सामान्य लक्ष्य: मेमोरी एरेज़ को मैट्रिक्स मल्टीप्ली-एक्युमुलेट इंजन में बदलना इन-प्लेस कंप्यूटिंग और एनालॉग कंप्यूटिंग के साथ (उदाहरण के लिए, वेक्टर गुणन के लिए वर्तमान योग)।

सार: मेमोरी ऐरे = एआई एक्सेलेरेटर

लेकिन वास्तविक चुनौतियाँ अभी भी बनी हुई हैं: परिशुद्धता और शोर, डिवाइस भिन्नता, वजन बहाव (विशेषकर ReRAM में), और अवधारण मुद्दे। यह रास्ता व्यवहार्य है लेकिन इंजीनियरिंग में बेहद चुनौतीपूर्ण है।

सिस्टम समाधान: हार्डवेयर-एल्गोरिदम सह-अनुकूलन

रिपोर्ट इस बात पर जोर देती है कि केवल हार्डवेयर ही पर्याप्त नहीं है - एल्गोरिदम भी विकसित होना चाहिए।

  • मॉडल संपीड़न: छंटाई, विरलता, निम्न-श्रेणी का अपघटन
  • कम परिशुद्धता कंप्यूटिंग: फिक्स्ड-पॉइंट, बाइनरी न्यूरल नेटवर्क
  • हार्डवेयर-जागरूक प्रशिक्षण: एसटीई, बिट-स्लाइस विरलता

मुख्य निष्कर्ष: एआई दक्षता अनुकूलन के लिए वास्तुकला, उपकरणों और एल्गोरिदम के संयुक्त डिजाइन की आवश्यकता होती है।

अंतिम निष्कर्ष

  1. ऑन-चिप मेमोरी एआई सिस्टम का मुख्य संसाधन बन गई है
  2. उभरती यादें स्मृति-गणना एकीकरण को मुख्यधारा की दिशा बना रही हैं
  3. अगली पीढ़ी के एआई चिप्स को डिवाइस से लेकर एल्गोरिदम तक क्रॉस-लेयर सह-डिज़ाइन की आवश्यकता होती है

सारांश

एआई की बाधा "पर्याप्त कंप्यूटिंग शक्ति नहीं" से "डेटा को पर्याप्त तेज़ी से स्थानांतरित करने में असमर्थ" में बदल रही है। अगली पीढ़ी के चिप्स का उत्तर मजबूत जीपीयू नहीं है, बल्कि मेमोरी जो स्वयं गणना कर सकती है.