विषय
अपने नए माली-जी 77 ग्राफिक्स प्रोसेसर और माली-डी 77 डिस्प्ले प्रोसेसर के साथ, आर्म ने अपने नवीनतम उच्च प्रदर्शन वाले सीपीयू डिजाइन- कॉर्टेक्स-ए 77 का अनावरण किया है। पिछले साल के Cortex-A76 के साथ, Cortex-A77 आर्म के हस्ताक्षर कम बिजली की खपत के लिए प्रीमियम स्तरीय अनुप्रयोगों के लिए डिज़ाइन किया गया है। स्मार्टफ़ोन से लेकर लैपटॉप तक सब कुछ और काफी हद तक परे।
कोर्टेक्स-ए 77 के साथ, आर्म ने अधिकतम निर्देश प्रति चक्र / घड़ी (आईपीसी) के प्रदर्शन को लक्षित किया है जो कि कॉर्टेक्स-ए 76 पर प्रबंधन कर सकता है। घड़ी की आवृत्तियों, बिजली की खपत, और क्षेत्र, सभी को एक ही बॉलपार्क में मोटे तौर पर रहने के लिए डिज़ाइन किया गया है, लेकिन नया कोर एक ही बार में अधिक निर्देश के माध्यम से क्रंच कर सकता है। ऐसा करने के लिए, आर्म ने पिछले वर्ष की तुलना में एक भी व्यापक कोर डिजाइन किया है और सीपीयू कोर को रखने के लिए कई सुधार किए हैं। लेकिन इससे पहले कि हम उच्च स्तरीय अवलोकन और प्रदर्शन संख्याओं में गोता लगाएँ।
हिटिंग प्रदर्शन लक्ष्य
अगस्त 2018 में वापस, आर्म अनचाहे तौर पर 2020 के माध्यम से सीपीयू रोडमैप साझा किया गया। 2016 के कॉर्टेक्स-ए 73 से 2020 के "हरक्यूलिस" डिजाइन के माध्यम से, कंपनी कम्प्यूट प्रदर्शन में 2.5 गुना वृद्धि का वादा कर रही है। इस विशाल प्रक्षेपण का एक अच्छा हिस्सा Cortex-A76, उच्च आधुनिक घड़ी की गति, और 16 से 10 और अब 5nm के साथ 7nm विनिर्माण के साथ स्थानांतरित करने के लिए प्रमुख माइक्रोआर्किटेक्चर पारी के साथ पूरा किया गया था। पिछले वर्ष तक रोडमैप के लगभग 1.8x लाभ पहले ही हासिल कर लिए गए थे, और Cortex-A77 IPC को लगभग 20 प्रतिशत आगे प्रदान करता है। यह हमें आर्म के 2.5x लक्ष्य के रास्ते में अच्छी तरह से रखता है, हालांकि सीमित शक्ति और थर्मल बजट वाले मोबाइल डिवाइस इन सभी लाभों को देखने की उम्मीद नहीं करते हैं।
तुलना के लिए, पिछले साल के कॉर्टेक्स-ए 76 ने कॉर्टेक्स-ए 75 पर लगभग 30-35 प्रतिशत का बढ़ावा दिया। इस साल हम एक अधिक मौन, अभी भी महत्वपूर्ण, A77 और A76 के बीच 20 प्रतिशत IPC लाभ देख रहे हैं। यह अच्छी खबर है क्योंकि इसका मतलब पहले की तरह ही थर्मल और बिजली की कमी से जूझते हुए अधिक प्रदर्शन है। व्यापार बंद यह है कि A77, A76 की तुलना में लगभग 17 प्रतिशत बड़ा है, इसलिए सिलिकॉन क्षेत्र के संदर्भ में थोड़ा अधिक खर्च होगा। यदि आप डेस्कटॉप नेताओं के साथ तुलना करना चाहते हैं, तो एएमडी ज़ेन 2 और ज़ेन + के बीच 15 प्रतिशत आईपीसी को बढ़ावा देता है, जबकि इंटेल का आईपीसी वस्तुतः वर्षों तक स्थिर रहा है।बेशक हम यहां अलग-अलग मार्केट सेगमेंट में बात कर रहे हैं, लेकिन यह दर्शाता है कि आर्म की सीपीयू डिजाइन टीम ने हाल की पीढ़ियों में कैसे प्रभावशाली लाभ कमाया है।
एक 20% प्रदर्शन को बढ़ावा देने के लिए अगली पीढ़ी के Cortex-A77 आधारित SoCs के प्रस्ताव पर है
यहाँ यह स्पष्ट है कि A76 ने बड़े प्रदर्शन लाभ के साथ एक प्रमुख माइक्रोआर्किटेक्चरल शिफ्ट को चिह्नित किया, जबकि हम A77 के साथ अनुकूलन स्तर में सुधार कर रहे हैं। उस रास्ते से, आर्म कोरटेक्स-ए 77 में क्या नया है, इस पर गोता लगाएँ।
Cortex-A77 A76 माइक्रोआर्किटेक्चर पर बनाता है
कोर्टेक्स-ए 77 और ए 76 के बीच अंतर को समझने की कुंजी यह है कि "व्यापक" कोर डिजाइन का क्या मतलब है। अनिवार्य रूप से, हम प्रत्येक घड़ी चक्र के लिए अधिक निर्देशों को निष्पादित करने की क्षमता की बात कर रहे हैं, जो कोर के थ्रूपुट को बढ़ाता है। इस अधिकार को प्राप्त करने के लिए दो महत्वपूर्ण भाग हैं - प्रसंस्करण करने के लिए निष्पादन इकाइयों की संख्या बढ़ाना और यह सुनिश्चित करना कि इन इकाइयों को डेटा के साथ अच्छी तरह से रखा जाए। आइए बाद के भाग से शुरू करें और SoC के प्रेषण, कैश और शाखा के भविष्यवक्ता भागों पर ध्यान केंद्रित करें।
कॉर्टेक्स-ए 77 की चौड़ाई को प्रेषित करने के लिए 50 प्रतिशत की वृद्धि देखी गई है, जो ए 76 के साथ चार से छह निर्देश प्रति चक्र तक है। इसका मतलब है कि अधिक प्रदर्शन क्षमता के लिए प्रत्येक घड़ी चक्र के लिए निष्पादन कोर के लिए अधिक निर्देश। आउट-ऑफ-ऑर्डर निष्पादन विंडो भी एक परिणाम के रूप में बड़ी है, अधिक समानता को उजागर करने के लिए 160 प्रविष्टियों तक बढ़ रही है। एक परिचित 64K निर्देश-कैश है, जबकि शाखा लक्ष्य बफ़र (BTB), जो शाखा भविष्यवक्ता के लिए पते रखता है, समानांतर निर्देशों में वृद्धि को संभालने के लिए पहले की तुलना में 33 प्रतिशत बड़ा है। यहां कुछ भी असामान्य नहीं है, यह अनिवार्य रूप से पिछले साल के डिजाइन का एक व्यापक संस्करण है।
अधिक पेचीदा फ्रंट-एंड जोड़ सभी नए 1.5K एमओपी कैश है, जो मैक्रो-ऑप्स (एमओपी) को संग्रहीत करता है जो कि डिकोड यूनिट से वापस खिलाया जाता है। आर्म के सीपीयू आर्किटेक्चर उपयोगकर्ता के एप्लिकेशन से छोटे मैक्रो-ऑपरेशंस के निर्देशों को डिकोड करता है और फिर माइक्रो-ऑप्स में और नीचे जाता है जिसे एक्ज़ीक्यूशन कोर समझता है। आप इसे डिकोड अनुभाग में ऊपर आरेख पर देख सकते हैं। एमओपी कैश का उपयोग मिस्ड शाखाओं और फ्लश की लागत दंड को कम करने के लिए किया जाता है, क्योंकि आप उन्हें फिर से डिकोड करने के बजाय मैक्रो-ऑप्स रखते हैं, और कोर के समग्र प्रवाह को बढ़ाते हैं। आई-कैश के बजाय एमओपी से प्राप्त डिकोड चरण को बायपास करते हैं, जिससे एक चक्र की बचत होती है। आर्म बताता है कि एमओपी कैश 85 प्रतिशत या अधिक हिट दर को वर्कलोड की एक सीमा तक हिट कर सकता है, जिससे यह मानक आई-कैश के लिए बहुत उपयोगी है।
सीपीयू के निष्पादन कोर भाग के लिए नीचे बढ़ते हुए, एक चौथे ALU और दूसरी शाखा इकाई के अलावा पर ध्यान दें। यह चौथा ALU प्रोसेसर की सामान्य संख्या के क्रंचिंग बैंडविड्थ को 50 प्रतिशत बढ़ा देता है। यह अतिरिक्त ALU बुनियादी एक-चक्र निर्देशों (जैसे कि ADD और SUB) के साथ-साथ दो-चक्र पूर्णांक संचालन जैसे बहुक्रिया में सक्षम है। अन्य ALU में से दो केवल बुनियादी एक-चक्र निर्देशों को संभाल सकते हैं, जबकि अंतिम इकाई को अधिक उन्नत गणित संचालन जैसे कि डिवीजन, गुणा-संचित, आदि के साथ चार्ज किया जाता है। निष्पादन कोर के अंदर दूसरी शाखा इकाई एक साथ शाखा की संख्या को दोगुना कर देती है। कोर संभाल सकता है, जो ऐसे उदाहरणों में उपयोगी है जहां छह में से दो प्रेषण निर्देश शाखा कूदता है। यह सुनने में थोड़ा अजीब लगता है, लेकिन आर्म में आंतरिक परीक्षण से इस दूसरी इकाई को अपनाने से प्रदर्शन के लाभ का पता चला।
कॉर्टेक्स-ए 77 बेहतर समानता और पूर्व-प्राप्त कैश पर एक नया ऑफर प्रदान करता है
सीपीयू कोर में अन्य जुड़ावों में एक दूसरे एईएस एन्क्रिप्शन पाइपलाइन के अलावा शामिल हैं। डेटा-स्टोर पाइपलाइन अब मेमोरी इश्यू बैंडविड्थ को दोगुना करने के लिए समर्पित इश्यू पोर्ट की सुविधा देती है। इन बंदरगाहों को पहले ALU के साथ साझा किया गया था, जो कभी-कभी अड़चन बन सकते थे। सिस्टम DRAM के लिए बैंडविड्थ में वृद्धि करते हुए बिजली दक्षता में सुधार करने के लिए अगली पीढ़ी के डेटा परफेक्ट भी है।
कोर्टेक्स-ए 77 में इस प्रणाली का एक हिस्सा एक नया-नया "सिस्टम-अवेयर" प्रीफैच सिस्टम भी पेश करता है। यह सीपीयू कोर काउंट्स, कैश कैपेसिटी और लेटेंसी की विस्तृत श्रृंखला और अंतिम उप-उपकरणों के मेमोरी सब-सिस्टम कॉन्फ़िगरेशन के आधार पर मेमोरी परफॉर्मेंस को बेहतर बनाता है। डायनामिक शेड्यूल यूनिट (DSU) से डायनामिक QQ CPU क्लस्टर के हिस्से के रूप में बात करने के लिए समर्पित हार्डवेयर, जो साझा L3 कैश के उपयोग की निगरानी करता है। कोर उन स्थितियों में कैश उपयोग को कम करने के लिए डायनेमिक दूरी और आक्रामकता का स्तर पेश करता है जहां एल 3 बैंडविड्थ अन्य सीपीयू कोर द्वारा सीमित है। Cortex-A77 की तरह उच्च प्रदर्शन कोर, मेमोरी में DSU को संतृप्त करने की अधिक संभावना रखते हैं, जबकि A55 की तरह कम पावर कोर की संभावना नहीं है।
यह सब एक साथ फिटिंग
कॉर्टेक्स-ए 77 में बहुत सारे छोटे बदलाव हैं जो अपने पूर्ववर्ती के लिए कुछ पर्याप्त अंतरों को जोड़ते हैं। संक्षेप में, A77s नई एमओपी कैश एक व्यापक और लंबी अनुदेश खिड़की के साथ मिलकर बीफ़-अप ALU, शाखा, और मेमोरी इकाइयों को रखने में मदद करती है। पावरहाउस कॉर्टेक्स-ए 76 डिज़ाइन को उच्च घड़ी की गति पर भरोसा किए बिना, ए 77 के साथ आगे भी अपने थ्रूपुट को बेहतर बनाने के लिए विस्तारित किया गया है।
Cortex-A77 का सबसे बड़ा प्रदर्शन पूर्णांक और फ्लोटिंग पॉइंट गणित के रूप में आता है। इसकी पुष्टि आर्म के आंतरिक बेंचमार्क से होती है, जो क्रमशः स्पेसर पूर्णांक और फ्लोटिंग पॉइंट बेंचमार्क में 20 से 35 प्रतिशत प्रदर्शन को बढ़ावा देता है। मेमोरी बैंडविड्थ सुधार 15 से 20 प्रतिशत के बीच कहीं बैठते हैं, फिर से यह बताते हुए कि सबसे बड़ा लाभ नंबर क्रंचिंग के रूप में आता है। कुल मिलाकर, ये सुधार A77 को पिछली पीढ़ी की तुलना में औसत 20 प्रतिशत उत्थान देते हैं। हम इस साल के अंत में या 2020 की शुरुआत में अधिक उन्नत 7nm विनिर्माण प्रक्रियाओं के परिणामस्वरूप कुछ और अधिक सीमांत लाभ देख सकते हैं।
स्मार्टफोन के संदर्भ में, Cortex-A77 संचालित SoCs उच्च प्रदर्शन, प्रमुख उत्पादों के लिए किस्मत में हैं। हाथ पूरी तरह से बिजलीघर डिजाइन 4 + 4 bit.LITTLE कोर व्यवस्था का उपयोग देखने की उम्मीद है। A77 के क्षेत्र के आकार में वृद्धि हुई थ्रूपुट और मामूली टक्कर को देखते हुए, हम संभवतः SoC डिजाइनरों को 1 + 3 + 4 या 2 + 2 + 4 के रुझान को जारी रखते हुए देखेंगे। बड़े कैश और उच्च घड़ियों के साथ एक या दो शक्तिशाली बड़े कोर के साथ, छोटे कैश आकार और कम घड़ियों के साथ 2 या 3 ए 77 कोर द्वारा समर्थित है ताकि बिजली और क्षेत्र को बचाया जा सके। अंततः कॉर्टेक्स-ए 77 स्मार्टफोन चिप के लिए अच्छी चीजें और हमेशा से जुड़े आर्म-आधारित लैपटॉप के लिए बढ़ते बाजार को मंत्र देता है। इस वर्ष के अंत में सिलिकॉन घोषणाओं पर नज़र रखें।