ما هي وحدة NPU ولماذا أصبحت شركات التكنولوجيا الكبرى مهووسة فجأة؟


هناك وحدة المعالجة المركزية. هناك وحدة معالجة الرسومات. في العام الماضي فقط أو نحو ذلك، كانت كل شركة تكنولوجيا تتحدث عن “وحدات المعالجة العصبية”. إذا كنت لا تعرف الأولين، فمن المحتمل أنك في حيرة من أمرك بشأن الثالث ولماذا تشيد كل شركة تكنولوجيا كبرى بفوائد “وحدة المعالجة العصبية”. كما كنت قد خمنت، كل هذا يرجع إلى دورة الضجيج المستمرة حول الذكاء الاصطناعي. ومع ذلك، كانت شركات التكنولوجيا سيئة إلى حد ما في شرح ما تفعله وحدات NP هذه أو لماذا يجب أن تهتم بها.

الجميع يريد قطعة من فطيرة الذكاء الاصطناعي. جوجل قال “منظمة العفو الدولية” أكثر من 120 مرة خلال هذا الشهر مؤتمر المطورين I/O، حيث أبهرت إمكانيات تطبيقات الذكاء الاصطناعي والمساعدين الجدد مضيفيها عمليًا. خلال فترة انعقاده الأخيرة بناء المؤتمر, كانت شركة Microsoft تدور حول أجهزة الكمبيوتر Copilot + الجديدة المستندة إلى ARM والتي تستخدم Qualcomm Snapdragon X Elite وX Plus. ستظل أي من وحدات المعالجة المركزية تقدم وحدة NPU مع 45 TOPS. ماذا يعني ذالك؟ حسنًا، يجب أن تكون أجهزة الكمبيوتر الجديدة قادرة على دعم الذكاء الاصطناعي الموجود على الجهاز. ومع ذلك، عندما تفكر في الأمر، فإن هذا هو بالضبط ما وعدت به شركتا Microsoft وIntel في أواخر العام الماضي من خلال ما يسمى بـ “جهاز كمبيوتر بالذكاء الاصطناعي“.

إذا اشتريت جهاز كمبيوتر محمولًا جديدًا مزودًا بشريحة Intel Core Ultra هذا العام بناءً على وعد بالذكاء الاصطناعي الموجود على الجهاز، فمن المحتمل أنك لن تكون سعيدًا جدًا بتخلفك عن الركب. أخبرت Microsoft Gizmodo أن أجهزة الكمبيوتر Copilot + فقط هي التي ستتمكن من الوصول الميزات المستندة إلى الذكاء الاصطناعي مثل الاستدعاء “بسبب الرقائق التي تديرها.”

ومع ذلك، كان هناك بعض الخلاف عند المسرب المعروف البكورة ادعى أنه بإمكانه تشغيل Recall على جهاز كمبيوتر آخر يعتمد على ARM64 دون الاعتماد على NPU. أجهزة الكمبيوتر المحمولة الجديدة ليست متاحة بعد، ولكننا سنحتاج إلى الانتظار لنرى مقدار الضغط الذي تضعه ميزات الذكاء الاصطناعي الجديدة على المعالجات العصبية.

ولكن إذا كنت مهتمًا حقًا بما يحدث مع وحدات NPU ولماذا يتحدث عنها الجميع، من Apple إلى Intel إلى شركات الكمبيوتر الصغيرة الناشئة، فقد قمنا بإعداد شرح لإطلاعك على آخر المستجدات.

شرح NPU و”TOPS”

شاركت شركة Qualcomm كيف يمكن لشريحة Snapdragon X Elite التعامل مع عمليات الذكاء الاصطناعي مثل النسخ المباشر.

شاركت شركة Qualcomm كيف يمكن لشريحة Snapdragon X Elite التعامل مع عمليات الذكاء الاصطناعي مثل النسخ المباشر.
صورة: كايل بار / جيزمودو

لذا، أولاً، يجب أن نقدم للأشخاص الموجودين في الخلفية ملخصًا سريعًا لإمكانيات الحوسبة العادية لجهاز الكمبيوتر لديك. وحدة المعالجة المركزية، أو “وحدة المعالجة المركزية”، هي في الأساس “عقل” الكمبيوتر الذي يعالج معظم مهام المستخدم. تعد وحدة معالجة الرسومات (GPU)، أو “وحدة معالجة الرسومات”، أكثر تخصصًا في التعامل مع المهام التي تتطلب كميات كبيرة من البيانات، مثل عرض كائن ثلاثي الأبعاد أو تشغيل لعبة فيديو. يمكن أن تكون وحدات معالجة الرسومات إما وحدة منفصلة داخل جهاز الكمبيوتر، أو يمكن أن تأتي معبأة في وحدة المعالجة المركزية نفسها.

وبهذا تكون وحدة NPU أقرب إلى وحدة معالجة الرسومات من حيث طبيعتها المتخصصة، لكنك لن تجد معالجًا عصبيًا منفصلاً خارج وحدة المعالجة المركزية أو وحدة المعالجة الرسومية، على الأقل في الوقت الحالي. إنه نوع من المعالجات مصمم للتعامل مع الحسابات الرياضية الخاصة بخوارزميات التعلم الآلي. تتم معالجة هذه المهام “بالتوازي”، مما يعني أنها ستقسم الطلبات إلى مهام أصغر ثم تعالجها في وقت واحد. لقد تم تصميمه خصيصًا للتعامل مع المتطلبات المكثفة للشبكات العصبية دون الاستفادة من أي من معالجات الأنظمة الأخرى.

معيار الحكم على سرعة وحدة NPU هو TOPS، أو “تريليونات العمليات في الثانية”. حاليًا، هذه هي الطريقة الوحيدة التي تقارن بها شركات التكنولوجيا الكبرى قدراتها على المعالجة العصبية مع بعضها البعض. إنها أيضًا طريقة مخفضة بشكل لا يصدق لمقارنة سرعات المعالجة. توفر وحدات المعالجة المركزية (CPUs) ووحدات معالجة الرسومات (GPUs) العديد من نقاط المقارنة المختلفة، بدءًا من أعداد وأنواع النوى وحتى سرعات الساعة العامة أو التيرافلوب، وحتى هذا لا يخدش سطح التعقيدات المرتبطة ببنية الشريحة. كوالكوم يشرح أن TOPS هي مجرد معادلة رياضية سريعة وقذرة تجمع بين سرعة ودقة المعالجات العصبية.

ربما في يوم من الأيام، سننظر إلى وحدات NPU بنفس الدقة مثل وحدات المعالجة المركزية أو وحدات معالجة الرسومات، ولكن قد يأتي ذلك فقط بعد أن ننتهي من دورة الضجيج الحالية للذكاء الاصطناعي. وحتى ذلك الحين، لم يتم وضع أي من هذه الخطوط العريضة للمعالجات في الحجر. هناك أيضًا فكرة وحدات GPNPU، والتي تعد في الأساس عبارة عن مجموعة من قدرات GPU وNPU. قريبًا، سنحتاج إلى تفكيك قدرات أجهزة الكمبيوتر الأصغر حجمًا التي تدعم الذكاء الاصطناعي بأجهزة أكبر يمكنها التعامل مع مئات أو حتى آلاف أجهزة TOPS.

لقد كانت وحدات NPU موجودة منذ عدة سنوات على كل من الهواتف وأجهزة الكمبيوتر

تتمتع شركة Apple بقدرات NPU في شرائح سلسلة M الخاصة بها لسنوات قبل M4.

تتمتع شركة Apple بقدرات NPU في شرائح سلسلة M الخاصة بها لسنوات قبل M4.
لقطة شاشة: أبل / يوتيوب

كانت الهواتف أيضًا تستخدم وحدات NPU قبل وقت طويل من اهتمام معظم الأشخاص أو الشركات. تحدثت Google عن وحدات NPU وقدرات الذكاء الاصطناعي منذ فترة طويلة بكسل 2. أطلقت شركتا Huawei وAsus المتمركزتان في الصين وحدات NPU لأول مرة على هواتف مثل هواتف 2017 ماتي 10 و 2018 زينفون 5. حاولت كلتا الشركتين تعزيز قدرات الذكاء الاصطناعي على كلا الجهازين في ذلك الوقت، على الرغم من أن العملاء والمراجعين كانوا أكثر تشككًا بشأن قدراتهم أكثر من اليوم.

في الواقع، أصبحت وحدات NPU اليوم أقوى بكثير مما كانت عليه قبل ستة أو ثمانية أعوام، ولكن إذا لم تنتبه، فإن القدرة العصبية لمعظم هذه الأجهزة قد تفلت منك.

تحتوي شرائح الكمبيوتر بالفعل على معالجات عصبية لسنوات قبل عام 2023. على سبيل المثال، دعمت وحدات المعالجة المركزية (CPUs) من السلسلة M من Apple، والرقائق المستندة إلى ARC الخاصة بالشركة، بالفعل القدرات العصبية في عام 2020. وكانت شريحة M1 تحتوي على 11 نقطة في الثانية، لكن شريحة M2 وM3 كانت تحتوي على 15.8 نقطة في الثانية. و19 قمم على التوالي. إنه فقط مع شريحة M4 داخل iPad Pro 2024 الجديد قررت شركة Apple أنها بحاجة إلى التفاخر بسرعة 38 TOPS لأحدث محركها العصبي. وما هي تطبيقات iPad Pro AI التي تستفيد حقًا من هذه الإمكانية الجديدة؟ ليس كثيرا، لاكون صريحا. ربما سنرى المزيد في غضون أسابيع قليلة في المؤتمر العالمي للمطورين 2024، ولكن سيتعين علينا ذلك انتظر و شاهد.

الهوس الحالي بوحدات NPU هو جزء من الأجهزة وجزء من الضجيج

عرضت Google ميزة “Ask Photos” الجديدة المستندة إلى الذكاء الاصطناعي في مؤتمر I/O لهذا العام.
GIF: جوجل

الفكرة وراء وحدة NPU هي أنها يجب أن تكون قادرة على تحمل عبء تشغيل الذكاء الاصطناعي على الجهاز من وحدة المعالجة المركزية أو وحدة معالجة الرسومات، مما يسمح للمستخدمين بتشغيل برامج الذكاء الاصطناعي، سواء كانت مولدات فنية للذكاء الاصطناعي أو روبوتات الدردشة، دون إبطاء أجهزة الكمبيوتر الخاصة بهم. المشكلة هي أننا جميعًا مازلنا نبحث عن برنامج الذكاء الاصطناعي الحقيقي الذي يمكنه استخدام قدرات الذكاء الاصطناعي المتزايدة.

أجرت Gizmodo محادثات مع كبار صانعي الرقائق خلال العام الماضي، والشيء الوحيد الذي نسمعه دائمًا هو أن صانعي الأجهزة يشعرون أنهم، لمرة واحدة، تجاوزوا الطلب على البرامج. ولطالما كان الأمر عكس ذلك. قد يدفع صانعو البرمجيات حدود ما هو متاح في الأجهزة الاستهلاكية، مما يجبر صانعي الرقائق على اللحاق بالركب.

ولكن منذ عام 2023، لم نشهد سوى بعض تطبيقات الذكاء الاصطناعي الهامشية القادرة على العمل على الجهاز. عادةً ما تتضمن معظم العروض التوضيحية لقدرات الذكاء الاصطناعي لشرائح Qualcomm أو Intel تشغيل ميزة Zoom في الخلفية. في الآونة الأخيرة، رأينا شركات تقوم بقياس وحدات NPU الخاصة بها باستخدام نموذج Riffusion لمولد الموسيقى المدعم بالذكاء الاصطناعي في التطبيقات الحالية مثل Audacity أو من خلال التسميات التوضيحية المباشرة على OBS Studio. بالتأكيد، يمكنك العثور على بعض التطبيقات التي تقوم بتشغيل برامج الدردشة القادرة على العمل على الجهاز، ولكن LLM الأقل قدرة والأقل دقة لا تبدو وكأنها التطبيق القاتل العملاق الذي سيجعل الجميع ينفدون لشراء أحدث هاتف ذكي جديد أو “كمبيوتر شخصي يعمل بالذكاء الاصطناعي”. “

وبدلاً من ذلك، يقتصر استخدامنا على التطبيقات البسيطة نسبيًا مع تشغيل Gemini Nano هواتف بيكسل، يحب ملخصات نصية وصوتية. الإصدار الأصغر من Google للذكاء الاصطناعي الخاص بها قادم إلى Pixel 8 و بكسل 8 أ. لقد أصبحت ميزات الذكاء الاصطناعي من سامسونج والتي كانت حصرية في السابق لهاتف Galaxy S24 موجودة بالفعل شقوا طريقهم إلى الهواتف القديمة وينبغي أن يأتي قريبا إلى الأجهزة القابلة للارتداء الخاصة بالشركة. لم نقم بقياس سرعة قدرات الذكاء الاصطناعي هذه على الأجهزة القديمة، لكنها تشير إلى مدى تمتع الأجهزة القديمة منذ عام 2021 بالكثير من قدرة المعالجة العصبية.

ولا يزال الذكاء الاصطناعي الموجود على الجهاز يواجه عوائق بسبب نقص قوة المعالجة للمنتجات المخصصة للمستهلكين. تحتاج شركات Microsoft وOpenAi وGoogle إلى تشغيل مراكز بيانات رئيسية تحتوي على مئات من تقنيات الذكاء الاصطناعي المتقدمة وحدات معالجة الرسومات من نفيديا، مثل H100 (مايكروسوفت وغيرها يقال إنهم يعملون على رقائق الذكاء الاصطناعي الخاصة بهم)، لمعالجة بعض برامج LLM أو برامج الدردشة الأكثر تقدمًا باستخدام نماذج مثل الجوزاء المتقدم أو جي بي تي 4o. هذه ليست رخيصة من حيث أي منهما مال أو الموارد مثل قوة و ماء، ولكن هذا هو السبب وراء قدرة الكثير من مستهلكي الذكاء الاصطناعي الأكثر تقدمًا على الدفع مقابل تشغيله في السحابة. إن تشغيل الذكاء الاصطناعي على الجهاز يفيد المستخدمين والبيئة. إذا اعتقدت الشركات أن المستهلكين يطلبون أحدث وأروع نماذج الذكاء الاصطناعي، فسوف يستمر البرنامج في تجاوز ما هو ممكن على جهاز مخصص للمستهلك.

اترك تعليقاً

لن يتم نشر عنوان بريدك الإلكتروني. الحقول الإلزامية مشار إليها بـ *

زر الذهاب إلى الأعلى