مسرع الشبكة العصبية المستندة إلى FPGA يتفوق GPUs
تم عرضه على أنه GoogLeNet Inception-v1 CNN ، باستخدام دقة عدد صحيح من ثماني بتات. حققت 16.8 تيرا من العمليات في الثانية (TOPS) ويمكن أن تستنتج أكثر من 5300 صورة في الثانية الواحدة XILINX Virtex UltraScale + XCVU9P-3 fpga. إن المنهج المعياري والقابل للتوسع يجعله مناسبًا لتطبيقات اكتشاف الكائن وتجهيز الفيديو على الحافة والسحاب ، كما يوضح Fawcett ، بالإضافة إلى الاستدلال في مراكز البيانات والكاميرات الذكية.
يمكن تكوين DPU لتوفير أداء حوسبة مثالي لطبولوجيا الشبكات العصبية في تطبيقات التعلم الآلي ، باستخدام بنية DSP المتوازية ، الذاكرة الموزعة وإعادة قابلية إعادة المنطق والاتصال لخوارزميات مختلفة.
وتحقق DPU أداء أعلى بنسبة 50٪ من أي CNN منافسة وتؤدي أداء وحدات معالجة الرسوم (GPUs) لميزانية معينة أو ميزانية محددة ، كما تدعي الشركة. وأضاف فوسيت: "تعد منصة fpga منصة وهندسة عالمية ، وهي مرنة للغاية للتدقيق المستقبلي ويمكنها التفوق على GPU في AI ، مع تأخير أقل".
كما أعلنت الشركة أنها ترعى DPhil (PhD0 في جامعة أكسفورد لدراسة تقنيات تنفيذ تسريع التعلم العميق على fpgas. وسيتم العمل بالتعاون مع أبحاث Omnitek الخاصة في محركات وحوسبة AI الحوسبة.
