SWORD4.0上成功推出:基于RIFFA PCIe架构的人脸检测加速工程

作为针对计算机体系结构教学而专门设计的SWORD4.0,必然需要支持当今计算机体系结构发展的主要热点:基于PCIe的AI加速能力。以让学生在学习阶段就可以跟踪和感知计算机体系结构演变的潮流。


图1. SWORD4.0上的PCIe主机插座

SWORD4.0的用户往往会忽视该板卡上的PCIe接口,这是一个4 lane PCIe Gen2主机接口,通过一根PCIe扁平线缆,与计算机主机建立连接。


图2. SWORD4.0通过PCIe线缆与主机相连

基于UCSDRIFFA开源PCIe架构,上海星灯智能科技有限公司的研发团队,利用自有的Face Detection IP Core,开发了SWORD4.0上的人脸检测加速的工程。在保障检测性能的前提下,针对800 x 600的图像取得了15倍的加速比,达到了实时处理的效果。该工程中使用到了上海星灯智能的多种图像处理IP Core: Face DetectionVideo Scalar等。


图3. X86+SWORD4.0的Face Detection加速演示

该项目针对SWORD4.0的可追溯用户,提供源码工程,并提供技术交流活动。

基于该演示的成功推出,某军事研究所与上海星灯智能建立了初步的研发合作,提供中国自主研发的基于飞腾芯片的服务器,在麒麟操作系统上,通过SWORD4.0取得了更高的加速比;并进一步采用SWORD-NET工业级PCIe卡,完成了第一阶段的智能图像加速项目的任务。