无论是学术界还是工业界,越来越多的研究者都在探索FPGA在深度学习领域的应用场景,尤其是Inference。在百度内部,FPGA从2013年开始就应用在许多典型的深度学习模型中,如DNN,RNN,CNN,LSTM等,涵盖了语音识别,自然语言处理,推荐算法,图像识别等广泛的应用领域。
百度FPGA云服务器中开放了基于FPGA的深度卷积神经网络加速服务,单卡提供3Tops的定点计算能力,支持典型深度卷积网络算子,如卷积、逆卷积、池化、拼接、切割等,有效加速典型网络结构如VggNet、GoogLeNet、ResNet等。我们基于FPGA的深度学习硬件,深度定制优化了主流深度学习平台如caffe等,用户可以直接将深度学习业务切换到FPGA平台,而无需考虑底层硬件细节。