基于龙芯2F架构的PMON分析与优化
下载地址
基本输入/输出系统(BIOS)是现代计算机系统的重要组成部 分,负责计算机系统的开机自检、板级初始化、加载操作系统内核以及基本I/O功能.以龙芯2F CPU架构为研究背景,在其基础上分析了PMON的系统结构与工作流程,通过添加网络驱动程序,最终实现通过PMON加载Linux和VxWorks操作 系统.进行必要的功能完善与性能优化,并经过严格的测试以排除可能存在的深层次缺陷,实现了一个性能稳定、功能完善、高可靠性的能与国产龙芯2F处理器平 台紧密搭配的BIOS.
基于SOPC基本信号产生器的设计与实现
下载地址
基于SOPC基本信号产生器的设计与实现
This paper introduces a basic signal generator based on the SOPC design technology.In order to achieve the basic signal generator,the design of system hardware circuit takes EP1C6Q240C8of Altera Corporation as the hardware core,embeds the soft-core CPU into FPGA-chip,and unifies the memory circuit,high-speed DAC circuit,LCD circuit,the keyboard circuit,JTAG configuration circuit,the power circuit and so on.The paper describes the main module design and gives some pictures for hardware and software test.Through the oscilloscope observation,system design requirements are met and the desired objectives are achieved.
基于GPU的瑕疵检测
下载地址
基于GPU的瑕疵检测
提出了使用廉价的图形卡来实现基于SOM的图像处理算法,达到检测产品瑕疵的目的.算法基于GPU的fragment shader程序,并使用了最新出现的浮点缓冲区技术,使算法达到了与CPU运算一致的精度,并对检测算法进行了优化.在廉价的硬件上实现了5.6帧/s的处理速度.
基于OpenCL的均值平移算法在多个众核平台的性能优化研究
下载地址
基于OpenCL的均值平移算法在多个众核平台的性能优化研究
OpenCL作为一种面向多种平台、通用目的的编程标准,已经对许多应用程序进行了加速。由于平台硬件和软件环境的差异,通用的优化方法不一定在所有平台都有很好的加速。通过对均值平移算法在GPU和APU平台的优化,探讨了不同平台各种优化方法的贡献力,一方面研究各个平台的计算特性,另一方面体会不同优化方法的优劣,在优劣的相互转化中寻求最优的解决方案。实验表明,算法并行优化前、后在AMD 5850、Tesla C2050和APU A6-3650上分别达到了9.68、5.74和1.27倍加速,并行相比串行程序达到79.73、93.88和2.22倍加速,前两个平台OpenCL版本相比,CUDA版本的OpenCV程序达到1.27和1.24倍加速。
下载地址
基于GPU的FDTD算法
GPU(Graphic Processing Unit),即图形处理器是英伟达公司首先提出来的一个概念。其初始目的是用来进行图形渲染,并不是为了进行通用计算。近年来,图形处理器(GPU)的发 展日益成熟,随着CUDA(Compute Unified Device Architecture)构架的推出,GPU的应用范围不在局限于计算机图形学本身,扩展到各个领域。FDTD(Finite Difference Time Domain)的计算过程可以很容易的划分为多个子计算过程,而子计算过程之间同时进行着相似的计算。
© 2024 VxWorks Club