硬件高效的C语言设计

张开发

• 2026/5/19 6:37:04 • 15 分钟阅读

分享文章

1. Vivado HLS 综合的 C 语言代码将在 FPGA 上执行提供与 C 语言仿真相同的功能。某些情况下开发者的工作在此阶段完成。2.在要综合的代码中使用 __SYNTHESIS__ 宏3.请勿在测试激励文件中使用该宏因为 C 语言仿真或 C RTL 协同仿真不会遵循其指示进行操作。4.局部数组将使用内部 FPGA 块 RAM 来实现5.local局部数组初始化问题6.hls::stream 对象可采用与数组相同的方式来存储数据采样。hls::stream 中的数据只能按顺序访问。在 C 语言代码中hls::stream 的行为与无限深度的 FIFO 相似。所以在Tb顶层中将hls::stream当作无限的深度的FIFO:hls::stream my_stream1;hls::stream my_stream2;for(){my_stream i;}top(my_stream1,my_stream2);for(){my_stream data;}当然你并一定总是要将hls::stream当作无限深度的FIFO虽然这个FIFO是无限深的但是我可以不用这么深我把他的深度当作1你不能让我不用吧for(){my_stream i;top(my_stream1,my_stream2);my_stream data;}这样用不是也可以嘛!!!7.在任务内广泛使用条件是不影响流水线执行的。这使任务在流水线化后可持续不断处理数据且条件结果不会影响流水线的执行不推荐在条件语句中使用任务或者pipeline流水线设计。Border:for (int i 0; i height; i) {for (int j 0; j width; j) {T pix_in, l_edge_pix, r_edge_pix, pix_out;#pragma HLS PIPELINEif (i 0 || (i border_width i height - border_width)) {if (j width - (K - 1)) {pix_in vconv.read();borderbuf[j] pix_in;}if (j 0) {l_edge_pix pix_in;}if (j width - K) {r_edge_pix pix_in;}}if (j border_width) {pix_out l_edge_pix;} else if (j width - border_width - 1) {pix_out r_edge_pix;} else {pix_out borderbuf[j - border_width];}dst pix_out;}}}这种设计是不会影响流水线设计的。8.assert的使用templatetypename T, int Kstatic void convolution_strm(int width,int height,hls::streamT src,hls::streamT dst,const T *hcoeff,const T *vcoeff){hls::streamT hconv(hconv);hls::streamT vconv(vconv);// These assertions let HLS know the upper bounds of loopsassert(height MAX_IMG_ROWS);assert(width MAX_IMG_COLS);assert(vconv_xlim MAX_IMG_COLS - (K - 1));// Horizontal convolutionHConvH:for(int col 0; col height; col) {HConvW:for(int row 0; row width; row) {HConv:for(int i 0; i K; i) {}}}// Vertical convolutionVConvH:for(int col 0; col height; col) {VConvW:for(int row 0; row vconv_xlim; row) {VConv:for(int i 0; i K; i) {}}Border:for (int i 0; i height; i) {for (int j 0; j width; j) {}}9. hls::stream模拟的是硬件中常见的FIFO先进先出队列。单向流动数据只能从一头写入write从另一头读出read。消耗性读取一次read()操作会将该数据从流中永久移除。后续的任何模块或代码都无法再次读取同一个数据。无索引访问你不能用下标stream[5]来访问某个特定元素只能按顺序读取。10.FPGA中高速缓存“FPGA高速缓存”并不是指CPU的L1/L2 Cache而是指FPGA上能支持多路并发访问的片上存储资源通常是Block RAM (BRAM) 或寄存器阵列。void process(hls::streamfloat matrix_stream, hls::streamfloat vector_stream) {// 步骤1定义一块高速缓存综合为BRAM或寄存器阵列float vector_cache[N];// 告诉HLS将此数组完全分割为独立寄存器以实现最大并发访问#pragma HLS ARRAY_PARTITION variablevector_cache complete dim1// 步骤2将流数据写入缓存同时消费了流LOAD_VECTOR: for (int i 0; i N; i) {#pragma HLS PIPELINEvector_cache[i] vector_stream.read();}// 步骤3后续逻辑可以自由、反复地使用 vector_cache 中的任意元素PROCESS_LOOP: while (!matrix_stream.empty()) {// ... 读取矩阵元素并随时访问 vector_cache 进行运算 ...float temp matrix_stream.read() * vector_cache[5]; // 可以随机访问第5个元素}}

更多文章

前端开发 2026/5/13 9:48:27

别再手动配用户了！用OpenLDAP+phpLDAPadmin在CentOS 7.9上5分钟搞定统一认证服务

企业级统一认证实战：OpenLDAP与phpLDAPadmin高效部署指南每次新员工入职，IT管理员是否还在重复执行这些操作：登录每台服务器创建账号、配置GitLab权限、设置Jenkins访问、调整Wiki系统身份？当团队规模突破20人时，这种…

DDR内存及SSD价格现状近期，DDR内存和SSD价格呈现快速上涨趋势。根据市场监测数据：截至2025年10月中旬，最新涨价情况如下： DDR4内存：主流16GB模组价格涨幅达20%-30%，部分品牌高频条涨幅更高。DDR5内存&…

张开发

前端开发 2026/5/8 7:16:31

Azure Quantum实战教程：用Q构建量子应用的终极指南

Azure Quantum实战教程：用Q#构建量子应用的终极指南【免费下载链接】Quantum Microsoft Quantum Development Kit Samples 项目地址: https://gitcode.com/gh_mirrors/quantum10/Quantum Microsoft Quantum Development Kit (QDK) Samples项目是学习和实践量…

张开发

硬件高效的C语言设计

最新文章

Windows Cleaner：免费开源工具，高效解决C盘空间不足问题

WarcraftHelper终极指南：魔兽争霸3全版本兼容性修复与性能优化完整方案

除了RTKLIB，还有哪些轻量级工具能一键把坐标序列转KML？实测3种方案对比

第四篇：Vibe Coding 深度解析（四）：生产级落地的工程化体系与避坑指南

python passlib

5分钟快速上手：xrdp开源远程桌面服务器完整配置指南

推荐文章

相关文章

分享文章

更多文章

别再手动配用户了！用OpenLDAP+phpLDAPadmin在CentOS 7.9上5分钟搞定统一认证服务

Qwen3-4B-Thinking实战：SEO关键词密度分析+长尾词内容生成一体化流程

别再死记硬背InceptionV3结构了！从四大设计原则出发，手把手教你设计自己的高效CNN模块

从零到一：基于Docker与ONVIF协议构建家庭智能安防监控系统

从Excel筛选到Matlab find：数据工程师的查询思维转换实战

mysql JSON类型取值

程序员追不上机器人干脆开电瓶车跟；小米徐洁云辟谣“雷军被人堵在车里维权”；DeepSeek被曝融资20亿 | 极客头条

Rugged最佳实践总结：从新手到专家的完整成长路径

快速上手Gitee：从注册到代码提交全攻略

c++ RAII机制详解 c++如何利用RAII管理资源

深圳同袍存储解说DDR内存及SSD价格现状

Azure Quantum实战教程：用Q构建量子应用的终极指南