使用cmake编译C++程序,如何解决多个库的链接问题,以及当面对cuda代码和TensorRT的调用时,cmake代码该如何写才能合理链接。
DeepSeek中的模型轻量化和GPU优化策略
介绍DeepSeek v3 通过流水并行算法 DualPipe、跨节点通信优化、内存占用优化等训练框架创新等模型轻量化和分布式训练时的GPU优化策略。
Go性能优化
go语言性能优化方面及策略,以及性能调优工具pprof的使用策略。
Go语言开发
go语言开发相关知识
HTTP协议与框架设计
介绍HTTP的基本知识和HTTP框架设计准则
Linux Socket通信服务端自动关闭
发表于
分类于
日常
,
Linux C/C++
Linux Socket通信时,客户端和服务端发送信息时,关闭客户端进程时,服务端会关闭这个socket连接的原因
CUDA编程基础
CUDA-C是一种用于通用计算的并行编程模型,专门为NVIDIA的GPU架构设计。随着数据量和计算需求的不断增长,传统的CPU在处理某些计算密集型任务(如图像处理、科学计算、深度学习)时可能会变得非常缓慢。GPU的并行处理能力可以显著提高这些任务的执行速度。如矩阵运算、信号处理和物理模拟等,通过CUDA-C编程,可以将这些任务移植到GPU上运行,极大提升计算效率。本文从四个方面进行CUDA介绍,第一部分介绍GPU的内部的硬件组成。第二部分基于谭升大佬的博客,具体CUDA编程的实现和一些并行优化思想,第二部分包含基于Windows平台下的一些代码实现。第三部分介绍CUDA开发常用的一些函数,主要是为了方便查找。工先善其事必先利其器,第四部分讲述CUDA调试的一些工具的使用方法。
智能网球车中控系统
发表于
分类于
项目
设计一款能够自主识别和定位网球的智能网球捡球车的中控软件,同时支持通过远程控制软件进行远程操控,进而实现高效准确地拾取网球,减轻运动员的负担。
MATLAB系列笔记
根据台大郭彦甫的课程所做的MATLAB系列笔记。
GPU基本知识
讲述GPU架构的基本历史以及各个架构版本的特点,尤其对于GPU的加速原理、性能指标和今年来的GPU加速热点进行技术分析