跳转到主要内容
陆尚任

项目

CuPerf

开发中2026年1月 - 至今

一个现代化、可扩展的命令行工具,用于在 NVIDIA CUDA 设备上评测 GPU 性能。

提供准确、可重复的内存带宽、计算吞吐量、张量核心性能、内核启动开销和归约性能测量。

支持多种数据类型(FP32、FP16、BF16、INT8、FP4),全面的统计信息,以及多种输出格式(控制台、JSON、CSV)。

技术栈:CUDA、C++、并行计算、性能分析

ShitDefinedNetwork

已完成2023年2月 - 2024年6月

一个运行在真实互联网上的实验性网络,拥有两个 ASN:AS151192 和 AS199684,最大容量 5 Gbps。

使用自研的 VPN 协议和软件连接全球数百个节点,具备性能分析和遥测功能。

使用 Bird 与上游和对等方建立 BGP 连接。宣告了多个 IPv6 前缀,并托管了个人使用的服务。

技术栈:BGP、VPN、IPv6、Bird、遥测