博客
分类
标签
归档
友链
关于
博客
分类
标签
归档
友链
关于
GoldenPotato137的小屋
cute::Tensor 学习笔记
本笔记为个人学习记录,仅供参考 推荐学习连接: https://zhuanlan.zhihu.com/p/661182311 https://zhuanlan.zhihu.com/p/662089556 https://zhuanlan.zhihu.com/p/663093816 Layout 用来表述一个复杂的高维数据结构 一个layout由两部分组成:shape 和 stride...
2025-02-26
阅读全文
基于LXD集群部署实验室GPU共享服务器
注: 本文内容部分来自GPT生成,实锤有效 部署LXD的知识很多来自于yuanyu dalao,推荐各位有需要部署单机LXC/LXD的小伙伴参考他的文章~ 动机 & LXD集群好处 很多实验室由于各种因素(没钱)的制约,很难给所有成员各自分配一台乃至多台服务器,导致共用服务器的需求产生。 很不幸的是,每个人对环境的需求是千差万别的,有的人可能需要新版本的GCC,有的人可能需要...
2025-02-24
阅读全文
基于caddy反向代理内网/vpn内网站
要反向代理内网的网站,主要难点来自于caddy默认的HTTP-01证书获取模式是没法使用的(因为域名指向内网,而认证服务器显然没法访问内网地址),需要走DNS-01模式。本文主要以腾讯云(dnspod)为例,介绍如何将腾讯云dns模块编译进caddy中并完成认证过程。 科学上网 腾讯云dns模块在github上。总所周知,裸连github是个非常玄学的事情,强烈建议提前准备魔法上网并将htt...
2025-02-23
阅读全文
cuda异步复制数据
本文主要记录如何在device代码内异步把数据从全局内存复制至shared内存,有关如何异步把数据从主机端拷贝到设备端,可以参考How to Overlap Data Transfers in CUDA C/C++ | NVIDIA Technical Blog 本文主要内容来源于英伟达博客:Controlling Data Movement to Boost Performance on...
2024-12-13
阅读全文
TensorCore
2024-11-22
阅读全文
CUB 学习笔记
本文中所有的例程改编于CUB文档 什么是CUB 一个提供了一系列基于thread、warp、block、device等维度的便利函数的库,如:block级的基数排序(可以把一个block能访问到的数据都排好序)、warp级的读入函数(按照warp从核函数实参中的数组读入数据到thread的数组上)。 以下为一个使用block级的基数排序的例子: 123456789101112131415...
2024-09-10
阅读全文
MSM GPU加速相关文章阅读笔记
文章 会议 等级 阅读情况 Accelerating Multi-Scalar Multiplication for Efficient Zero Knowledge Proofs with Multi-GPU Systems2024 ASPLOS 2024 CCF-A [] GZKP: A GPU Accelerated Zero-Knowledge Proof Sys...
2024-09-07
阅读全文
c++笔记
cmake https://subingwen.cn/cmake/CMake-primer/index.html consteval与constexpr https://tjsw.medium.com/潮-c-20-consteval-constexpr-的好兄弟-bfbcfdd4c763 运算小寄巧 虽然跟c++没啥关系,但懒得开新post了,就放这吧。 向上取整到整数$x$的某个最近...
2024-07-24
阅读全文
caddy笔记
https://u.sb/xcaddy/
2024-07-13
阅读全文
ColorOS关闭应用安装安全检查
如果你擅长使用adb,请直接跳转到STEP5 STEP1 下载ADB 如果你电脑上有ADB可以跳过此步 在google官网上下载adb https://dl.google.com/android/repository/platform-tools-latest-windows.zip?hl=zh-cn 将其解压到你喜欢的位置即可,建议把解压出来的目录加到path里面方便powershell里...
2024-07-11
阅读全文
1 / 13
下一页