抱歉,您的浏览器无法访问本站
本页面需要浏览器支持(启用)JavaScript
了解详情 >

GoldenPotato137的小屋

本笔记为个人学习记录,仅供参考 推荐学习连接: https://zhuanlan.zhihu.com/p/661182311 https://zhuanlan.zhihu.com/p/662089556 https://zhuanlan.zhihu.com/p/663093816 Layout 用来表述一个复杂的高维数据结构 一个layout由两部分组成:shape 和 stride...

注: 本文内容部分来自GPT生成,实锤有效 部署LXD的知识很多来自于yuanyu dalao,推荐各位有需要部署单机LXC/LXD的小伙伴参考他的文章~ 动机 & LXD集群好处 很多实验室由于各种因素(没钱)的制约,很难给所有成员各自分配一台乃至多台服务器,导致共用服务器的需求产生。 很不幸的是,每个人对环境的需求是千差万别的,有的人可能需要新版本的GCC,有的人可能需要...

要反向代理内网的网站,主要难点来自于caddy默认的HTTP-01证书获取模式是没法使用的(因为域名指向内网,而认证服务器显然没法访问内网地址),需要走DNS-01模式。本文主要以腾讯云(dnspod)为例,介绍如何将腾讯云dns模块编译进caddy中并完成认证过程。 科学上网 腾讯云dns模块在github上。总所周知,裸连github是个非常玄学的事情,强烈建议提前准备魔法上网并将htt...

本文主要记录如何在device代码内异步把数据从全局内存复制至shared内存,有关如何异步把数据从主机端拷贝到设备端,可以参考How to Overlap Data Transfers in CUDA C/C++ | NVIDIA Technical Blog 本文主要内容来源于英伟达博客:Controlling Data Movement to Boost Performance on...

本文中所有的例程改编于CUB文档 什么是CUB 一个提供了一系列基于thread、warp、block、device等维度的便利函数的库,如:block级的基数排序(可以把一个block能访问到的数据都排好序)、warp级的读入函数(按照warp从核函数实参中的数组读入数据到thread的数组上)。 以下为一个使用block级的基数排序的例子: 123456789101112131415...

文章 会议 等级 阅读情况 Accelerating Multi-Scalar Multiplication for Efficient Zero Knowledge Proofs with Multi-GPU Systems2024 ASPLOS 2024 CCF-A [] GZKP: A GPU Accelerated Zero-Knowledge Proof Sys...

cmake https://subingwen.cn/cmake/CMake-primer/index.html consteval与constexpr https://tjsw.medium.com/潮-c-20-consteval-constexpr-的好兄弟-bfbcfdd4c763 运算小寄巧 虽然跟c++没啥关系,但懒得开新post了,就放这吧。 向上取整到整数$x$的某个最近...

https://u.sb/xcaddy/

如果你擅长使用adb,请直接跳转到STEP5 STEP1 下载ADB 如果你电脑上有ADB可以跳过此步 在google官网上下载adb https://dl.google.com/android/repository/platform-tools-latest-windows.zip?hl=zh-cn 将其解压到你喜欢的位置即可,建议把解压出来的目录加到path里面方便powershell里...