[折腾]搭建自己的深度学习环境 一、从连接服务器开始如何连接服务器 实验室有一台服务器,假设这台服务器的IP如下所示。服务器IP:172.18.233.211 1、创建密钥 默认环境配好,能够在终端使用ssh命令。 下面的命令表示使用rsa加密算法,密钥长度为4096位。新版本(版本号在6.5之后的)的ssh默认采用ed25519椭圆曲线算法,如果是访问古早服务器,建议生成一个rsa的密钥。 1ssh-keygen -t rs 2026-03-23 #Python #docker #换源 #conda
[学习]量子计算 最近学习入门量子计算,总结记录一些学习笔记。需要亿一点点的线性代数知识。 一、量子比特1.经典比特与量子比特经典比特只有两种状态0和1,它们分别代表电路中高电平和低电平,准确来讲是可以用电路中的高低电平来表示。 量子比特也有 和两种状态,量子比特还有其特殊的叠加态。 其中是量子力学中的Dirac表示法,代表向量,与此同时则代表(PS:对于计算机科学家来说没有什么比非对称括号更糟糕的表示方法了。数 2025-12-26 #学习 #量子计算
[学习]VTR开源软件开发环境安装 前言 检查宿主机是否支持perf指令,如果不能,则有关调试加速rr-debug的部分无法使用。安装教程参考CSDN。 如果是Docker容器启动,在启动镜像前最好设置--cap-add SYS_ADMIN,从而可以正常使用rr-debug。不建议使用较老的系统,还要自行折腾gcc的升级。另外SYS_ADMIN可能不符合最小权限原则,自行考量。 如果是虚拟机,可尝试在虚拟机内部安装并使用perf工具 2025-06-12 #学习 #VTR #部署安装
[折腾]Anything+Ollama部署自己的大模型 本文记录在本地利用Ollama后端和AnythingLLM前端,部署自己私有化大模型的过程,方便日后查找。采用docker镜像安装的形式,方便管理和版本更新。 一、前期准备 确保主机上安装有docker,且能正常访问docker hub官网(或者自行更改镜像源使用国内镜像站)。Autogguf是写文档时使用的safetensor转gguf工具。工具有可能长久没有更新,不保证在工具之后的大模型可以被 2025-01-09 #折腾 #LLM #部署应用
[折腾]CUDA11.7也要玩LLM 零、起因 在超算中心的计算节点上研究LLM推理与训练,并测试一些模型。然而超算中心计算节点那是“相当先进”,无论3090-24GB还是A10-24GB都是 CUDA 11.7 版本,唯一较好的 CUDA 11.8 的 A100-40GB 计算节点一直无法使用。 > CUDA 11.7 和 CUDA 11.8 是 pytorch 的一个分水岭,从 torch 2.1.0 开始不支持 2024-11-19 #折腾 #LLM #CUDA #Pytorch
[折腾]编译 merlin compiler 背景:为了测试 HLS ,需要 merlin compiler 这个 VLS 编译器。这个库需要 gcc 4.9.4 llvm6 以及 零、阅读须知 ⚠先弄好好gcc4.9.4然后开始后面llvm、boost、clang库的处理。 这是一个老项目了,不确定使用最新的库文件是否正常编译。且本教程最后只能编译得到编译器本身,附带的一些功能仍然编译失败。 一、gcc4.9.4 1、准备工作 2024-11-15 #分享 #折腾 #DSE #编译
[学习]C++性能分析实战 小 Tips ⚠需要更加高级,细致到CPU时钟、缓存一致性、缓存命中率和分支预测准确率的估计考虑使用隔壁的 perf 工具 ⚠gprof只能检查工作在用户态的代码,如printf等内核态的代码无法剖析, ⚠在那之前回顾 c++ 程序,函数的声明与函数的定义二者之间区别。 ✔非常赞赏使用 git 代码管理工具。 ✔非常赞同合作写代码时规定一个统一的风格规范。 ✔推荐使用 2024-11-12 #分享 #学习 #性能分析
[折腾]编译pytorch 前言 最好全程科学上网,预计需要5~7GB的下载量。 本教程尝试在 Windows 的 Docker 环境下编译给 Ubuntu20.04 的 torch=2.3.0 CUDA11.7 。(至于为什么是这个详见LLM在CUDA11.7安装经历) 零、准备工作 ⚠⚠⚠记住一定要先检查目标机器是否有NVIDIA驱动和CUDA环境,CUDNN最好也检查一下,否则编译好了在那边也装不 2024-09-18 #折腾 #编译 #pytorch
[折腾]安装pyrealsense 前言 最近在实验室做无人机的深度相机测试遇到的小问题。在此记录一下当时的解决方法。 系统环境为 |硬件|版本| |—|—| |开发板|Nvidia nano| |相机| intelRealsense D435i| |系统版本| ubuntu 18.04| |python|3.7.10| 一、安装 本文以conda下的drone环境做演示。 从intelRealsense中下载源文件 2021-09-12 #折腾 #pyrealsense
[学习]多线程 N体问题 模拟一个太空中有N个星体,各个星体有三个维度的速度和位置,相互之间受到万有引力影响运动的效果。模拟最小时间分位点为0.005秒,本题目中万有引力常数设定为1,星体的初始数据在“nbody.txt”文本文件中。要求用单线程和多线程分别完成一份,将迭代20次后的数据输出到文件中,并且比较串行程序和多线程之间的计算结果差异。 一、实现方案 模拟方案涉及大量计算,对于算法的考察较小,考研对 2021-05-05 #学习 #并行计算