CUDA
/ˈkuːdə/库达NVIDIA 的 GPU 并行计算平台,深度学习算力的底座
读法备注读作「库达」(KOO-dah),不是按字母 C-U-D-A,也不是英文拼读的 KYOO-da
pronounce --ai-infra
CUDA、Qwen、nginx、Kubernetes、PyTorch…240+ AI / LLM / 基础设施术语怎么念。点一下听标准读法,配中文谐音、一句话含义与参考链接。
NVIDIA 的 GPU 并行计算平台,深度学习算力的底座
读法备注读作「库达」(KOO-dah),不是按字母 C-U-D-A,也不是英文拼读的 KYOO-da
NVIDIA 的深度学习 GPU 加速库,框架底层都在调它
读法备注读作 koo-D-N-N(CUDA 的 cu + 逐字母 DNN)
GPU 上的高带宽显存
NVIDIA 多 GPU 集合通信库
主流 AI GPU 厂商英伟达
GPU 间高速互联总线
显卡显存容量
量化版 LoRA,在 4-bit 量化模型上做轻量微调
读法备注读作 cue-萝拉(Q + LoRA),不是逐字母 Q-L-O-R-A
低秩适配,最常用的大模型轻量微调方法
读法备注Low-Rank Adaptation 缩写,读作「萝拉」,不要读成 L-O-R-A
基于人类反馈的强化学习,对齐模型的主流方法
读法备注逐字母读 R-L-H-F,没有整词读法
直接偏好优化,比 RLHF 更简单的对齐方法
读法备注逐字母读 D-P-O
监督微调,用标注数据继续训练模型
读法备注逐字母读 S-F-T
把权重降精度(如 4-bit)以省显存、提速
训练时完整过一遍数据集的轮次
读法备注ML 圈常读「诶剖克」(EP-uhk),也有人读 ee-pock,两种都听得到
带权重衰减的 Adam 优化器
PyTorch 全分片数据并行
损失函数的二阶导数矩阵
参数高效微调方法库
DeepSpeed 的显存分片优化技术
省显存、加速的 Attention 算子实现
高吞吐的大模型推理服务框架(PagedAttention)
读法备注逐字母读 V-L-L-M
NVIDIA 的推理优化编译器与运行时
读法备注读作 Tensor-R-T
跨框架的开放神经网络模型交换格式
读法备注读作「奥尼克斯」(ON-nix,像 onyx),不是逐字母 O-N-N-X
缓存注意力的键值,避免重复计算、加速生成
读法备注读 K-V cache,cache 读「卡什」(cash),不是「ca-chee」
GPU kernel 编程语言 / NVIDIA 推理服务器(同名两物)
激活感知权重量化,低比特压缩
基于二阶信息的训练后量化
分页管理 KV 显存的注意力实现
高性能 LLM 推理服务框架
每个输出 token 的平均生成耗时
首 token 延迟,请求到首字耗时
几乎所有现代大模型的底层神经网络架构
Transformer 的核心机制,按相关性给信息加权
把文本或图像映射成稠密向量的表示
把文本切成 token 的分词器,模型的输入第一关
混合专家,按需只激活部分参数以低成本放大模型
读法备注读作「谋」(moh) 或逐字母 M-O-E 都有人用
法国 Mistral AI 的开源模型系列
读法备注源自法语(一种风名),重音偏后,读「米斯特拉尔」
阿里通义千问开源模型系列
读法备注官方即「通义千问」;英文读音社区有 /kwɛn/ 与 /tʃwɛn/ 两种,未统一
Meta 开源大模型系列
扩散模型,图像/视频生成的主流架构
高斯误差线性单元,平滑激活函数
分组查询注意力,省 KV 缓存显存
旋转位置编码
Transformer 前馈层门控激活函数
Claude 背后的 AI 公司
去噪自编码的序列到序列预训练模型
双向编码器预训练语言模型
OpenAI 代码生成模型及 CLI
提供嵌入与重排模型的厂商
国产开源大模型与 API 提供方
蒸馏压缩的轻量版 BERT
谷歌的多模态大语言模型
llama.cpp 的模型量化文件格式
自回归生成式预训练模型
按层归一化激活值,稳定训练
同时处理文本图像音频的能力
Claude 顶配档,也指音频编码格式
修正线性单元激活函数
带残差连接的深度卷积网络
优化训练流程的 BERT 改进版
序列到序列编码解码架构
把向量归一化为概率分布的函数
文本到文本统一框架模型
高质量 embedding/rerank 模型厂商
经典词向量训练模型
最流行的 LLM 应用编排框架之一
面向 RAG 的数据接入与索引框架
让模型自主规划、调用工具完成任务的范式
读法备注读「诶-真踢克」(ay-JEN-tik)
模型上下文协议,给 Agent 接外部工具/数据的标准
读法备注逐字母读 M-C-P
基于有向图的 Agent 编排框架
给 AI 应用加记忆层的框架
分层记忆的 Agent 架构
推理与行动交替执行的循环模式
在循环里加反思层的执行模式
一次 Agent 运行的完整步骤账本
检索增强生成,给大模型外挂知识库
读法备注当一个单词读(rag),不逐字母 R-A-G
Facebook 开源的高效向量检索库
读法备注Facebook AI Similarity Search;社区读法有「face」与「fice」两种
托管式向量数据库服务
智源开源的文本嵌入模型
经典关键词检索打分算法
轻量本地向量数据库
基于晚交互的检索模型
分层可导航小世界向量索引
先生成假设答案再去检索的RAG技术
开源向量数据库
兼顾相关性与多样性的检索重排
主流图数据库,按节点和关系存数据
PostgreSQL 向量检索扩展
开源向量数据库
RAG 流水线自动评估框架
对初检结果重新打分排序的组件
按查询返回相关文档的检索组件
开源向量数据库
容器编排系统,云原生部署的事实标准
读法备注重音在 ber;常简称 k8s(kay-eights)
Kubernetes 的命令行客户端
读法备注社区读法有 cube-control / cube-cuttle / kube-C-T-L 三种,官方倾向 cube-control
高性能 Web 服务器与反向代理
读法备注读作 engine-X,不是按字母拼
后台常驻进程(如 dockerd)
读法备注读作 dee-mun,不是 day-mon
最流行的指标可视化与监控面板
读法备注官方读「格拉法纳」(gra-FAH-na)
Kubernetes 用的分布式键值存储
读法备注官方读 et-see-dee(取自 /etc 目录 + distributed),不是 etc-d
开源分布式存储系统
读法备注读作「赛夫」(seff)
按时间表自动触发的定时任务调度
微软云平台
密码加盐哈希算法
HTTP 鉴权头里的令牌前缀
改变根目录的隔离机制
云原生 L7 代理与边车
高性能跨语言 RPC 通信框架
基于哈希的消息认证码
高性能集群网络互联技术
K8s 入口流量路由
JSON 网络令牌,用于鉴权
分布式消息队列
内网穿透与隧道工具,暴露本地端口
一次性随机数,防重放攻击
开放授权协议,第三方免密授权
业界标准可观测性框架
Unix 系统接口标准
开源关系型数据库 PostgreSQL 简称
主流指标监控系统
伪终端,承载交互式命令
每秒请求/查询数,衡量吞吐
绕过 CPU 的远程内存直接访问
内存键值数据库/缓存
Redis 高可用哨兵
嵌入式单文件关系数据库
服务端推送事件流
标准输入输出流
开源后端即服务平台
Linux 系统与服务管理器
基于 WireGuard 的组网工具
遥测,系统运行指标采集上报
持久化工作流编排引擎
传输层安全加密协议
每分钟 token 数限额
密钥与凭据集中管理服务
前端部署与 Serverless 托管平台
预写日志,改数据前先记日志
本地一键跑开源大模型的工具
读法备注读「欧-拉-马」(oh-LAH-mah)
最大的开源模型与数据集社区平台
正则表达式(regular expression)的简称
读法备注g 软读「瑞-杰克斯」(REJ-ex) 与硬读「瑞-给克斯」(REG-ex) 两派并存
字节对编码分词算法
快速 JS 运行时与打包器
规范或标准形式
TypeScript 类型安全 ORM
Go 写的高速 JS/TS 打包器
JavaScript 代码静态检查工具
高性能 Node.js Web 框架
评测脚手架/执行框架
Kubernetes 应用包管理器
轻量级边缘 Web 框架
分布式链路追踪系统
基于 JSON 的远程调用协议
每行一条 JSON 的文件格式
运行于 JVM 的现代编程语言
LangChain 官方可观测与评估平台
静态检查代码风格与错误的工具
统一调用多家大模型 API 的代理库
编辑器与语言服务通信的协议
轻量级可嵌入脚本语言
用文本语法生成图表的工具
npm 自带的包执行命令
Python 数值计算基础库
Node.js 高性能 JSON 日志库
隔离安装 Python 命令行应用
浏览器自动化测试框架
节省磁盘的 Node 包管理器
前端代码自动格式化工具
无头浏览器自动化库
Python 数据校验库
Python 静态类型检查器
主流深度学习框架
读取-求值-打印循环交互环境
自动生成项目骨架代码
语义化版本号规范
无需预分词的子词分词工具
面向 Agent 的联网搜索 API
OpenAI 的 BPE 分词与 token 计数库
终端多路复用器,管理多会话
一种易读的配置文件格式
终端富文本交互界面
快速的前端构建工具
基于 Vite 的单元测试框架
常用配置文件格式
TypeScript 优先的 schema 校验库
React 轻量状态管理库
State of the Art,当前最佳水平
读法备注口语常读作 so-ta;也有人逐字母 S-O-T-A
凭感觉让 AI 写代码的开发方式,2025 年流行词
模型一本正经地编造不实内容
(接口/功能)已不推荐使用、将被废弃
读法备注读「戴普日-凯踢德」(DEP-ri-kay-tid),常被误读为 de-PRE-cated
缓存
读法备注读「卡什」(cash),不是「ca-chee」也不是「cash-ay」
数据的结构定义 / 模式
读法备注读「斯基马」(SKEE-ma)
异步(asynchronous 的简称)
读法备注常读「诶-辛克」(AY-sink),也有人读 a-sink
图形用户界面
读法备注口语常读「古异」(gooey),也有人逐字母 G-U-I
结构化查询语言,关系数据库的通用语言
读法备注「sequel」(西扣) 与逐字母 S-Q-L 两派经久不息,官方原读 sequel
softmax 前的原始打分向量
困惑度,衡量语言模型预测能力
无障碍,accessibility 的数字缩写
消融实验,逐一移除组件看影响
终端控制与转义码标准
抽象语法树
背压,下游过载时反向限流
校准:置信度与真实准确率对齐
闭包,捕获外层变量的函数
可挂起恢复的协作式执行单元
用于训练或检索的文本语料集合
跨站请求伪造攻击
防抖:等停顿后才执行一次
确定性:相同输入必得相同输出
模型对战排名的等级分
临时、短生命周期的
时过时不过的不稳定测试
小学数学题推理评测基准
常识推理评测基准
启发式,靠经验规则判断
代码生成能力评测基准
重复执行结果不变的幂等性
重试退避时加的随机抖动
衡量标注者一致性的系数
延迟
LangChain 声明式链编排表达式语言
编辑距离,衡量两字符串的差异
多任务知识理解评测基准
互斥锁,保护并发临界区
连续 n 个词或字符的片段
命名实体识别,从文本抽人名地名等
正交,各维度互不影响
范式,一套主流的做事框架
采样 k 次至少一次正确的概率
统计分位数,如 p95 延迟
召回率,查全程度的指标
回归:改动导致已有功能退化
评分细则/打分标准
正弦式位置编码
创建子进程
吞吐量,单位时间处理量
三字符或三词的切片单位
真实性与抗误导问答评测基准
通用唯一标识符
跨站脚本注入攻击