AI 发音速查 · InferLoop（递归客）

算力硬件7

CUDA

/ˈkuːdə/库达

NVIDIA 的 GPU 并行计算平台，深度学习算力的底座

读法备注读作「库达」（KOO-dah），不是按字母 C-U-D-A，也不是英文拼读的 KYOO-da

Google 翻译验证官网

cuDNN

库-D-N-N

NVIDIA 的深度学习 GPU 加速库，框架底层都在调它

读法备注读作 koo-D-N-N（CUDA 的 cu + 逐字母 DNN）

Google 翻译验证官网

HBM

艾奇比艾姆

GPU 上的高带宽显存

Google 翻译验证维基

NCCL

尼克尔

NVIDIA 多 GPU 集合通信库

Google 翻译验证 GitHub

NVIDIA

/ɛnˈvɪdiə/英伟达

主流 AI GPU 厂商英伟达

Google 翻译验证官网

NVLink

恩维林克

GPU 间高速互联总线

Google 翻译验证维基

VRAM

微拉姆

显卡显存容量

Google 翻译验证维基

训练微调12

QLoRA

Q-萝拉

量化版 LoRA，在 4-bit 量化模型上做轻量微调

读法备注读作 cue-萝拉（Q + LoRA），不是逐字母 Q-L-O-R-A

Google 翻译验证 GitHub

LoRA

萝拉

低秩适配，最常用的大模型轻量微调方法

读法备注Low-Rank Adaptation 缩写，读作「萝拉」，不要读成 L-O-R-A

Google 翻译验证 GitHub

RLHF

R-L-H-F（逐字母）

基于人类反馈的强化学习，对齐模型的主流方法

读法备注逐字母读 R-L-H-F，没有整词读法

人类反馈强化学习

Google 翻译验证维基

DPO

D-P-O（逐字母）

直接偏好优化，比 RLHF 更简单的对齐方法

读法备注逐字母读 D-P-O

Google 翻译验证 GitHub

SFT

S-F-T（逐字母）

监督微调，用标注数据继续训练模型

读法备注逐字母读 S-F-T

监督微调

Google 翻译验证维基

Quantization

/ˌkwɑːntaɪˈzeɪʃən/宽太制申

把权重降精度（如 4-bit）以省显存、提速

Google 翻译验证维基

Epoch

/ˈepək/诶剖克

训练时完整过一遍数据集的轮次

读法备注ML 圈常读「诶剖克」(EP-uhk)，也有人读 ee-pock，两种都听得到

Google 翻译验证维基

AdamW

亚当达不溜

带权重衰减的 Adam 优化器

Google 翻译验证官网

FSDP

艾府艾斯迪皮

PyTorch 全分片数据并行

Google 翻译验证官网

Hessian

/ˈhɛsiən/赫西安

损失函数的二阶导数矩阵

Google 翻译验证维基

PEFT

佩夫特

参数高效微调方法库

Google 翻译验证 GitHub

ZeRO

泽罗

DeepSpeed 的显存分片优化技术

Google 翻译验证 GitHub

推理部署12

FlashAttention

弗莱什-额田神

省显存、加速的 Attention 算子实现

Google 翻译验证 GitHub

vLLM

V-L-L-M（逐字母）

高吞吐的大模型推理服务框架（PagedAttention）

读法备注逐字母读 V-L-L-M

Google 翻译验证 GitHub

TensorRT

田搜-R-T

NVIDIA 的推理优化编译器与运行时

读法备注读作 Tensor-R-T

Google 翻译验证 GitHub

ONNX

奥尼克斯

跨框架的开放神经网络模型交换格式

读法备注读作「奥尼克斯」(ON-nix，像 onyx)，不是逐字母 O-N-N-X

Google 翻译验证 GitHub

KV Cache

K-V-卡什

缓存注意力的键值，避免重复计算、加速生成

读法备注读 K-V cache，cache 读「卡什」(cash)，不是「ca-chee」

Google 翻译验证维基

Triton

/ˈtraɪtən/踹疼

GPU kernel 编程语言 / NVIDIA 推理服务器（同名两物）

Google 翻译验证 GitHub

AWQ

诶达不溜Q

激活感知权重量化，低比特压缩

Google 翻译验证 GitHub

GPTQ

吉皮提丘

基于二阶信息的训练后量化

Google 翻译验证 GitHub

PagedAttention

佩吉德阿滕逊

分页管理 KV 显存的注意力实现

Google 翻译验证 GitHub

SGLang

艾斯吉浪

高性能 LLM 推理服务框架

Google 翻译验证 GitHub

TPOT

提批欧提

每个输出 token 的平均生成耗时

Google 翻译验证官网

TTFT

提提埃弗提

首 token 延迟，请求到首字耗时

Google 翻译验证官网

模型厂商34

Transformer

/trænsˈfɔːrmər/穿斯福默

几乎所有现代大模型的底层神经网络架构

Google 翻译验证维基

Attention

/əˈtenʃən/额田神

Transformer 的核心机制，按相关性给信息加权

Google 翻译验证维基

Embedding

/ɪmˈbedɪŋ/因贝丁

把文本或图像映射成稠密向量的表示

Google 翻译验证维基

Tokenizer

/ˈtoʊkənaɪzər/头肯奈泽

把文本切成 token 的分词器，模型的输入第一关

Google 翻译验证维基

MoE

谋（Mixture of Experts）

混合专家，按需只激活部分参数以低成本放大模型

读法备注读作「谋」(moh) 或逐字母 M-O-E 都有人用

Mixture of Experts混合专家

Google 翻译验证维基

Mistral

/mɪˈstrɑːl/米斯特拉尔

法国 Mistral AI 的开源模型系列

读法备注源自法语（一种风名），重音偏后，读「米斯特拉尔」

Google 翻译验证官网

Qwen

群（近似）

阿里通义千问开源模型系列

读法备注官方即「通义千问」；英文读音社区有 /kwɛn/ 与 /tʃwɛn/ 两种，未统一

通义千问

Google 翻译验证 GitHub

Llama

/ˈlɑːmə/拉马

Meta 开源大模型系列

Google 翻译验证 GitHub

Diffusion

/dɪˈfjuːʒən/迪福认

扩散模型，图像/视频生成的主流架构

Google 翻译验证维基

GELU

格卢

高斯误差线性单元，平滑激活函数

Google 翻译验证官网

GQA

吉Q诶

分组查询注意力，省 KV 缓存显存

Google 翻译验证官网

RoPE

/roʊp/肉普

旋转位置编码

Google 翻译验证 GitHub

SwiGLU

斯威格鲁

Transformer 前馈层门控激活函数

Google 翻译验证官网

Anthropic

/ænˈθrɒpɪk/安斯罗皮克

Claude 背后的 AI 公司

Google 翻译验证官网

BART

/bɑːrt/巴特

去噪自编码的序列到序列预训练模型

Google 翻译验证 GitHub

BERT

/bɜːrt/伯特

双向编码器预训练语言模型

Google 翻译验证 GitHub

Codex

/ˈkoʊdɛks/扣德克斯

OpenAI 代码生成模型及 CLI

Google 翻译验证 GitHub

Cohere

/koʊˈhɪər/科希尔

提供嵌入与重排模型的厂商

Google 翻译验证官网

DeepSeek

迪普西克

国产开源大模型与 API 提供方

Google 翻译验证 GitHub

DistilBERT

迪斯提尔伯特

蒸馏压缩的轻量版 BERT

Google 翻译验证官网

Gemini

/ˈdʒɛmɪnaɪ/杰米奈

谷歌的多模态大语言模型

Google 翻译验证官网

GGUF

吉吉尤艾弗

llama.cpp 的模型量化文件格式

Google 翻译验证 GitHub

GPT

吉皮提

自回归生成式预训练模型

Google 翻译验证维基

LayerNorm

雷耶诺姆

按层归一化激活值，稳定训练

Google 翻译验证官网

Multimodal

/ˌmʌltiˈmoʊdl/马尔提莫德尔

同时处理文本图像音频的能力

Google 翻译验证维基

Opus

/ˈoʊpəs/欧帕斯

Claude 顶配档，也指音频编码格式

Google 翻译验证官网

ReLU

雷鲁

修正线性单元激活函数

Google 翻译验证维基

ResNet

瑞斯奈特

带残差连接的深度卷积网络

Google 翻译验证维基

RoBERTa

罗伯塔

优化训练流程的 BERT 改进版

Google 翻译验证 GitHub

Seq2Seq

西克土西克

序列到序列编码解码架构

Google 翻译验证维基

Softmax

/ˈsɒftmæks/索夫特马克斯

把向量归一化为概率分布的函数

Google 翻译验证维基

T5

提五

文本到文本统一框架模型

Google 翻译验证 GitHub

Voyage

/ˈvɔɪɪdʒ/沃伊吉

高质量 embedding/rerank 模型厂商

Google 翻译验证官网

Word2Vec

沃德吐唯克

经典词向量训练模型

Google 翻译验证维基

Agent 应用10

LangChain

朗-链

最流行的 LLM 应用编排框架之一

Google 翻译验证 GitHub

LlamaIndex

拉马-引得克斯

面向 RAG 的数据接入与索引框架

Google 翻译验证 GitHub

Agentic

/eɪˈdʒentɪk/诶-真踢克

让模型自主规划、调用工具完成任务的范式

读法备注读「诶-真踢克」(ay-JEN-tik)

Google 翻译验证维基

MCP

M-C-P（逐字母）

模型上下文协议，给 Agent 接外部工具/数据的标准

读法备注逐字母读 M-C-P

Model Context Protocol

Google 翻译验证官网

LangGraph

朗格拉夫

基于有向图的 Agent 编排框架

Google 翻译验证 GitHub

Mem0

麦姆零

给 AI 应用加记忆层的框架

Google 翻译验证 GitHub

MemGPT

麦姆吉皮提

分层记忆的 Agent 架构

Google 翻译验证 GitHub

ReAct

riˈækt瑞埃克特

推理与行动交替执行的循环模式

Google 翻译验证官网

Reflexion

rɪˈflɛkʃən瑞弗莱克申

在循环里加反思层的执行模式

Google 翻译验证 GitHub

Trajectory

/trəˈdʒɛktəri/特拉杰克特瑞

一次 Agent 运行的完整步骤账本

Google 翻译验证维基

检索增强18

RAG

拉格

检索增强生成，给大模型外挂知识库

读法备注当一个单词读（rag），不逐字母 R-A-G

Google 翻译验证维基

Faiss

费斯

Facebook 开源的高效向量检索库

读法备注Facebook AI Similarity Search；社区读法有「face」与「fice」两种

Google 翻译验证 GitHub

Pinecone

/ˈpaɪnkoʊn/拍恩-寇恩

托管式向量数据库服务

Google 翻译验证官网

BGE

比鸡伊

智源开源的文本嵌入模型

Google 翻译验证 GitHub

BM25

比埃姆二十五

经典关键词检索打分算法

Google 翻译验证维基

Chroma

/ˈkroʊmə/克罗马

轻量本地向量数据库

Google 翻译验证 GitHub

ColBERT

科尔伯特

基于晚交互的检索模型

Google 翻译验证 GitHub

HNSW

艾奇恩艾斯达不溜

分层可导航小世界向量索引

Google 翻译验证 GitHub

HyDE

/haɪd/海德

先生成假设答案再去检索的RAG技术

Google 翻译验证 GitHub

Milvus

米尔维斯

开源向量数据库

Google 翻译验证 GitHub

MMR

埃姆埃姆阿尔

兼顾相关性与多样性的检索重排

Google 翻译验证官网

Neo4j

尼欧佛杰

主流图数据库，按节点和关系存数据

Google 翻译验证 GitHub

pgvector

屁记维克特

PostgreSQL 向量检索扩展

Google 翻译验证 GitHub

Qdrant

夸准特

开源向量数据库

Google 翻译验证 GitHub

RAGAS

瑞格斯

RAG 流水线自动评估框架

Google 翻译验证 GitHub

Reranker

ˌriːˈræŋkər瑞兰克

对初检结果重新打分排序的组件

Google 翻译验证维基

Retriever

rɪˈtriːvər瑞翠弗

按查询返回相关文档的检索组件

Google 翻译验证维基

Weaviate

维维埃特

开源向量数据库

Google 翻译验证 GitHub

基础设施44

Kubernetes

库伯内提斯

容器编排系统，云原生部署的事实标准

读法备注重音在 ber；常简称 k8s（kay-eights）

k8s

Google 翻译验证 GitHub

kubectl

cube-控逃（cube control）

Kubernetes 的命令行客户端

读法备注社区读法有 cube-control / cube-cuttle / kube-C-T-L 三种，官方倾向 cube-control

Google 翻译验证 GitHub

nginx

恩静-埃克斯（engine X）

高性能 Web 服务器与反向代理

读法备注读作 engine-X，不是按字母拼

Google 翻译验证官网

Daemon

/ˈdiːmən/滴萌

后台常驻进程（如 dockerd）

读法备注读作 dee-mun，不是 day-mon

Google 翻译验证维基

Grafana

/ɡrəˈfɑːnə/格拉法纳

最流行的指标可视化与监控面板

读法备注官方读「格拉法纳」(gra-FAH-na)

Google 翻译验证 GitHub

etcd

et-see-dee

Kubernetes 用的分布式键值存储

读法备注官方读 et-see-dee（取自 /etc 目录 + distributed），不是 etc-d

Google 翻译验证 GitHub

Ceph

/ˈsɛf/赛夫

开源分布式存储系统

读法备注读作「赛夫」(seff)

Google 翻译验证 GitHub

cron

/krɒn/克朗

按时间表自动触发的定时任务调度

Google 翻译验证维基

Azure

/ˈæʒər/阿热

微软云平台

Google 翻译验证官网

bcrypt

比克瑞普特

密码加盐哈希算法

Google 翻译验证维基

Bearer

/ˈbɛərər/贝尔瑞

HTTP 鉴权头里的令牌前缀

Google 翻译验证官网

chroot

吃如特

改变根目录的隔离机制

Google 翻译验证维基

Envoy

/ˈɛnvɔɪ/恩沃伊

云原生 L7 代理与边车

Google 翻译验证 GitHub

gRPC

吉阿尔皮西

高性能跨语言 RPC 通信框架

Google 翻译验证 GitHub

HMAC

艾奇麦克

基于哈希的消息认证码

Google 翻译验证维基

InfiniBand

/ˈɪnfɪniˌbænd/因菲尼班德

高性能集群网络互联技术

Google 翻译验证维基

Ingress

/ˈɪŋɡrɛs/英格瑞斯

K8s 入口流量路由

Google 翻译验证官网

JWT

/dʒɒt/乔特

JSON 网络令牌，用于鉴权

Google 翻译验证官网

Kafka

/ˈkæfkə/卡夫卡

分布式消息队列

Google 翻译验证 GitHub

ngrok

恩格罗克

内网穿透与隧道工具，暴露本地端口

Google 翻译验证官网

Nonce

/nɒns/农斯

一次性随机数，防重放攻击

Google 翻译验证维基

OAuth

欧奥斯

开放授权协议，第三方免密授权

Google 翻译验证官网

OpenTelemetry

欧盆特莱默崔

业界标准可观测性框架

Google 翻译验证官网

POSIX

/ˈpɒzɪks/泡兹克斯

Unix 系统接口标准

Google 翻译验证维基

Postgres

/ˈpoʊstɡrɛs/泡斯特格瑞斯

开源关系型数据库 PostgreSQL 简称

Google 翻译验证官网

Prometheus

/prəˈmiːθiəs/普罗米修斯

主流指标监控系统

Google 翻译验证 GitHub

PTY

屁踢歪

伪终端，承载交互式命令

Google 翻译验证维基

QPS

抠批艾斯

每秒请求/查询数，衡量吞吐

Google 翻译验证维基

RDMA

啊滴艾姆诶

绕过 CPU 的远程内存直接访问

Google 翻译验证维基

Redis

ˈrɛdɪs瑞迪斯

内存键值数据库/缓存

Google 翻译验证 GitHub

Sentinel

/ˈsentɪnəl/森提奈尔

Redis 高可用哨兵

Google 翻译验证官网

SQLite

艾斯酷艾来特

嵌入式单文件关系数据库

Google 翻译验证官网

SSE

艾斯艾斯伊

服务端推送事件流

Google 翻译验证维基

stdio

斯坦德艾欧

标准输入输出流

Google 翻译验证维基

Supabase

苏帕贝斯

开源后端即服务平台

Google 翻译验证 GitHub

systemd

西斯特姆弟

Linux 系统与服务管理器

Google 翻译验证 GitHub

Tailscale

/ˈteɪlskeɪl/泰尔斯凯尔

基于 WireGuard 的组网工具

Google 翻译验证 GitHub

Telemetry

/təˈlɛmətri/特莱默崔

遥测，系统运行指标采集上报

Google 翻译验证维基

Temporal

/ˈtɛmpərəl/坦泊罗

持久化工作流编排引擎

Google 翻译验证 GitHub

TLS

提艾勒艾斯

传输层安全加密协议

Google 翻译验证维基

TPM

提批埃姆

每分钟 token 数限额

Google 翻译验证官网

Vault

/vɔːlt/沃特

密钥与凭据集中管理服务

Google 翻译验证 GitHub

Vercel

/vɜːrˈsɛl/沃赛尔

前端部署与 Serverless 托管平台

Google 翻译验证官网

WAL

沃尔

预写日志，改数据前先记日志

Google 翻译验证维基

工具链48

Ollama

/oʊˈlɑːmə/欧拉马

本地一键跑开源大模型的工具

读法备注读「欧-拉-马」(oh-LAH-mah)

Google 翻译验证 GitHub

Hugging Face

哈金-费斯

最大的开源模型与数据集社区平台

Google 翻译验证官网

Regex

瑞-杰克斯 / 瑞-给克斯

正则表达式（regular expression）的简称

读法备注g 软读「瑞-杰克斯」(REJ-ex) 与硬读「瑞-给克斯」(REG-ex) 两派并存

Google 翻译验证维基

BPE

比皮伊

字节对编码分词算法

Google 翻译验证维基

Bun

/bʌn/邦

快速 JS 运行时与打包器

Google 翻译验证 GitHub

Canonical

/kəˈnɒnɪkəl/卡农尼科

规范或标准形式

Google 翻译验证维基

Drizzle

/ˈdrɪzəl/锥泽尔

TypeScript 类型安全 ORM

Google 翻译验证 GitHub

esbuild

伊埃斯比尔德

Go 写的高速 JS/TS 打包器

Google 翻译验证 GitHub

ESLint

伊埃斯林特

JavaScript 代码静态检查工具

Google 翻译验证 GitHub

Fastify

/ˈfæstɪfaɪ/法斯特法伊

高性能 Node.js Web 框架

Google 翻译验证 GitHub

Harness

/ˈhɑːrnɪs/哈尼斯

评测脚手架/执行框架

Google 翻译验证维基

Helm

/hɛlm/赫尔姆

Kubernetes 应用包管理器

Google 翻译验证 GitHub

Hono

霍诺

轻量级边缘 Web 框架

Google 翻译验证 GitHub

Jaeger

/ˈjeɪɡər/耶格

分布式链路追踪系统

Google 翻译验证 GitHub

JSON-RPC

杰森阿批西

基于 JSON 的远程调用协议

Google 翻译验证官网

JSONL

杰森艾勒

每行一条 JSON 的文件格式

Google 翻译验证官网

Kotlin

/ˈkɒtlɪn/科特林

运行于 JVM 的现代编程语言

Google 翻译验证 GitHub

LangSmith

朗史密斯

LangChain 官方可观测与评估平台

Google 翻译验证官网

Linter

/ˈlɪntər/林特

静态检查代码风格与错误的工具

Google 翻译验证维基

LiteLLM

莱特埃尔埃尔姆

统一调用多家大模型 API 的代理库

Google 翻译验证 GitHub

LSP

埃尔埃斯皮

编辑器与语言服务通信的协议

Google 翻译验证官网

Lua

/ˈluːə/卢阿

轻量级可嵌入脚本语言

Google 翻译验证官网

Mermaid

/ˈmɜːrmeɪd/默美德

用文本语法生成图表的工具

Google 翻译验证 GitHub

npx

恩皮埃克斯

npm 自带的包执行命令

Google 翻译验证官网

NumPy

/ˈnʌmpaɪ/那木派

Python 数值计算基础库

Google 翻译验证 GitHub

Pino

/ˈpiːnoʊ/屁诺

Node.js 高性能 JSON 日志库

Google 翻译验证 GitHub

pipx

屁普埃克斯

隔离安装 Python 命令行应用

Google 翻译验证 GitHub

Playwright

/ˈpleɪraɪt/普雷赖特

浏览器自动化测试框架

Google 翻译验证 GitHub

pnpm

屁恩屁姆

节省磁盘的 Node 包管理器

Google 翻译验证 GitHub

Prettier

/ˈprɪtiər/普瑞提儿

前端代码自动格式化工具

Google 翻译验证 GitHub

Puppeteer

/ˌpʌpɪˈtɪər/帕劈提尔

无头浏览器自动化库

Google 翻译验证 GitHub

Pydantic

派丹提克

Python 数据校验库

Google 翻译验证 GitHub

Pyright

派赖特

Python 静态类型检查器

Google 翻译验证 GitHub

PyTorch

派托奇

主流深度学习框架

Google 翻译验证 GitHub

REPL

瑞剖

读取-求值-打印循环交互环境

Google 翻译验证维基

Scaffold

ˈskæfəld斯卡佛德

自动生成项目骨架代码

Google 翻译验证维基

semver

赛姆沃

语义化版本号规范

Google 翻译验证官网

SentencePiece

/ˈsentəns piːs/森滕斯皮斯

无需预分词的子词分词工具

Google 翻译验证 GitHub

Tavily

塔维利

面向 Agent 的联网搜索 API

Google 翻译验证 GitHub

tiktoken

提克托肯

OpenAI 的 BPE 分词与 token 计数库

Google 翻译验证 GitHub

tmux

提马克斯

终端多路复用器，管理多会话

Google 翻译验证 GitHub

TOML

托莫

一种易读的配置文件格式

Google 翻译验证 GitHub

TUI

提优艾

终端富文本交互界面

Google 翻译验证维基

Vite

/viːt/维特

快速的前端构建工具

Google 翻译验证 GitHub

Vitest

维泰斯特

基于 Vite 的单元测试框架

Google 翻译验证 GitHub

YAML

亚谬

常用配置文件格式

Google 翻译验证官网

Zod

/zɒd/佐德

TypeScript 优先的 schema 校验库

Google 翻译验证 GitHub

Zustand

/ˈtsuːʃtant/楚施坦特

React 轻量状态管理库

Google 翻译验证 GitHub

工程概念54

SOTA

搜塔

State of the Art，当前最佳水平

读法备注口语常读作 so-ta；也有人逐字母 S-O-T-A

Google 翻译验证维基

Vibe Coding

外伯-寇丁

凭感觉让 AI 写代码的开发方式，2025 年流行词

Google 翻译验证维基

Hallucination

/həˌluːsɪˈneɪʃən/哈鲁西内申

模型一本正经地编造不实内容

Google 翻译验证维基

Deprecated

/ˈdeprəkeɪtɪd/戴普日凯特

（接口/功能）已不推荐使用、将被废弃

读法备注读「戴普日-凯踢德」(DEP-ri-kay-tid)，常被误读为 de-PRE-cated

Google 翻译验证维基

Cache

/kæʃ/卡什

缓存

读法备注读「卡什」(cash)，不是「ca-chee」也不是「cash-ay」

Google 翻译验证维基

Schema

/ˈskiːmə/斯基马

数据的结构定义 / 模式

读法备注读「斯基马」(SKEE-ma)

Google 翻译验证维基

Async

诶-辛克

异步（asynchronous 的简称）

读法备注常读「诶-辛克」(AY-sink)，也有人读 a-sink

Google 翻译验证维基

GUI

古异（gooey）

图形用户界面

读法备注口语常读「古异」(gooey)，也有人逐字母 G-U-I

Google 翻译验证维基

SQL

西扣（sequel）/ S-Q-L

结构化查询语言，关系数据库的通用语言

读法备注「sequel」(西扣) 与逐字母 S-Q-L 两派经久不息，官方原读 sequel

Google 翻译验证维基

Logits

/ˈloʊdʒɪts/楼吉茨

softmax 前的原始打分向量

Google 翻译验证维基

Perplexity

/pərˈpleksɪti/帕普莱克西提

困惑度，衡量语言模型预测能力

Google 翻译验证维基

Ablation

/əˈbleɪʃən/阿布雷申

消融实验，逐一移除组件看影响

Google 翻译验证维基

ANSI

/ˈænsi/安西

终端控制与转义码标准

Google 翻译验证维基

AST

诶S提

抽象语法树

Google 翻译验证维基

Backpressure

/ˈbækˌpreʃər/巴克普雷舍

背压，下游过载时反向限流

Google 翻译验证维基

Calibration

/ˌkælɪˈbreɪʃən/卡利布瑞申

校准：置信度与真实准确率对齐

Google 翻译验证维基

Closure

/ˈkloʊʒər/克洛热

闭包，捕获外层变量的函数

Google 翻译验证维基

Coroutine

/ˌkoʊruːˈtiːn/寇路廷

可挂起恢复的协作式执行单元

Google 翻译验证维基

Corpus

/ˈkɔːrpəs/寇帕斯

用于训练或检索的文本语料集合

Google 翻译验证维基

CSRF

西瑟夫

跨站请求伪造攻击

Google 翻译验证维基

Debounce

/dɪˈbaʊns/迪邦斯

防抖：等停顿后才执行一次

Google 翻译验证官网

Deterministic

/dɪˌtɜːrmɪˈnɪstɪk/迪特米尼斯提克

确定性：相同输入必得相同输出

Google 翻译验证维基

Elo

/ˈiːloʊ/伊洛

模型对战排名的等级分

Google 翻译验证维基

Ephemeral

/ɪˈfɛmərəl/伊费摩罗

临时、短生命周期的

Google 翻译验证维基

Flaky

/ˈfleɪki/弗雷基

时过时不过的不稳定测试

Google 翻译验证维基

GSM8K

吉艾斯艾姆八K

小学数学题推理评测基准

Google 翻译验证 GitHub

HellaSwag

海拉斯瓦格

常识推理评测基准

Google 翻译验证 GitHub

Heuristic

/hjʊˈrɪstɪk/休瑞斯提克

启发式，靠经验规则判断

Google 翻译验证维基

HumanEval

休曼伊瓦尔

代码生成能力评测基准

Google 翻译验证 GitHub

Idempotent

/aɪˈdɛmpətənt/艾丹波疼特

重复执行结果不变的幂等性

Google 翻译验证维基

Jitter

/ˈdʒɪtər/吉特

重试退避时加的随机抖动

Google 翻译验证维基

Kappa

/ˈkæpə/卡帕

衡量标注者一致性的系数

Google 翻译验证维基

Latency

/ˈleɪtənsi/雷藤西

延迟

Google 翻译验证维基

LCEL

艾尔西伊艾尔

LangChain 声明式链编排表达式语言

Google 翻译验证官网

Levenshtein

/ˈlɛvənʃtaɪn/莱文施泰因

编辑距离，衡量两字符串的差异

Google 翻译验证维基

MMLU

埃姆埃姆埃尔尤

多任务知识理解评测基准

Google 翻译验证维基

Mutex

/ˈmjuːtɛks/缪特克斯

互斥锁，保护并发临界区

Google 翻译验证维基

n-gram

/ɛn ɡræm/恩格拉姆

连续 n 个词或字符的片段

Google 翻译验证维基

NER

纳尔

命名实体识别，从文本抽人名地名等

Google 翻译验证维基

Orthogonal

/ɔːrˈθɒɡənəl/奥骚格闹

正交，各维度互不影响

Google 翻译验证维基

Paradigm

/ˈpærədaɪm/派瑞戴姆

范式，一套主流的做事框架

Google 翻译验证维基

pass@k

帕斯爱特K

采样 k 次至少一次正确的概率

Google 翻译验证 GitHub

Percentile

/pərˈsɛntaɪl/帕森泰尔

统计分位数，如 p95 延迟

Google 翻译验证维基

Recall

rɪˈkɔːl瑞抠

召回率，查全程度的指标

Google 翻译验证维基

Regression

rɪˈɡrɛʃən瑞格瑞申

回归：改动导致已有功能退化

Google 翻译验证维基

Rubric

ˈruːbrɪk鲁布瑞克

评分细则/打分标准

Google 翻译验证维基

Sinusoidal

/ˌsaɪnəˈsɔɪdəl/赛纽索伊德尔

正弦式位置编码

Google 翻译验证维基

Spawn

/spɔːn/斯朋

创建子进程

Google 翻译验证维基

Throughput

/ˈθruːpʊt/思鲁璞特

吞吐量，单位时间处理量

Google 翻译验证维基

Trigram

/ˈtraɪɡræm/特莱格拉姆

三字符或三词的切片单位

Google 翻译验证维基

TruthfulQA

特鲁斯弗 Q A

真实性与抗误导问答评测基准

Google 翻译验证 GitHub

UUID

优优艾迪

通用唯一标识符

Google 翻译验证维基

XSS

艾克斯艾斯艾斯

跨站脚本注入攻击

Google 翻译验证维基