技术词汇表

本仓库所有文档中出现的专业术语、缩写、框架名、工具名、算法名、概念名的系统性整理。

一、AI 基础概念

术语	全称 / 说明
LLM	Large Language Model，大语言模型
VLM	Vision Language Model，视觉语言模型
SLM	Small Language Model，小语言模型
MoE	Mixture of Experts，混合专家架构
SFT	Supervised Fine-Tuning，监督微调
RLHF	Reinforcement Learning from Human Feedback，基于人类反馈的强化学习
CFG	Classifier-Free Guidance，无分类器引导
Temperature	模型生成时的随机性参数，值越大输出越随机
Top-K / Top-P	采样策略参数，控制生成时的 token 候选范围
Context Window	上下文窗口，模型单次能处理的最大 token 数
Token	模型处理文本的最小单位，约等于 0.75 个中文词
Prompt	提示词，用户输入给模型的指令文本
System Prompt	系统提示词，定义模型角色和行为的固定指令
Few-shot	少样本学习，给模型提供几个示例来引导输出
Chain of Thought (CoT)	思维链，引导模型逐步推理
Function Calling	函数调用，模型输出格式化参数调用外部函数
SSE	Server-Sent Events，服务器推送事件，用于流式输出
JSON Schema	JSON 数据结构的约束描述格式
PagedAttention	vLLM 的 KV Cache 分页管理技术
RadixAttention	SGLang 的基数树 KV Cache 复用技术
Flash Attention	一种高效注意力计算算法
KV Cache	Key-Value 缓存，加速自回归生成
Speculative Decoding	推测解码，小模型打草稿大模型验证
Prefix Caching	前缀缓存，共享前缀请求复用 KV Cache
AWQ / GPTQ	模型量化格式（4-bit/8-bit 权重压缩）
GGUF	llama.cpp 生态的模型量化格式
EXL2	ExLlamaV2 的细粒度量化格式
LoRA	Low-Rank Adaptation，低秩微调技术
Dreambooth	全量微调技术，重新训练整个模型
Embedding	嵌入向量，将文本/图像映射为高维向量
Quantization	量化，降低模型权重精度以节省显存

二、RAG（检索增强生成）

术语	全称 / 说明
RAG	Retrieval-Augmented Generation，检索增强生成
Agentic RAG	让 LLM 自主决策检索策略的 RAG 变体
Naive RAG	基础 RAG，三段式：索引→检索→生成
Advanced RAG	进阶 RAG，加入查询改写、重排序等优化
Modular RAG	模块化 RAG，可自由组合功能模块
Graph RAG	基于知识图谱的 RAG
Chunk	文档切分后的文本块
Chunk Size	文本块大小
Chunk Overlap	文本块之间的重叠长度
RecursiveCharacterTextSplitter	LangChain 的递归字符切割器
Semantic Chunking	语义切割，按语义相似度切分文档
Parent-Child Chunk	父子块策略，小块检索、大块返回上下文
Embedding	向量化，将文本转为稠密向量
Bi-Encoder	双编码器，分别编码查询和文档为向量
Cross-Encoder	交叉编码器，同时处理查询和文档对
Re-rank / Reranker	重排序，对初步检索结果精细化排序
BGE-Reranker	智源研究院的开源重排序模型
Cohere Rerank	Cohere 的商业重排序 API
BM25	词频-逆文档频率的经典全文检索算法
Hybrid Search	混合检索（向量检索 + 关键词检索）
Multi-Recall / 多路召回	多种检索策略并行，合并结果
RRF	Reciprocal Rank Fusion，倒数排名融合算法
Dense Retrieval	稠密检索，基于 Embedding 的向量检索
Sparse Retrieval	稀疏检索，基于词频的检索（如 BM25）
HyDE	Hypothetical Document Embeddings，假设文档嵌入
Query Rewriting	查询改写，LLM 将用户问题改写成更优检索形式
Multi-Query	多查询扩展，一个用户问题生成多个子查询
HNSW	Hierarchical Navigable Small World，近似最近邻索引
IVF	Inverted File Index，倒排文件索引
ANN	Approximate Nearest Neighbor，近似最近邻搜索
Faithfulness	忠实度，回答是否基于检索内容
Hallucination	幻觉，模型生成不基于事实的内容
RAGAS	RAG Assessment，RAG 评估框架
DeepEval	与 pytest/CI 集成的 RAG 评测框架
TruLens	侧重线上观测的 RAG 评测工具
LLM Wiki	Karpathy 提出的个人知识库模式
Golden Dataset	黄金测试数据集
Context Precision	上下文精确率，召回的 chunk 中有多少真正有用
Context Recall	上下文召回率，必须的信息是否都被召回
Answer Relevancy	答案相关性，回答是否真正回应用户问题
Hit Rate	命中率，检索质量指标
MRR	Mean Reciprocal Rank，平均倒数排名
NDCG	Normalized Discounted Cumulative Gain，归一化折损累计增益
Milvus	开源向量数据库
Pinecone	全托管向量数据库 SaaS
Weaviate	支持混合检索的开源向量数据库
Qdrant	Rust 编写的高性能向量数据库
Chroma	轻量级向量数据库（Python 原生）
FAISS	Meta 开源的向量相似度搜索库
pgvector	PostgreSQL 的向量扩展插件
Dify	开源 LLM 应用开发平台
RagFlow	开源 RAG 引擎
LLaMAIndex	连接 LLM 和外部数据的框架
LangChain	LLM 应用开发框架
LangGraph	LangChain 的图编排框架
LCEL	LangChain Expression Language，链式表达式语言
Runnable	LangChain 可执行组件基类
RunnableParallel	LangChain 并行执行组件
RunnableBranch	LangChain 路由组件
LangFuse	LLM 可观测性平台
LangSmith	LangChain 官方 LLM 调试平台

三、Agent

术语	全称 / 说明
Agent	智能体，能自主推理、调用工具、执行任务的 AI 系统
ReAct	Reasoning + Acting，推理-行动-观察循环范式
Plan-and-Execute	先规划再执行的 Agent 范式
Plan-and-Solve	规划-求解范式
Reflection	反思范式，Agent 自我审视和修正
Multi-Agent	多智能体协作系统
Tool Calling	工具调用，LLM 选择并调用外部工具
Tool Registry	工具注册中心，管理所有可用工具
MCP	Model Context Protocol，模型上下文协议
MCP Server	MCP 服务端，提供工具/资源/提示
MCP Client	MCP 客户端，连接 LLM 和 MCP Server
Function Calling	模型厂商提供的结构化输出能力
JSON-RPC 2.0	MCP 使用的远程调用协议
STDIO Transport	MCP 本地通信方式（标准输入输出）
Streamable HTTP	MCP 远程通信方式
SSE	Server-Sent Events，MCP 远程通信（已弃用）
Code Agent	能自动生成并执行代码的 Agent
Supervisor Agent	主管 Agent，负责任务分发和协调
Orchestrator	编排器，协调多个 Agent 执行流程
State Machine	状态机，Agent 执行状态管理
Harness Engineering	驾驭工程，围绕 Agent 构建约束和管控体系
PocketFlow	轻量级 Agent 状态机（项目中自研）
Max Iterations	Agent 最大迭代次数，防止死循环
Signal (Temporal)	Temporal 的人机交互信号机制
Checkpoint	检查点，Agent 执行的中间状态保存
Fan-Out	并行分发，同时处理多个子任务
Parent-Child Workflow	Temporal 的父子工作流模式
Deterministic Workflow	确定性工作流
Activity	Temporal 中执行 I/O 操作的任务单元
Workflow	Temporal 中编排 Activity 的工作流定义
Task Queue	Temporal 的任务队列
LLM Gateway	LLM 网关，统一路由和管控模型调用
Guardrails	护栏，LLM 输出的安全约束
Fallback	降级，主服务失败时切换到备用
Load Balancing	负载均衡，将请求分发到多个实例
Retry	重试机制
Exponential Backoff	指数退避，递增重试间隔
Circuit Breaker	断路器，防止级联故障
Max Tokens	最大 token 限制
Rate Limiting	速率限制，控制请求频率
Tenant	租户，多租户隔离的最小单位
Token Budget	Token 预算分配策略
Context Compression	上下文压缩
Sliding Window	滑动窗口，保留最近 N 轮对话
Streaming	流式输出

四、Prompt Engineering

术语	全称 / 说明
Prompt Engineering	提示词工程，设计高质量 LLM 输入
Prompt Injection	Prompt 注入攻击，恶意指令覆盖原始指令
Direct Injection	直接注入，用户输入直接覆盖系统指令
Indirect Injection	间接注入，通过外部数据（网页/文档）注入指令
Context Isolation	上下文隔离，分隔指令和数据
Output Parser	输出解析器，将 LLM 输出转为结构化数据
Structured Output	结构化输出，强制 LLM 输出特定格式
JSON Repair	JSON 自动修复
YAML Prompt Management	YAML 版本化 Prompt 管理
Few-shot	少样本，在 Prompt 中提供示例
Zero-shot	零样本，不给示例直接提问
Role Prompting	角色设定，给模型赋予特定角色
Context Engineering	上下文工程，构建高质量输入信息

五、AI 图像生成

术语	全称 / 说明
GAN	Generative Adversarial Network，生成对抗网络
Generator	GAN 中的生成器
Discriminator	GAN 中的判别器
VAE	Variational Autoencoder，变分自编码器
VQ-VAE	Vector Quantized VAE，向量量化 VAE
Diffusion / 扩散模型	通过逐步去噪生成图像的模型范式
DDPM	Denoising Diffusion Probabilistic Models
LDM	Latent Diffusion Models，隐空间扩散模型
Latent Space	隐空间，VAE 压缩后的数学表示
Stable Diffusion (SD)	开源文生图模型
SDXL	Stable Diffusion XL，SD 的增强版
SD3 / SD 3.5	基于 MM-DiT 架构的 SD 最新版本
Flux.1	Black Forest Labs 开源文生图模型（12B 参数）
DiT	Diffusion Transformer，基于 Transformer 的扩散架构
MM-DiT	多模态扩散 Transformer
U-Net	SD 系列使用的卷积神经网络架构
Flow Matching	流匹配，扩散模型的替代数学生成范式
Rectified Flow	整流流，Flow Matching 的变体
ControlNet	控制图像生成的附加网络
Zero Convolution	ControlNet 使用的零卷积初始化
OpenPose	人体姿态估计，ControlNet 的条件输入之一
Canny	边缘检测算法，ControlNet 的条件输入之一
SAM 2	Segment Anything Model 2，Meta 的通用分割模型
Grounding DINO	图文理解模型，用于语言控制视觉定位
Grounded-SAM	Grounding DINO + SAM 的级联方案
YOLO	You Only Look Once，实时目标检测系列
DHash	差异哈希，图像相似度比较算法
BiRefNet	开源高精度抠图模型
BRIA RMBG	工业级背景去除模型
RVM	Robust Video Matting，视频抠像模型
MODNet	轻量级人像抠图模型
Matting	抠像/抠图，计算软透明度
Segmentation	图像分割，像素级分类
Inpainting	图像局部重绘
Outpainting	图像向外扩展
ComfyUI	节点式 AI 绘图工作流工具
WebUI (SD)	Stable Diffusion 的 Web 图形界面
KSampler	ComfyUI 中的核心采样器节点
Sampler / 采样算法	扩散模型的去噪算法
Euler / Euler a	欧拉采样器（a 为祖先采样）
DPM++	先进扩散采样算法系列
Scheduler / 调度器	控制去噪步长的策略
Karras	流行的调度器策略
Denoise / 重绘幅度	图生图中的原始内容保留程度
CFG Scale	提示词引导系数
CLIP	Contrastive Language-Image Pre-training，OpenAI 的图文对比预训练
Checkpoint	模型权重文件（底模）
LoRA	低秩微调，挂载在 U-Net/DiT 上的轻量补丁
AdaIN	Adaptive Instance Normalization，自适应实例归一化
StyleGAN	NVIDIA 的风格化生成模型系列
ProGAN	NVIDIA 的渐进式增长 GAN
CycleGAN	无配对图像翻译 GAN
Pix2Pix	配对图像翻译 GAN
WGAN	Wasserstein GAN，解决训练不稳定的 GAN
LCM	Latent Consistency Models，快速扩散模型
VLM / 视觉语言模型	能理解图像内容的语言模型
OCR	Optical Character Recognition，光学字符识别
MinerU	OpenDataLab 开源文档解析引擎
Qwen-VL	阿里通义的视觉语言模型
Knowdoc	项目中自研的多格式文档解析引擎
OFD	国标版式文件格式
safetensors	安全张量格式，模型权重存储标准
ckpt	Checkpoint 旧格式，基于 Pickle
Zero-copy	零拷贝，内存映射加载技术
SIMD	Single Instruction Multiple Data，单指令多数据
WASM	WebAssembly，浏览器高性能计算标准
Web Worker	浏览器多线程 API
Transferable Objects	可转移对象，零拷贝跨线程数据传递

六、基础知识 / 八股

术语	全称 / 说明
Transformer	基于自注意力机制的神经网络架构
Self-Attention	自注意力机制
Multi-Head Attention	多头注意力
BERT	Bidirectional Encoder Representations from Transformers
GPT	Generative Pre-trained Transformer
RNN	Recurrent Neural Network，循环神经网络
LSTM	Long Short-Term Memory，长短期记忆网络
CNN	Convolutional Neural Network，卷积神经网络
ResNet	残差网络，解决深层网络梯度消失
ViT	Vision Transformer，视觉 Transformer
MLP	Multi-Layer Perceptron，多层感知机
Batch Norm	批量归一化
Layer Norm	层归一化
Dropout	随机失活，防止过拟合
Gradient Vanishing	梯度消失
Gradient Exploding	梯度爆炸
Residual Connection	残差连接 / 跳跃连接
CJK	Chinese-Japanese-Korean，中日韩文字
Tokenizer	分词器
BPE	Byte Pair Encoding，字节对编码
Word2Vec	Google 提出的静态词向量技术
MinHash	最小哈希，近似去重算法
LSH	Locality-Sensitive Hashing，局部敏感哈希
Bloom Filter	布隆过滤器，快速存在性判断
RoaringBitmap	高效位图压缩算法

七、Vibe Coding / AI 编程工具

术语	全称 / 说明
Vibe Coding	感知编码，用自然语言描述需求让 AI 写代码
Claude Code	Anthropic 的终端 AI 编程助手
OpenCode	OhMyOpenCode，AI 编程 IDE
CLAUDE.md	Claude Code 的全局记忆配置
AGENTS.md	OpenCode 的全局规则（兼容 CLAUDE.md）
Skill / 技能	可复用的 AI 能力包
SKILL.md	技能的描述和执行文件
Subagent	子智能体，独立上下文的任务执行单元
Agent Team	多智能体团队，可互相通信的协作模式
Hook	钩子，在特定事件触发的自动化脚本
Plugin	插件，打包多个功能的完整方案
Checkpoint	对话状态快照，支持回退
Rewind	回退到之前的检查点
Superpowers	AI 编程的软件开发方法论技能集合
Ralph Loop	OhMyOpenCode 的自我迭代循环机制
Oh My OpenCode	多智能体协作的 AI 编程系统
Sisyphus	OhMyOpenCode 的主编排智能体
Hephaestus	OhMyOpenCode 的自主深度工作智能体
Prometheus	OhMyOpenCode 的战略规划智能体
Oracle	OhMyOpenCode 的架构顾问智能体
Librarian	OhMyOpenCode 的文档查询智能体
Explore	OhMyOpenCode 的代码探索智能体
Hermes Agent	自进化的 AI 助手（Harness Engineering 内建系统）
OpenClaw	配置即行为的 AI Agent 系统
Honcho	Hermes 的用户建模系统
FTS5	SQLite 全文搜索扩展
Everything Claude Code	Anthropic 黑客马拉松获奖的 Claude Code 配置集
Harness Engineering	驾驭工程，围绕 AI 构建约束和管控
LSP	Language Server Protocol，语言服务器协议
AST	Abstract Syntax Tree，抽象语法树
AST-grep	基于 AST 的代码搜索和重写工具
TDD	Test-Driven Development，测试驱动开发
Worktree	Git 工作树，隔离同时开发
Intent Gate	OhMyOpenCode 的意图识别门
Prometheus Plan	动手前先规划的访谈模式

八、微服务 / 架构

术语	全称 / 说明
BFF	Backend For Frontend，面向前端后端
API Gateway	API 网关，统一入口
Service Discovery	服务发现
Circuit Breaker	断路器模式
Config Center	配置中心
Load Balancer	负载均衡器
Monolithic	单体架构
Microservices	微服务架构
Horizontal Scaling	水平扩展
Distributed Tracing	分布式追踪
CQRS	Command Query Responsibility Segregation，命令查询职责分离
Event Sourcing	事件溯源

九、云原生 / DevOps

术语	全称 / 说明
Kubernetes / K8s	容器编排平台
Docker	容器引擎
Helm	K8s 包管理器
Pod	K8s 最小部署单元
Docker Compose	本地容器编排
GitLab CI/CD	GitLab 持续集成/部署流水线
Celery	Python 分布式任务队列
Temporal	分布式工作流引擎（替代 Celery 的升级方案）
Nginx	Web 服务器和反向代理
TLS	Transport Layer Security，传输层安全
NAT	Network Address Translation，网络地址转换
STUN	Session Traversal Utilities for NAT，NAT 穿透
MinIO	开源的 S3 兼容对象存储
Syncthing	开源的 P2P 文件同步工具
OBS	华为云对象存储
OSS	阿里云对象存储

十、项目经验相关

术语	全称 / 说明
bid.ai	国能智能评标平台项目
aios.ai	AI 基础设施服务项目（AIOS 智能体操作系统）
Knowdoc	项目自研文档解析引擎
PocketFlow	项目中自研的轻量级 Agent 状态机
国网样本中心	国家电网人工智能样本中心项目
Temporal	分布式工作流引擎
LiteLLM	统一 LLM 网关
vLLM	高性能 LLM 推理引擎
SGLang	LLM 推理引擎（RadixAttention）
Langfuse	LLM 可观测性平台
Dify	低代码 AI 应用平台
MinerU	高精度文档解析引擎
RagFlow	开源 RAG 引擎
Litestar	Python ASGI Web 框架
SQLModel	Python SQL 模型（SQLAlchemy + Pydantic）
SQLAlchemy	Python ORM 框架
FastAPI	Python 异步 Web 框架
NestJS	Node.js 后端框架
Koa	Node.js Web 框架（Express 团队）
Pinia	Vue 3 状态管理
UnoCSS	即时原子化 CSS 引擎
Ant Design Vue	Vue 组件库
Vite	前端构建工具
RxJS	Reactive Extensions for JavaScript
Monaco Editor	VS Code 的网页编辑器核心
ClickHouse	列式存储数据库
PostgreSQL	开源关系型数据库
Redis	内存数据库
Milvus	向量数据库
Neo4j	图数据库
MySQL	关系型数据库
asyncpg	PostgreSQL 异步驱动
Alembic	SQLAlchemy 数据库迁移工具
Pydantic	Python 数据校验库
Loguru	Python 结构化日志库
pytest	Python 测试框架
uv	快速的 Python 包管理器（Rust 编写）
UVICORN	Python ASGI 服务器
pnpm	快速的 Node.js 包管理器
Airflow	工作流调度平台（项目早期使用）
Rust/WASM	项目中用 Rust 编写图像算法编译为 WASM 运行
PDF.js	Mozilla 的 PDF 渲染库
Jinja2	Python 模板引擎
PowerPaint	全能图像编辑模型
BrushNet	即插即用局部重绘架构
Flux.1 Fill	基于 FLUX 的 Inpainting 模型
BGE	BAAI General Embedding，智源通用向量模型
BCEmbedding	网易有道的双语向量模型
Jina Embeddings	Jina AI 的多语言向量模型
Monorepo	单仓库多项目管理模式
Spin-off	项目拆分，从原项目独立出子项目
Citizen Developer	公民开发者，非专业程序员用 AI 构建应用
Ralph Loop	AI Agent 的自我迭代循环
Boulder	持续运行/重试机制
Momus	OhMyOpenCode 的计划审查智能体
Metis	OhMyOpenCode 的预规划咨询智能体

一、AI 基础概念​

二、RAG（检索增强生成）​

三、Agent​

四、Prompt Engineering​

五、AI 图像生成​

六、基础知识 / 八股​

七、Vibe Coding / AI 编程工具​

八、微服务 / 架构​

九、云原生 / DevOps​

十、项目经验相关​

一、AI 基础概念

二、RAG（检索增强生成）

三、Agent

四、Prompt Engineering

五、AI 图像生成

六、基础知识 / 八股

七、Vibe Coding / AI 编程工具

八、微服务 / 架构

九、云原生 / DevOps

十、项目经验相关