跳到主要内容

技术词汇表

本仓库所有文档中出现的专业术语、缩写、框架名、工具名、算法名、概念名的系统性整理。


一、AI 基础概念

术语全称 / 说明
LLMLarge Language Model,大语言模型
VLMVision Language Model,视觉语言模型
SLMSmall Language Model,小语言模型
MoEMixture of Experts,混合专家架构
SFTSupervised Fine-Tuning,监督微调
RLHFReinforcement Learning from Human Feedback,基于人类反馈的强化学习
CFGClassifier-Free Guidance,无分类器引导
Temperature模型生成时的随机性参数,值越大输出越随机
Top-K / Top-P采样策略参数,控制生成时的 token 候选范围
Context Window上下文窗口,模型单次能处理的最大 token 数
Token模型处理文本的最小单位,约等于 0.75 个中文词
Prompt提示词,用户输入给模型的指令文本
System Prompt系统提示词,定义模型角色和行为的固定指令
Few-shot少样本学习,给模型提供几个示例来引导输出
Chain of Thought (CoT)思维链,引导模型逐步推理
Function Calling函数调用,模型输出格式化参数调用外部函数
SSEServer-Sent Events,服务器推送事件,用于流式输出
JSON SchemaJSON 数据结构的约束描述格式
PagedAttentionvLLM 的 KV Cache 分页管理技术
RadixAttentionSGLang 的基数树 KV Cache 复用技术
Flash Attention一种高效注意力计算算法
KV CacheKey-Value 缓存,加速自回归生成
Speculative Decoding推测解码,小模型打草稿大模型验证
Prefix Caching前缀缓存,共享前缀请求复用 KV Cache
AWQ / GPTQ模型量化格式(4-bit/8-bit 权重压缩)
GGUFllama.cpp 生态的模型量化格式
EXL2ExLlamaV2 的细粒度量化格式
LoRALow-Rank Adaptation,低秩微调技术
Dreambooth全量微调技术,重新训练整个模型
Embedding嵌入向量,将文本/图像映射为高维向量
Quantization量化,降低模型权重精度以节省显存

二、RAG(检索增强生成)

术语全称 / 说明
RAGRetrieval-Augmented Generation,检索增强生成
Agentic RAG让 LLM 自主决策检索策略的 RAG 变体
Naive RAG基础 RAG,三段式:索引→检索→生成
Advanced RAG进阶 RAG,加入查询改写、重排序等优化
Modular RAG模块化 RAG,可自由组合功能模块
Graph RAG基于知识图谱的 RAG
Chunk文档切分后的文本块
Chunk Size文本块大小
Chunk Overlap文本块之间的重叠长度
RecursiveCharacterTextSplitterLangChain 的递归字符切割器
Semantic Chunking语义切割,按语义相似度切分文档
Parent-Child Chunk父子块策略,小块检索、大块返回上下文
Embedding向量化,将文本转为稠密向量
Bi-Encoder双编码器,分别编码查询和文档为向量
Cross-Encoder交叉编码器,同时处理查询和文档对
Re-rank / Reranker重排序,对初步检索结果精细化排序
BGE-Reranker智源研究院的开源重排序模型
Cohere RerankCohere 的商业重排序 API
BM25词频-逆文档频率的经典全文检索算法
Hybrid Search混合检索(向量检索 + 关键词检索)
Multi-Recall / 多路召回多种检索策略并行,合并结果
RRFReciprocal Rank Fusion,倒数排名融合算法
Dense Retrieval稠密检索,基于 Embedding 的向量检索
Sparse Retrieval稀疏检索,基于词频的检索(如 BM25)
HyDEHypothetical Document Embeddings,假设文档嵌入
Query Rewriting查询改写,LLM 将用户问题改写成更优检索形式
Multi-Query多查询扩展,一个用户问题生成多个子查询
HNSWHierarchical Navigable Small World,近似最近邻索引
IVFInverted File Index,倒排文件索引
ANNApproximate Nearest Neighbor,近似最近邻搜索
Faithfulness忠实度,回答是否基于检索内容
Hallucination幻觉,模型生成不基于事实的内容
RAGASRAG Assessment,RAG 评估框架
DeepEval与 pytest/CI 集成的 RAG 评测框架
TruLens侧重线上观测的 RAG 评测工具
LLM WikiKarpathy 提出的个人知识库模式
Golden Dataset黄金测试数据集
Context Precision上下文精确率,召回的 chunk 中有多少真正有用
Context Recall上下文召回率,必须的信息是否都被召回
Answer Relevancy答案相关性,回答是否真正回应用户问题
Hit Rate命中率,检索质量指标
MRRMean Reciprocal Rank,平均倒数排名
NDCGNormalized Discounted Cumulative Gain,归一化折损累计增益
Milvus开源向量数据库
Pinecone全托管向量数据库 SaaS
Weaviate支持混合检索的开源向量数据库
QdrantRust 编写的高性能向量数据库
Chroma轻量级向量数据库(Python 原生)
FAISSMeta 开源的向量相似度搜索库
pgvectorPostgreSQL 的向量扩展插件
Dify开源 LLM 应用开发平台
RagFlow开源 RAG 引擎
LLaMAIndex连接 LLM 和外部数据的框架
LangChainLLM 应用开发框架
LangGraphLangChain 的图编排框架
LCELLangChain Expression Language,链式表达式语言
RunnableLangChain 可执行组件基类
RunnableParallelLangChain 并行执行组件
RunnableBranchLangChain 路由组件
LangFuseLLM 可观测性平台
LangSmithLangChain 官方 LLM 调试平台

三、Agent

术语全称 / 说明
Agent智能体,能自主推理、调用工具、执行任务的 AI 系统
ReActReasoning + Acting,推理-行动-观察循环范式
Plan-and-Execute先规划再执行的 Agent 范式
Plan-and-Solve规划-求解范式
Reflection反思范式,Agent 自我审视和修正
Multi-Agent多智能体协作系统
Tool Calling工具调用,LLM 选择并调用外部工具
Tool Registry工具注册中心,管理所有可用工具
MCPModel Context Protocol,模型上下文协议
MCP ServerMCP 服务端,提供工具/资源/提示
MCP ClientMCP 客户端,连接 LLM 和 MCP Server
Function Calling模型厂商提供的结构化输出能力
JSON-RPC 2.0MCP 使用的远程调用协议
STDIO TransportMCP 本地通信方式(标准输入输出)
Streamable HTTPMCP 远程通信方式
SSEServer-Sent Events,MCP 远程通信(已弃用)
Code Agent能自动生成并执行代码的 Agent
Supervisor Agent主管 Agent,负责任务分发和协调
Orchestrator编排器,协调多个 Agent 执行流程
State Machine状态机,Agent 执行状态管理
Harness Engineering驾驭工程,围绕 Agent 构建约束和管控体系
PocketFlow轻量级 Agent 状态机(项目中自研)
Max IterationsAgent 最大迭代次数,防止死循环
Signal (Temporal)Temporal 的人机交互信号机制
Checkpoint检查点,Agent 执行的中间状态保存
Fan-Out并行分发,同时处理多个子任务
Parent-Child WorkflowTemporal 的父子工作流模式
Deterministic Workflow确定性工作流
ActivityTemporal 中执行 I/O 操作的任务单元
WorkflowTemporal 中编排 Activity 的工作流定义
Task QueueTemporal 的任务队列
LLM GatewayLLM 网关,统一路由和管控模型调用
Guardrails护栏,LLM 输出的安全约束
Fallback降级,主服务失败时切换到备用
Load Balancing负载均衡,将请求分发到多个实例
Retry重试机制
Exponential Backoff指数退避,递增重试间隔
Circuit Breaker断路器,防止级联故障
Max Tokens最大 token 限制
Rate Limiting速率限制,控制请求频率
Tenant租户,多租户隔离的最小单位
Token BudgetToken 预算分配策略
Context Compression上下文压缩
Sliding Window滑动窗口,保留最近 N 轮对话
Streaming流式输出

四、Prompt Engineering

术语全称 / 说明
Prompt Engineering提示词工程,设计高质量 LLM 输入
Prompt InjectionPrompt 注入攻击,恶意指令覆盖原始指令
Direct Injection直接注入,用户输入直接覆盖系统指令
Indirect Injection间接注入,通过外部数据(网页/文档)注入指令
Context Isolation上下文隔离,分隔指令和数据
Output Parser输出解析器,将 LLM 输出转为结构化数据
Structured Output结构化输出,强制 LLM 输出特定格式
JSON RepairJSON 自动修复
YAML Prompt ManagementYAML 版本化 Prompt 管理
Few-shot少样本,在 Prompt 中提供示例
Zero-shot零样本,不给示例直接提问
Role Prompting角色设定,给模型赋予特定角色
Context Engineering上下文工程,构建高质量输入信息

五、AI 图像生成

术语全称 / 说明
GANGenerative Adversarial Network,生成对抗网络
GeneratorGAN 中的生成器
DiscriminatorGAN 中的判别器
VAEVariational Autoencoder,变分自编码器
VQ-VAEVector Quantized VAE,向量量化 VAE
Diffusion / 扩散模型通过逐步去噪生成图像的模型范式
DDPMDenoising Diffusion Probabilistic Models
LDMLatent Diffusion Models,隐空间扩散模型
Latent Space隐空间,VAE 压缩后的数学表示
Stable Diffusion (SD)开源文生图模型
SDXLStable Diffusion XL,SD 的增强版
SD3 / SD 3.5基于 MM-DiT 架构的 SD 最新版本
Flux.1Black Forest Labs 开源文生图模型(12B 参数)
DiTDiffusion Transformer,基于 Transformer 的扩散架构
MM-DiT多模态扩散 Transformer
U-NetSD 系列使用的卷积神经网络架构
Flow Matching流匹配,扩散模型的替代数学生成范式
Rectified Flow整流流,Flow Matching 的变体
ControlNet控制图像生成的附加网络
Zero ConvolutionControlNet 使用的零卷积初始化
OpenPose人体姿态估计,ControlNet 的条件输入之一
Canny边缘检测算法,ControlNet 的条件输入之一
SAM 2Segment Anything Model 2,Meta 的通用分割模型
Grounding DINO图文理解模型,用于语言控制视觉定位
Grounded-SAMGrounding DINO + SAM 的级联方案
YOLOYou Only Look Once,实时目标检测系列
DHash差异哈希,图像相似度比较算法
BiRefNet开源高精度抠图模型
BRIA RMBG工业级背景去除模型
RVMRobust Video Matting,视频抠像模型
MODNet轻量级人像抠图模型
Matting抠像/抠图,计算软透明度
Segmentation图像分割,像素级分类
Inpainting图像局部重绘
Outpainting图像向外扩展
ComfyUI节点式 AI 绘图工作流工具
WebUI (SD)Stable Diffusion 的 Web 图形界面
KSamplerComfyUI 中的核心采样器节点
Sampler / 采样算法扩散模型的去噪算法
Euler / Euler a欧拉采样器(a 为祖先采样)
DPM++先进扩散采样算法系列
Scheduler / 调度器控制去噪步长的策略
Karras流行的调度器策略
Denoise / 重绘幅度图生图中的原始内容保留程度
CFG Scale提示词引导系数
CLIPContrastive Language-Image Pre-training,OpenAI 的图文对比预训练
Checkpoint模型权重文件(底模)
LoRA低秩微调,挂载在 U-Net/DiT 上的轻量补丁
AdaINAdaptive Instance Normalization,自适应实例归一化
StyleGANNVIDIA 的风格化生成模型系列
ProGANNVIDIA 的渐进式增长 GAN
CycleGAN无配对图像翻译 GAN
Pix2Pix配对图像翻译 GAN
WGANWasserstein GAN,解决训练不稳定的 GAN
LCMLatent Consistency Models,快速扩散模型
VLM / 视觉语言模型能理解图像内容的语言模型
OCROptical Character Recognition,光学字符识别
MinerUOpenDataLab 开源文档解析引擎
Qwen-VL阿里通义的视觉语言模型
Knowdoc项目中自研的多格式文档解析引擎
OFD国标版式文件格式
safetensors安全张量格式,模型权重存储标准
ckptCheckpoint 旧格式,基于 Pickle
Zero-copy零拷贝,内存映射加载技术
SIMDSingle Instruction Multiple Data,单指令多数据
WASMWebAssembly,浏览器高性能计算标准
Web Worker浏览器多线程 API
Transferable Objects可转移对象,零拷贝跨线程数据传递

六、基础知识 / 八股

术语全称 / 说明
Transformer基于自注意力机制的神经网络架构
Self-Attention自注意力机制
Multi-Head Attention多头注意力
BERTBidirectional Encoder Representations from Transformers
GPTGenerative Pre-trained Transformer
RNNRecurrent Neural Network,循环神经网络
LSTMLong Short-Term Memory,长短期记忆网络
CNNConvolutional Neural Network,卷积神经网络
ResNet残差网络,解决深层网络梯度消失
ViTVision Transformer,视觉 Transformer
MLPMulti-Layer Perceptron,多层感知机
Batch Norm批量归一化
Layer Norm层归一化
Dropout随机失活,防止过拟合
Gradient Vanishing梯度消失
Gradient Exploding梯度爆炸
Residual Connection残差连接 / 跳跃连接
CJKChinese-Japanese-Korean,中日韩文字
Tokenizer分词器
BPEByte Pair Encoding,字节对编码
Word2VecGoogle 提出的静态词向量技术
MinHash最小哈希,近似去重算法
LSHLocality-Sensitive Hashing,局部敏感哈希
Bloom Filter布隆过滤器,快速存在性判断
RoaringBitmap高效位图压缩算法

七、Vibe Coding / AI 编程工具

术语全称 / 说明
Vibe Coding感知编码,用自然语言描述需求让 AI 写代码
Claude CodeAnthropic 的终端 AI 编程助手
OpenCodeOhMyOpenCode,AI 编程 IDE
CLAUDE.mdClaude Code 的全局记忆配置
AGENTS.mdOpenCode 的全局规则(兼容 CLAUDE.md)
Skill / 技能可复用的 AI 能力包
SKILL.md技能的描述和执行文件
Subagent子智能体,独立上下文的任务执行单元
Agent Team多智能体团队,可互相通信的协作模式
Hook钩子,在特定事件触发的自动化脚本
Plugin插件,打包多个功能的完整方案
Checkpoint对话状态快照,支持回退
Rewind回退到之前的检查点
SuperpowersAI 编程的软件开发方法论技能集合
Ralph LoopOhMyOpenCode 的自我迭代循环机制
Oh My OpenCode多智能体协作的 AI 编程系统
SisyphusOhMyOpenCode 的主编排智能体
HephaestusOhMyOpenCode 的自主深度工作智能体
PrometheusOhMyOpenCode 的战略规划智能体
OracleOhMyOpenCode 的架构顾问智能体
LibrarianOhMyOpenCode 的文档查询智能体
ExploreOhMyOpenCode 的代码探索智能体
Hermes Agent自进化的 AI 助手(Harness Engineering 内建系统)
OpenClaw配置即行为的 AI Agent 系统
HonchoHermes 的用户建模系统
FTS5SQLite 全文搜索扩展
Everything Claude CodeAnthropic 黑客马拉松获奖的 Claude Code 配置集
Harness Engineering驾驭工程,围绕 AI 构建约束和管控
LSPLanguage Server Protocol,语言服务器协议
ASTAbstract Syntax Tree,抽象语法树
AST-grep基于 AST 的代码搜索和重写工具
TDDTest-Driven Development,测试驱动开发
WorktreeGit 工作树,隔离同时开发
Intent GateOhMyOpenCode 的意图识别门
Prometheus Plan动手前先规划的访谈模式

八、微服务 / 架构

术语全称 / 说明
BFFBackend For Frontend,面向前端后端
API GatewayAPI 网关,统一入口
Service Discovery服务发现
Circuit Breaker断路器模式
Config Center配置中心
Load Balancer负载均衡器
Monolithic单体架构
Microservices微服务架构
Horizontal Scaling水平扩展
Distributed Tracing分布式追踪
CQRSCommand Query Responsibility Segregation,命令查询职责分离
Event Sourcing事件溯源

九、云原生 / DevOps

术语全称 / 说明
Kubernetes / K8s容器编排平台
Docker容器引擎
HelmK8s 包管理器
PodK8s 最小部署单元
Docker Compose本地容器编排
GitLab CI/CDGitLab 持续集成/部署流水线
CeleryPython 分布式任务队列
Temporal分布式工作流引擎(替代 Celery 的升级方案)
NginxWeb 服务器和反向代理
TLSTransport Layer Security,传输层安全
NATNetwork Address Translation,网络地址转换
STUNSession Traversal Utilities for NAT,NAT 穿透
MinIO开源的 S3 兼容对象存储
Syncthing开源的 P2P 文件同步工具
OBS华为云对象存储
OSS阿里云对象存储

十、项目经验相关

术语全称 / 说明
bid.ai国能智能评标平台项目
aios.aiAI 基础设施服务项目(AIOS 智能体操作系统)
Knowdoc项目自研文档解析引擎
PocketFlow项目中自研的轻量级 Agent 状态机
国网样本中心国家电网人工智能样本中心项目
Temporal分布式工作流引擎
LiteLLM统一 LLM 网关
vLLM高性能 LLM 推理引擎
SGLangLLM 推理引擎(RadixAttention)
LangfuseLLM 可观测性平台
Dify低代码 AI 应用平台
MinerU高精度文档解析引擎
RagFlow开源 RAG 引擎
LitestarPython ASGI Web 框架
SQLModelPython SQL 模型(SQLAlchemy + Pydantic)
SQLAlchemyPython ORM 框架
FastAPIPython 异步 Web 框架
NestJSNode.js 后端框架
KoaNode.js Web 框架(Express 团队)
PiniaVue 3 状态管理
UnoCSS即时原子化 CSS 引擎
Ant Design VueVue 组件库
Vite前端构建工具
RxJSReactive Extensions for JavaScript
Monaco EditorVS Code 的网页编辑器核心
ClickHouse列式存储数据库
PostgreSQL开源关系型数据库
Redis内存数据库
Milvus向量数据库
Neo4j图数据库
MySQL关系型数据库
asyncpgPostgreSQL 异步驱动
AlembicSQLAlchemy 数据库迁移工具
PydanticPython 数据校验库
LoguruPython 结构化日志库
pytestPython 测试框架
uv快速的 Python 包管理器(Rust 编写)
UVICORNPython ASGI 服务器
pnpm快速的 Node.js 包管理器
Airflow工作流调度平台(项目早期使用)
Rust/WASM项目中用 Rust 编写图像算法编译为 WASM 运行
PDF.jsMozilla 的 PDF 渲染库
Jinja2Python 模板引擎
PowerPaint全能图像编辑模型
BrushNet即插即用局部重绘架构
Flux.1 Fill基于 FLUX 的 Inpainting 模型
BGEBAAI General Embedding,智源通用向量模型
BCEmbedding网易有道的双语向量模型
Jina EmbeddingsJina AI 的多语言向量模型
Monorepo单仓库多项目管理模式
Spin-off项目拆分,从原项目独立出子项目
Citizen Developer公民开发者,非专业程序员用 AI 构建应用
Ralph LoopAI Agent 的自我迭代循环
Boulder持续运行/重试机制
MomusOhMyOpenCode 的计划审查智能体
MetisOhMyOpenCode 的预规划咨询智能体