技术词汇表
本仓库所有文档中出现的专业术语、缩写、框架名、工具名、算法名、概念名的系统性整理。
一、AI 基础概念
| 术语 | 全称 / 说明 |
|---|---|
| LLM | Large Language Model,大语言模型 |
| VLM | Vision Language Model,视觉语言模型 |
| SLM | Small Language Model,小语言模型 |
| MoE | Mixture of Experts,混合专家架构 |
| SFT | Supervised Fine-Tuning,监督微调 |
| RLHF | Reinforcement Learning from Human Feedback,基于人类反馈的强化学习 |
| CFG | Classifier-Free Guidance,无分类器引导 |
| Temperature | 模型生成时的随机性参数,值越大输出越随机 |
| Top-K / Top-P | 采样策略参数,控制生成时的 token 候选范围 |
| Context Window | 上下文窗口,模型单次能处理的最大 token 数 |
| Token | 模型处理文本的最小单位,约等于 0.75 个中文词 |
| Prompt | 提示词,用户输入给模型的指令文本 |
| System Prompt | 系统提示词,定义模型角色和行为的固定指令 |
| Few-shot | 少样本学习,给模型提供几个示例来引导输出 |
| Chain of Thought (CoT) | 思维链,引导模型逐步推理 |
| Function Calling | 函数调用,模型输出格式化参数调用外部函数 |
| SSE | Server-Sent Events,服务器推送事件,用于流式输出 |
| JSON Schema | JSON 数据结构的约束描述格式 |
| PagedAttention | vLLM 的 KV Cache 分页管理技术 |
| RadixAttention | SGLang 的基数树 KV Cache 复用技术 |
| Flash Attention | 一种高效注意力计算算法 |
| KV Cache | Key-Value 缓存,加速自回归生成 |
| Speculative Decoding | 推测解码,小模型打草稿大模型验证 |
| Prefix Caching | 前缀缓存,共享前缀请求复用 KV Cache |
| AWQ / GPTQ | 模型量化格式(4-bit/8-bit 权重压缩) |
| GGUF | llama.cpp 生态的模型量化格式 |
| EXL2 | ExLlamaV2 的细粒度量化格式 |
| LoRA | Low-Rank Adaptation,低秩微调技术 |
| Dreambooth | 全量微调技术,重新训练整个模型 |
| Embedding | 嵌入向量,将文本/图像映射为高维向量 |
| Quantization | 量化,降低模型权重精度以节省显存 |
二、RAG(检索增强生成)
| 术语 | 全称 / 说明 |
|---|---|
| RAG | Retrieval-Augmented Generation,检索增强生成 |
| Agentic RAG | 让 LLM 自主决策检索策略的 RAG 变体 |
| Naive RAG | 基础 RAG,三段式:索引→检索→生成 |
| Advanced RAG | 进阶 RAG,加入查询改写、重排序等优化 |
| Modular RAG | 模块化 RAG,可自由组合功能模块 |
| Graph RAG | 基于知识图谱的 RAG |
| Chunk | 文档切分后的文本块 |
| Chunk Size | 文本块大小 |
| Chunk Overlap | 文本块之间的重叠长度 |
| RecursiveCharacterTextSplitter | LangChain 的递归字符切割器 |
| Semantic Chunking | 语义切割,按语义相似度切分文档 |
| Parent-Child Chunk | 父子块策略,小块检索、大块返回上下文 |
| Embedding | 向量化,将文本转为稠密向量 |
| Bi-Encoder | 双编码器,分别编码查询和文档为向量 |
| Cross-Encoder | 交叉编码器,同时处理查询和文档对 |
| Re-rank / Reranker | 重排序,对初步检索结果精细化排序 |
| BGE-Reranker | 智源研究院的开源重排序模型 |
| Cohere Rerank | Cohere 的商业重排序 API |
| BM25 | 词频-逆文档频率的经典全文检索算法 |
| Hybrid Search | 混合检索(向量检索 + 关键词检索) |
| Multi-Recall / 多路召回 | 多种检索策略并行,合并结果 |
| RRF | Reciprocal Rank Fusion,倒数排名融合算法 |
| Dense Retrieval | 稠密检索,基于 Embedding 的向量检索 |
| Sparse Retrieval | 稀疏检索,基于词频的检索(如 BM25) |
| HyDE | Hypothetical Document Embeddings,假设文档嵌入 |
| Query Rewriting | 查询改写,LLM 将用户问题改写成更优检索形式 |
| Multi-Query | 多查询扩展,一个用户问题生成多个子查询 |
| HNSW | Hierarchical Navigable Small World,近似最近邻索引 |
| IVF | Inverted File Index,倒排文件索引 |
| ANN | Approximate Nearest Neighbor,近似最近邻搜索 |
| Faithfulness | 忠实度,回答是否基于检索内容 |
| Hallucination | 幻觉,模型生成不基于事实的内容 |
| RAGAS | RAG Assessment,RAG 评估框架 |
| DeepEval | 与 pytest/CI 集成的 RAG 评测框架 |
| TruLens | 侧重线上观测的 RAG 评测工具 |
| LLM Wiki | Karpathy 提出的个人知识库模式 |
| Golden Dataset | 黄金测试数据集 |
| Context Precision | 上下文精确率,召回的 chunk 中有多少真正有用 |
| Context Recall | 上下文召回率,必须的信息是否都被召回 |
| Answer Relevancy | 答案相关性,回答是否真正回应用户问题 |
| Hit Rate | 命中率,检索质量指标 |
| MRR | Mean Reciprocal Rank,平均倒数排名 |
| NDCG | Normalized Discounted Cumulative Gain,归一化折损累计增益 |
| Milvus | 开源向量数据库 |
| Pinecone | 全托管向量数据库 SaaS |
| Weaviate | 支持混合检索的开源向量数据库 |
| Qdrant | Rust 编写的高性能向量数据库 |
| Chroma | 轻量级向量数据库(Python 原生) |
| FAISS | Meta 开源的向量相似度搜索库 |
| pgvector | PostgreSQL 的向量扩展插件 |
| Dify | 开源 LLM 应用开发平台 |
| RagFlow | 开源 RAG 引擎 |
| LLaMAIndex | 连接 LLM 和外部数据的框架 |
| LangChain | LLM 应用开发框架 |
| LangGraph | LangChain 的图编排框架 |
| LCEL | LangChain Expression Language,链式表达式语言 |
| Runnable | LangChain 可执行组件基类 |
| RunnableParallel | LangChain 并行执行组件 |
| RunnableBranch | LangChain 路由组件 |
| LangFuse | LLM 可观测性平台 |
| LangSmith | LangChain 官方 LLM 调试平台 |
三、Agent
| 术语 | 全称 / 说明 |
|---|---|
| Agent | 智能体,能自主推理、调用工具、执行任务的 AI 系统 |
| ReAct | Reasoning + Acting,推理-行动-观察循环范式 |
| Plan-and-Execute | 先规划再执行的 Agent 范式 |
| Plan-and-Solve | 规划-求解范式 |
| Reflection | 反思范式,Agent 自我审视和修正 |
| Multi-Agent | 多智能体协作系统 |
| Tool Calling | 工具调用,LLM 选择并调用外部工具 |
| Tool Registry | 工具注册中心,管理所有可用工具 |
| MCP | Model Context Protocol,模型上下文协议 |
| MCP Server | MCP 服务端,提供工具/资源/提示 |
| MCP Client | MCP 客户端,连接 LLM 和 MCP Server |
| Function Calling | 模型厂商提供的结构化输出能力 |
| JSON-RPC 2.0 | MCP 使用的远程调用协议 |
| STDIO Transport | MCP 本地通信方式(标准输入输出) |
| Streamable HTTP | MCP 远程通信方式 |
| SSE | Server-Sent Events,MCP 远程通信(已弃用) |
| Code Agent | 能自动生成并执行代码的 Agent |
| Supervisor Agent | 主管 Agent,负责任务分发和协调 |
| Orchestrator | 编排器,协调多个 Agent 执行流程 |
| State Machine | 状态机,Agent 执行状态管理 |
| Harness Engineering | 驾驭工程,围绕 Agent 构建约束和管控体系 |
| PocketFlow | 轻量级 Agent 状态机(项目中自研) |
| Max Iterations | Agent 最大迭代次数,防止死循环 |
| Signal (Temporal) | Temporal 的人机交互信号机制 |
| Checkpoint | 检查点,Agent 执行的中间状态保存 |
| Fan-Out | 并行分发,同时处理多个子任务 |
| Parent-Child Workflow | Temporal 的父子工作流模式 |
| Deterministic Workflow | 确定性工作流 |
| Activity | Temporal 中执行 I/O 操作的任务单元 |
| Workflow | Temporal 中编排 Activity 的工作流定义 |
| Task Queue | Temporal 的任务队列 |
| LLM Gateway | LLM 网关,统一路由和管控模型调用 |
| Guardrails | 护栏,LLM 输出的安全约束 |
| Fallback | 降级,主服务失败时切换到备用 |
| Load Balancing | 负载均衡,将请求分发到多个实例 |
| Retry | 重试机制 |
| Exponential Backoff | 指数退避,递增重试间隔 |
| Circuit Breaker | 断路器,防止级联故障 |
| Max Tokens | 最大 token 限制 |
| Rate Limiting | 速率限制,控制请求频率 |
| Tenant | 租户,多租户隔离的最小单位 |
| Token Budget | Token 预算分配策略 |
| Context Compression | 上下文压缩 |
| Sliding Window | 滑动窗口,保留最近 N 轮对话 |
| Streaming | 流式输出 |
四、Prompt Engineering
| 术语 | 全称 / 说明 |
|---|---|
| Prompt Engineering | 提示词工程,设计高质量 LLM 输入 |
| Prompt Injection | Prompt 注入攻击,恶意指令覆盖原始指令 |
| Direct Injection | 直接注入,用户输入直接覆盖系统指令 |
| Indirect Injection | 间接注入,通过外部数据(网页/文档)注入指令 |
| Context Isolation | 上下文隔离,分隔指令和数据 |
| Output Parser | 输出解析器,将 LLM 输出转为结构化数据 |
| Structured Output | 结构化输出,强制 LLM 输出特定格式 |
| JSON Repair | JSON 自动修复 |
| YAML Prompt Management | YAML 版本化 Prompt 管理 |
| Few-shot | 少样本,在 Prompt 中提供示例 |
| Zero-shot | 零样本,不给示例直接提问 |
| Role Prompting | 角色设定,给模型赋予特定角色 |
| Context Engineering | 上下文工程,构建高质量输入信息 |
五、AI 图像生成
| 术语 | 全称 / 说明 |
|---|---|
| GAN | Generative Adversarial Network,生成对抗网络 |
| Generator | GAN 中的生成器 |
| Discriminator | GAN 中的判别器 |
| VAE | Variational Autoencoder,变分自编码器 |
| VQ-VAE | Vector Quantized VAE,向量量化 VAE |
| Diffusion / 扩散模型 | 通过逐步去噪生成图像的模型范式 |
| DDPM | Denoising Diffusion Probabilistic Models |
| LDM | Latent Diffusion Models,隐空间扩散模型 |
| Latent Space | 隐空间,VAE 压缩后的数学表示 |
| Stable Diffusion (SD) | 开源文生图模型 |
| SDXL | Stable Diffusion XL,SD 的增强版 |
| SD3 / SD 3.5 | 基于 MM-DiT 架构的 SD 最新版本 |
| Flux.1 | Black Forest Labs 开源文生图模型(12B 参数) |
| DiT | Diffusion Transformer,基于 Transformer 的扩散架构 |
| MM-DiT | 多模态扩散 Transformer |
| U-Net | SD 系列使用的卷积神经网络架构 |
| Flow Matching | 流匹配,扩散模型的替代数学生成范式 |
| Rectified Flow | 整流流,Flow Matching 的变体 |
| ControlNet | 控制图像生成的附加网络 |
| Zero Convolution | ControlNet 使用的零卷积初始化 |
| OpenPose | 人体姿态估计,ControlNet 的条件输入之一 |
| Canny | 边缘检测算法,ControlNet 的条件输入之一 |
| SAM 2 | Segment Anything Model 2,Meta 的通用分割模型 |
| Grounding DINO | 图文理解模型,用于语言控制视觉定位 |
| Grounded-SAM | Grounding DINO + SAM 的级联方案 |
| YOLO | You Only Look Once,实时目标检测系列 |
| DHash | 差异哈希,图像相似度比较算法 |
| BiRefNet | 开源高精度抠图模型 |
| BRIA RMBG | 工业级背景去除模型 |
| RVM | Robust Video Matting,视频抠像模型 |
| MODNet | 轻量级人像抠图模型 |
| Matting | 抠像/抠图,计算软透明度 |
| Segmentation | 图像分割,像素级分类 |
| Inpainting | 图像局部重绘 |
| Outpainting | 图像向外扩展 |
| ComfyUI | 节点式 AI 绘图工作流工具 |
| WebUI (SD) | Stable Diffusion 的 Web 图形界面 |
| KSampler | ComfyUI 中的核心采样器节点 |
| Sampler / 采样算法 | 扩散模型的去噪算法 |
| Euler / Euler a | 欧拉采样器(a 为祖先采样) |
| DPM++ | 先进扩散采样算法系列 |
| Scheduler / 调度器 | 控制去噪步长的策略 |
| Karras | 流行的调度器策略 |
| Denoise / 重绘幅度 | 图生图中的原始内容保留程度 |
| CFG Scale | 提示词引导系数 |
| CLIP | Contrastive Language-Image Pre-training,OpenAI 的图文对比预训练 |
| Checkpoint | 模型权重文件(底模) |
| LoRA | 低秩微调,挂载在 U-Net/DiT 上的轻量补丁 |
| AdaIN | Adaptive Instance Normalization,自适应实例归一化 |
| StyleGAN | NVIDIA 的风格化生成模型系列 |
| ProGAN | NVIDIA 的渐进式增长 GAN |
| CycleGAN | 无配对图像翻译 GAN |
| Pix2Pix | 配对图像翻译 GAN |
| WGAN | Wasserstein GAN,解决训练不稳定的 GAN |
| LCM | Latent Consistency Models,快速扩散模型 |
| VLM / 视觉语言模型 | 能理解图像内容的语言模型 |
| OCR | Optical Character Recognition,光学字符识别 |
| MinerU | OpenDataLab 开源文档解析引擎 |
| Qwen-VL | 阿里通义的视觉语言模型 |
| Knowdoc | 项目中自研的多格式文档解析引擎 |
| OFD | 国标版式文件格式 |
| safetensors | 安全张量格式,模型权重存储标准 |
| ckpt | Checkpoint 旧格式,基于 Pickle |
| Zero-copy | 零拷贝,内存映射加载技术 |
| SIMD | Single Instruction Multiple Data,单指令多数据 |
| WASM | WebAssembly,浏览器高性能计算标准 |
| Web Worker | 浏览器多线程 API |
| Transferable Objects | 可转移对象,零拷贝跨线程数据传递 |
六、基础知识 / 八股
| 术语 | 全称 / 说明 |
|---|---|
| Transformer | 基于自注意力机制的神经网络架构 |
| Self-Attention | 自注意力机制 |
| Multi-Head Attention | 多头注意力 |
| BERT | Bidirectional Encoder Representations from Transformers |
| GPT | Generative Pre-trained Transformer |
| RNN | Recurrent Neural Network,循环神经网络 |
| LSTM | Long Short-Term Memory,长短期记忆网络 |
| CNN | Convolutional Neural Network,卷积神经网络 |
| ResNet | 残差网络,解决深层网络梯度消失 |
| ViT | Vision Transformer,视觉 Transformer |
| MLP | Multi-Layer Perceptron,多层感知机 |
| Batch Norm | 批量归一化 |
| Layer Norm | 层归一化 |
| Dropout | 随机失活,防止过拟合 |
| Gradient Vanishing | 梯度消失 |
| Gradient Exploding | 梯度爆炸 |
| Residual Connection | 残差连接 / 跳跃连接 |
| CJK | Chinese-Japanese-Korean,中日韩文字 |
| Tokenizer | 分词器 |
| BPE | Byte Pair Encoding,字节对编码 |
| Word2Vec | Google 提出的静态词向量技术 |
| MinHash | 最小哈希,近似去重算法 |
| LSH | Locality-Sensitive Hashing,局部敏感哈希 |
| Bloom Filter | 布隆过滤器,快速存在性判断 |
| RoaringBitmap | 高效位图压缩算法 |
七、Vibe Coding / AI 编程工具
| 术语 | 全称 / 说明 |
|---|---|
| Vibe Coding | 感知编码,用自然语言描述需求让 AI 写代码 |
| Claude Code | Anthropic 的终端 AI 编程助手 |
| OpenCode | OhMyOpenCode,AI 编程 IDE |
| CLAUDE.md | Claude Code 的全局记忆配置 |
| AGENTS.md | OpenCode 的全局规则(兼容 CLAUDE.md) |
| Skill / 技能 | 可复用的 AI 能力包 |
| SKILL.md | 技能的描述和执行文件 |
| Subagent | 子智能体,独立上下文的任务执行单元 |
| Agent Team | 多智能体团队,可互相通信的协作模式 |
| Hook | 钩子,在特定事件触发的自动化脚本 |
| Plugin | 插件,打包多个功能的完整方案 |
| Checkpoint | 对话状态快照,支持回退 |
| Rewind | 回退到之前的检查点 |
| Superpowers | AI 编程的软件开发方法论技能集合 |
| Ralph Loop | OhMyOpenCode 的自我迭代循环机制 |
| Oh My OpenCode | 多智能体协作的 AI 编程系统 |
| Sisyphus | OhMyOpenCode 的主编排智能体 |
| Hephaestus | OhMyOpenCode 的自主深度工作智能体 |
| Prometheus | OhMyOpenCode 的战略规划智能体 |
| Oracle | OhMyOpenCode 的架构顾问智能体 |
| Librarian | OhMyOpenCode 的文档查询智能体 |
| Explore | OhMyOpenCode 的代码探索智能体 |
| Hermes Agent | 自进化的 AI 助手(Harness Engineering 内建系统) |
| OpenClaw | 配置即行为的 AI Agent 系统 |
| Honcho | Hermes 的用户建模系统 |
| FTS5 | SQLite 全文搜索扩展 |
| Everything Claude Code | Anthropic 黑客马拉松获奖的 Claude Code 配置集 |
| Harness Engineering | 驾驭工程,围绕 AI 构建约束和管控 |
| LSP | Language Server Protocol,语言服务器协议 |
| AST | Abstract Syntax Tree,抽象语法树 |
| AST-grep | 基于 AST 的代码搜索和重写工具 |
| TDD | Test-Driven Development,测试驱动开发 |
| Worktree | Git 工作树,隔离同时开发 |
| Intent Gate | OhMyOpenCode 的意图识别门 |
| Prometheus Plan | 动手前先规划的访谈模式 |
八、微服务 / 架构
| 术语 | 全称 / 说明 |
|---|---|
| BFF | Backend For Frontend,面向前端后端 |
| API Gateway | API 网关,统一入口 |
| Service Discovery | 服务发现 |
| Circuit Breaker | 断路器模式 |
| Config Center | 配置中心 |
| Load Balancer | 负载均衡器 |
| Monolithic | 单体架构 |
| Microservices | 微服务架构 |
| Horizontal Scaling | 水平扩展 |
| Distributed Tracing | 分布式追踪 |
| CQRS | Command Query Responsibility Segregation,命令查询职责分离 |
| Event Sourcing | 事件溯源 |
九、云原生 / DevOps
| 术语 | 全称 / 说明 |
|---|---|
| Kubernetes / K8s | 容器编排平台 |
| Docker | 容器引擎 |
| Helm | K8s 包管理器 |
| Pod | K8s 最小部署单元 |
| Docker Compose | 本地容器编排 |
| GitLab CI/CD | GitLab 持续集成/部署流水线 |
| Celery | Python 分布式任务队列 |
| Temporal | 分布式工作流引擎(替代 Celery 的升级方案) |
| Nginx | Web 服务器和反向代理 |
| TLS | Transport Layer Security,传输层安全 |
| NAT | Network Address Translation,网络地址转换 |
| STUN | Session Traversal Utilities for NAT,NAT 穿透 |
| MinIO | 开源的 S3 兼容对象存储 |
| Syncthing | 开源的 P2P 文件同步工具 |
| OBS | 华为云对象存储 |
| OSS | 阿里云对象存储 |
十、项目经验相关
| 术语 | 全称 / 说明 |
|---|---|
| bid.ai | 国能智能评标平台项目 |
| aios.ai | AI 基础设施服务项目(AIOS 智能体操作系统) |
| Knowdoc | 项目自研文档解析引擎 |
| PocketFlow | 项目中自研的轻量级 Agent 状态机 |
| 国网样本中心 | 国家电网人工智能样本中心项目 |
| Temporal | 分布式工作流引擎 |
| LiteLLM | 统一 LLM 网关 |
| vLLM | 高性能 LLM 推理引擎 |
| SGLang | LLM 推理引擎(RadixAttention) |
| Langfuse | LLM 可观测性平台 |
| Dify | 低代码 AI 应用平台 |
| MinerU | 高精度文档解析引擎 |
| RagFlow | 开源 RAG 引擎 |
| Litestar | Python ASGI Web 框架 |
| SQLModel | Python SQL 模型(SQLAlchemy + Pydantic) |
| SQLAlchemy | Python ORM 框架 |
| FastAPI | Python 异步 Web 框架 |
| NestJS | Node.js 后端框架 |
| Koa | Node.js Web 框架(Express 团队) |
| Pinia | Vue 3 状态管理 |
| UnoCSS | 即时原子化 CSS 引擎 |
| Ant Design Vue | Vue 组件库 |
| Vite | 前端构建工具 |
| RxJS | Reactive Extensions for JavaScript |
| Monaco Editor | VS Code 的网页编辑器核心 |
| ClickHouse | 列式存储数据库 |
| PostgreSQL | 开源关系型数据库 |
| Redis | 内存数据库 |
| Milvus | 向量数据库 |
| Neo4j | 图数据库 |
| MySQL | 关系型数据库 |
| asyncpg | PostgreSQL 异步驱动 |
| Alembic | SQLAlchemy 数据库迁移工具 |
| Pydantic | Python 数据校验库 |
| Loguru | Python 结构化日志库 |
| pytest | Python 测试框架 |
| uv | 快速的 Python 包管理器(Rust 编写) |
| UVICORN | Python ASGI 服务器 |
| pnpm | 快速的 Node.js 包管理器 |
| Airflow | 工作流调度平台(项目早期使用) |
| Rust/WASM | 项目中用 Rust 编写图像算法编译为 WASM 运行 |
| PDF.js | Mozilla 的 PDF 渲染库 |
| Jinja2 | Python 模板引擎 |
| PowerPaint | 全能图像编辑模型 |
| BrushNet | 即插即用局部重绘架构 |
| Flux.1 Fill | 基于 FLUX 的 Inpainting 模型 |
| BGE | BAAI General Embedding,智源通用向量模型 |
| BCEmbedding | 网易有道的双语向量模型 |
| Jina Embeddings | Jina AI 的多语言向量模型 |
| Monorepo | 单仓库多项目管理模式 |
| Spin-off | 项目拆分,从原项目独立出子项目 |
| Citizen Developer | 公民开发者,非专业程序员用 AI 构建应用 |
| Ralph Loop | AI Agent 的自我迭代循环 |
| Boulder | 持续运行/重试机制 |
| Momus | OhMyOpenCode 的计划审查智能体 |
| Metis | OhMyOpenCode 的预规划咨询智能体 |