GLOSSARY

AI 术语表

从小白到工业级，按由浅入深的顺序排列。英文术语完整展示，配中文解释。

小白

Beginner先把名词认全

Prompt Engineering
提示词工程
通过精心设计输入提示词来引导大模型给出期望输出的方法。包括角色设定、给示例（few-shot）、限定输出格式等技巧，是上手大模型最先接触的能力。
Embeddings
向量嵌入
把文本、代码或图像映射成高维向量，让语义相近的内容在向量空间中距离更近，是检索与相似度计算的基础。
Vector Database
向量数据库
专门存储和检索向量嵌入的数据库，支持近似最近邻（ANN）搜索，能在海量向量中快速找到语义最相近的若干条。

进阶

IntermediateRAG 与代码检索的地基

Fine-Tuning
模型微调
在预训练模型基础上用特定领域数据继续训练，让模型适配具体任务。常用 LoRA 等参数高效方法降低成本。
AST
抽象语法树· Abstract Syntax Tree
代码的结构化树形表示，用于语义化代码切片（Semantic Code Slicing）。按 AST 的函数/类逻辑段落切分，而非按字符硬切，可避免把一段代码从中间截断，让检索召回的片段语义完整、边界对齐。
RAG
检索增强生成· Retrieval-Augmented Generation
先从知识库检索相关上下文，再交给大模型生成答案。把外部知识喂给模型，显著降低幻觉、提升事实准确度。
Hybrid Search
混合检索
把关键词检索（BM25 等稀疏方法）和向量语义检索结合起来，兼顾精确匹配与语义召回，再融合两路结果排序。

深入

AdvancedAgent 编排与精排

Reranker
重排器
在初步召回的候选集合上做精排的模型，通常用交叉编码器逐条打分，把最相关的内容排到最前，提升最终上下文质量。
ReAct
推理与行动· Reasoning and Acting
让模型交替进行推理（思考下一步）和行动（调用工具），用工具返回的观测结果指导后续推理，形成思考-行动循环。
Multi-Agent System
多智能体系统
由多个分工协作的智能体组成的系统，例如规划者、执行者、审查者各司其职，通过消息传递协同完成复杂任务。
MCP
模型上下文协议· Model Context Protocol
Anthropic 开源的标准协议，统一模型与外部工具、资源的接入方式。工具治理依赖 MCP Host 级的 RBAC 中间件（MCP Host-level RBAC Middleware）作为强制鉴权层：所有 Tool Call 经中间件拦截、按角色校验权限，再下放到独立沙箱中的 MCP Server 执行。
Accessibility Tree
无障碍树· A11y Tree
浏览器基于 DOM 派生的语义化结构树，暴露每个元素的角色（role）、名称和状态。浏览器智能体（Browser Agent）解析 A11y Tree 而非裸 DOM/XPath，能更准确地定位语义元素、识别动态加载组件，显著提升网页操作准确度。

工业级

Industrial评测与上线验证

LLM-as-a-Judge
大模型裁判
用一个大模型来评估另一个模型的输出质量，按给定标准打分或比较。常用于自动化评测，替代昂贵的人工标注。
RAGAS
RAG 三元组评估· RAG Assessment
面向 RAG 系统的评估框架，围绕忠实度、上下文相关性、答案相关性等三元组指标，量化检索与生成的质量。
HIL
硬件在环测试· Hardware-in-the-Loop
把真实硬件接入仿真闭环进行测试，让算法在接近实战的物理条件下验证，边缘端部署常用来校验时延与稳定性。
Saga Pattern
Saga 补偿事务模式
长事务管理模式：把一个跨服务的长链路拆成一串本地事务，任一步失败时，按相反顺序执行已完成步骤的补偿动作（Compensating Actions）回滚副作用，实现最终一致性。DevOps 自愈流在验证失败时据此回退。
Idempotent Tool Execution
幂等工具执行
保证同一工具调用重复执行多次与执行一次的结果一致。通过幂等键（Idempotency Key）去重，让 Agent 在重试、超时重放或补偿场景下安全调用工具，不产生重复副作用。
Harness
评估与编排基座
封装 LLM 推理、提示词模板、工具、状态追踪与安全护栏的外层基础设施。在生产与测试中，它充当确定性的运行时与基准评测环境（如 EleutherAI lm-eval-harness，或自研的编排封装层），用来度量智能体的轨迹（Trajectory）、评估性能，并在沙箱内安全地执行代码。
GraphRAG
知识图谱增强检索
利用非结构化文本构建高维关联的知识图谱，通过社区检测算法（如 Leiden）生成全局摘要，彻底解决传统向量 RAG 在跨文档全局关系推断与多跳复杂查询场景下的召回瓶颈。
PagedAttention & KV Cache Quantization
分页注意力与键值缓存量化
借鉴虚拟内存页管理机制动态分配 KV Cache 物理块，彻底解决长文本生成中显存碎片化与显存上限瓶颈，结合 FP8 / INT4 量化大幅优化端侧推理吞吐。
Zero-Copy Shared-Memory IPC
零拷贝共享内存进程间通信
利用 NvMap 等底层驱动在多进程异构架构（如 Xavier NX 的 CPU/GPU/NVDLA）间实现单物理地址映射共享，消除系统态与用户态的多余拷贝，将传感感知延迟压低至微秒级。
Speculative Decoding
投机采样 / 预测性解码
采用轻量 Draft Model 快速推测 Token 候选流，并由 Target Model 单步并行校验，有效缓解端侧 I/O 访存受限的高延迟，大幅优化语音语义交互中的首字响应速度（TTFT）。
State-Centric Multi-Agent Orchestration
以状态为核心的多智能体编排
基于有向无环图（DAG）并支持循环调用的编排架构（如 LangGraph），通过全局共享状态（Shared State）持久化运行上下文，支持 Agent 长任务下的回溯、多机并发协作与自我修正。
Guardrail Middleware & Safe Execution Sandbox
护栏中间件与安全执行沙箱
在 Agent 决策与系统级执行器（如 ADAS 控制器）间构建语义网关与 Pydantic 校验，利用 gVisor 或 WASM 等轻量沙箱进行系统硬隔离，确保物理世界确定性安全交付。
Self-RAG / Reflective Retrieval
自反思增强检索
引入 Critique Token 自评估机制，在推理闭环内动态预测检索关联度与生成支持度，自主决定是否触发检索更新或丢弃无效召回，彻底压制 RAG 幻觉。

小白

Prompt Engineering

Embeddings

Vector Database

进阶

Fine-Tuning

AST

RAG

Hybrid Search

深入

Reranker

ReAct

Multi-Agent System

MCP

Accessibility Tree

工业级

LLM-as-a-Judge

RAGAS

HIL

Saga Pattern

Idempotent Tool Execution

Harness

GraphRAG

PagedAttention & KV Cache Quantization

Zero-Copy Shared-Memory IPC

Speculative Decoding

State-Centric Multi-Agent Orchestration

Guardrail Middleware & Safe Execution Sandbox

Self-RAG / Reflective Retrieval