跳到主要内容
GLOSSARY

AI 术语表

从小白到工业级,按由浅入深的顺序排列。英文术语完整展示,配中文解释。

01

小白

Beginner
  • Prompt Engineering

    提示词工程

    通过精心设计输入提示词来引导大模型给出期望输出的方法。包括角色设定、给示例(few-shot)、限定输出格式等技巧,是上手大模型最先接触的能力。

  • Embeddings

    向量嵌入

    把文本、代码或图像映射成高维向量,让语义相近的内容在向量空间中距离更近,是检索与相似度计算的基础。

  • Vector Database

    向量数据库

    专门存储和检索向量嵌入的数据库,支持近似最近邻(ANN)搜索,能在海量向量中快速找到语义最相近的若干条。

02

进阶

Intermediate
  • Fine-Tuning

    模型微调

    在预训练模型基础上用特定领域数据继续训练,让模型适配具体任务。常用 LoRA 等参数高效方法降低成本。

  • AST

    抽象语法树· Abstract Syntax Tree

    代码的结构化树形表示,用于语义化代码切片(Semantic Code Slicing)。按 AST 的函数/类逻辑段落切分,而非按字符硬切,可避免把一段代码从中间截断,让检索召回的片段语义完整、边界对齐。

  • RAG

    检索增强生成· Retrieval-Augmented Generation

    先从知识库检索相关上下文,再交给大模型生成答案。把外部知识喂给模型,显著降低幻觉、提升事实准确度。

  • Hybrid Search

    混合检索

    把关键词检索(BM25 等稀疏方法)和向量语义检索结合起来,兼顾精确匹配与语义召回,再融合两路结果排序。

03

深入

Advanced
  • Reranker

    重排器

    在初步召回的候选集合上做精排的模型,通常用交叉编码器逐条打分,把最相关的内容排到最前,提升最终上下文质量。

  • ReAct

    推理与行动· Reasoning and Acting

    让模型交替进行推理(思考下一步)和行动(调用工具),用工具返回的观测结果指导后续推理,形成思考-行动循环。

  • Multi-Agent System

    多智能体系统

    由多个分工协作的智能体组成的系统,例如规划者、执行者、审查者各司其职,通过消息传递协同完成复杂任务。

  • MCP

    模型上下文协议· Model Context Protocol

    Anthropic 开源的标准协议,统一模型与外部工具、资源的接入方式。工具治理依赖 MCP Host 级的 RBAC 中间件(MCP Host-level RBAC Middleware)作为强制鉴权层:所有 Tool Call 经中间件拦截、按角色校验权限,再下放到独立沙箱中的 MCP Server 执行。

  • Accessibility Tree

    无障碍树· A11y Tree

    浏览器基于 DOM 派生的语义化结构树,暴露每个元素的角色(role)、名称和状态。浏览器智能体(Browser Agent)解析 A11y Tree 而非裸 DOM/XPath,能更准确地定位语义元素、识别动态加载组件,显著提升网页操作准确度。

04

工业级

Industrial
  • LLM-as-a-Judge

    大模型裁判

    用一个大模型来评估另一个模型的输出质量,按给定标准打分或比较。常用于自动化评测,替代昂贵的人工标注。

  • RAGAS

    RAG 三元组评估· RAG Assessment

    面向 RAG 系统的评估框架,围绕忠实度、上下文相关性、答案相关性等三元组指标,量化检索与生成的质量。

  • HIL

    硬件在环测试· Hardware-in-the-Loop

    把真实硬件接入仿真闭环进行测试,让算法在接近实战的物理条件下验证,边缘端部署常用来校验时延与稳定性。

  • Saga Pattern

    Saga 补偿事务模式

    长事务管理模式:把一个跨服务的长链路拆成一串本地事务,任一步失败时,按相反顺序执行已完成步骤的补偿动作(Compensating Actions)回滚副作用,实现最终一致性。DevOps 自愈流在验证失败时据此回退。

  • Idempotent Tool Execution

    幂等工具执行

    保证同一工具调用重复执行多次与执行一次的结果一致。通过幂等键(Idempotency Key)去重,让 Agent 在重试、超时重放或补偿场景下安全调用工具,不产生重复副作用。

  • Harness

    评估与编排基座

    封装 LLM 推理、提示词模板、工具、状态追踪与安全护栏的外层基础设施。在生产与测试中,它充当确定性的运行时与基准评测环境(如 EleutherAI lm-eval-harness,或自研的编排封装层),用来度量智能体的轨迹(Trajectory)、评估性能,并在沙箱内安全地执行代码。

  • GraphRAG

    知识图谱增强检索

    利用非结构化文本构建高维关联的知识图谱,通过社区检测算法(如 Leiden)生成全局摘要,彻底解决传统向量 RAG 在跨文档全局关系推断与多跳复杂查询场景下的召回瓶颈。

  • PagedAttention & KV Cache Quantization

    分页注意力与键值缓存量化

    借鉴虚拟内存页管理机制动态分配 KV Cache 物理块,彻底解决长文本生成中显存碎片化与显存上限瓶颈,结合 FP8 / INT4 量化大幅优化端侧推理吞吐。

  • Zero-Copy Shared-Memory IPC

    零拷贝共享内存进程间通信

    利用 NvMap 等底层驱动在多进程异构架构(如 Xavier NX 的 CPU/GPU/NVDLA)间实现单物理地址映射共享,消除系统态与用户态的多余拷贝,将传感感知延迟压低至微秒级。

  • Speculative Decoding

    投机采样 / 预测性解码

    采用轻量 Draft Model 快速推测 Token 候选流,并由 Target Model 单步并行校验,有效缓解端侧 I/O 访存受限的高延迟,大幅优化语音语义交互中的首字响应速度(TTFT)。

  • State-Centric Multi-Agent Orchestration

    以状态为核心的多智能体编排

    基于有向无环图(DAG)并支持循环调用的编排架构(如 LangGraph),通过全局共享状态(Shared State)持久化运行上下文,支持 Agent 长任务下的回溯、多机并发协作与自我修正。

  • Guardrail Middleware & Safe Execution Sandbox

    护栏中间件与安全执行沙箱

    在 Agent 决策与系统级执行器(如 ADAS 控制器)间构建语义网关与 Pydantic 校验,利用 gVisor 或 WASM 等轻量沙箱进行系统硬隔离,确保物理世界确定性安全交付。

  • Self-RAG / Reflective Retrieval

    自反思增强检索

    引入 Critique Token 自评估机制,在推理闭环内动态预测检索关联度与生成支持度,自主决定是否触发检索更新或丢弃无效召回,彻底压制 RAG 幻觉。