AI（人工智能）大地图

A. 模型层（Model Layer：能力的源头）

**判断框架：**解决“能力从哪来、上限在哪、怎么训练/适配/推理”；输出“模型能力与成本曲线”；失败会表现为“能力不够/不可控/成本爆炸/延迟不可用”。

A0. AI 基础范式（Paradigms）

**典型热词：**Symbolic AI、ML/DL、Self-supervised、RL、Generative AI、Diffusion
**典型工具：**scikit-learn、PyTorch、TensorFlow/JAX、Ray
**典型指标：**Accuracy/F1/AUC、Loss、样本效率、泛化误差、稳定性（方差/漂移）

A1. 基础模型 / Foundation Models（大模型家族）

**典型热词：**LLM、VLM、多模态、Embedding、MoE、World Model、SLM/端侧
**典型工具：**Hugging Face Transformers、Diffusers、OpenAI/Anthropic/Google API、Ollama（本地）
**典型指标：**能力基准（MMLU/GPQA/…）、上下文长度、幻觉率、对齐一致性、单位 token 成本
A1.1 LLM（文本大语言模型）
- A1.1.1 通用指令模型（Chat / Instruct）
  - A1.1.1.1 多轮对话与工具使用（Chat + Tools）
- A1.1.2 代码模型（Code LLM）
  - A1.1.2.1 代码生成/补全/重构/修复
- A1.1.3 领域模型（Domain LLM）
  - A1.1.3.1 法务/财务/医疗/客服/科研
- A1.1.4 小模型与端侧模型（SLM / On-device）
  - A1.1.4.1 低延迟/隐私/离线
A1.2 Embedding Model（向量表征）
- A1.2.1 文本向量
  - A1.2.1.1 语义检索/聚类/相似度
- A1.2.2 多模态向量
  - A1.2.2.1 跨模态检索
A1.3 VLM（视觉-语言）
- A1.3.1 图像理解（VQA/OCR-aware）
  - A1.3.1.1 图表/表格/截图理解
- A1.3.2 视觉推理
  - A1.3.2.1 目标识别+关系推断
A1.4 图像生成（Image Gen）
- A1.4.1 文生图
  - A1.4.1.1 风格化/局部重绘/编辑
- A1.4.2 图生图
  - A1.4.2.1 超分/去噪/修复
A1.5 语音/音频（Speech/Audio）
- A1.5.1 ASR
  - A1.5.1.1 流式识别/说话人分离
- A1.5.2 TTS
  - A1.5.2.1 音色/情绪/韵律
- A1.5.3 音频理解
  - A1.5.3.1 事件识别/场景分类
- A1.5.4 音乐生成
  - A1.5.4.1 作曲/编曲/伴奏
A1.6 视频（Video）
- A1.6.1 视频理解
  - A1.6.1.1 检索/动作识别/摘要
- A1.6.2 视频生成
  - A1.6.2.1 T2V/I2V
- A1.6.3 视频编辑
  - A1.6.3.1 剪辑/风格转换
A1.7 多模态大模型（Multimodal FM）
- A1.7.1 多模态联合输入输出
  - A1.7.1.1 跨模态推理与对齐
- A1.7.2 屏幕/界面理解（Computer Use）
  - A1.7.2.1 看屏幕→操作
A1.8 结构化/时序/图（Structured/TS/Graph）
- A1.8.1 NL2SQL/指标解释
  - A1.8.1.1 对话式 BI
- A1.8.2 时序预测与异常
  - A1.8.2.1 告警归因
- A1.8.3 图推理/GNN
  - A1.8.3.1 关系网络/知识图谱推理
A1.9 世界模型/具身（World/Embodied）
- A1.9.1 机器人控制闭环
  - A1.9.1.1 Perception-Plan-Act
- A1.9.2 空间智能与导航
  - A1.9.2.1 SLAM/场景建模

A2. 模型结构与架构（Architectures）

**典型热词：**Decoder-only、MoE、Sparsity、KV Cache、Long-Context、Diffusion U-Net、ControlNet
**典型工具：**Transformers、DeepSpeed、FSDP、FlashAttention、xFormers
**典型指标：**参数量/激活占用、吞吐 tokens/s、TTFT、显存占用、训练稳定性（loss spike）

A3. 训练与对齐（Training & Alignment）

**典型热词：**Pretraining、SFT、RLHF/RLAIF、DPO、Alignment、Red Team、Adversarial Training
**典型工具：**DeepSpeed、Accelerate、TRL、Weights & Biases、Label Studio
**典型指标：**训练 loss/perplexity、对齐偏好胜率、拒答/越狱成功率、数据质量（重复率/污染率）

A4. 适配、压缩与个性化（Adaptation & Compression）

**典型热词：**LoRA/QLoRA、PEFT、Distillation、Quantization（INT8/INT4）、GGUF、On-device
**典型工具：**PEFT、bitsandbytes、GGML/GGUF 工具链、TensorRT/ONNX Runtime
**典型指标：**质量回退幅度、模型大小、推理延迟、端侧功耗、个性化命中率/满意度

A5. 推理与服务（Inference & Serving）

**典型热词：**Serving、Batching、Speculative Decoding、KV Cache、Streaming、Router/Fallback
**典型工具：**vLLM、TGI、Triton、KServe、Istio/Envoy
**典型指标：**P50/P95 延迟、TTFT、吞吐 QPS/tokens/s、GPU 利用率、失败率/超时率

A6. 模型供给形态（Supply Modes）

**典型热词：**API、Managed Endpoint、Self-host、Hybrid、Model Mix、Routing、SLA
**典型工具：**OpenAI/Anthropic/Google、Azure/AWS/GCP、API Gateway、Feature Flag
**典型指标：**单位成本（$/1M tokens）、SLA、合规覆盖（地域/数据）、可用性（99.9%）

A7. 评测基准（Benchmarks）

**典型热词：**MMLU、SWE-bench、RAGAS、AgentBench、MT-Bench、Red Team Evals
**典型工具：**lm-eval-harness、OpenAI Evals、Ragas、DeepEval
**典型指标：**准确率/胜率、任务完成率、引用正确率、越狱率、回归失败率（regression）

B. 生成式应用层（AIGC：输出内容的产品形态）

**判断框架：**解决“用户真正要的产出是什么”；输出“可交付内容/可用功能”；失败会表现为“看起来聪明但不可用、不可复用、不可规模化”。

B0. 通用入口形态（Entry Points）

**典型热词：**Chatbot、Copilot、Answer Engine、AI Search
**典型工具：**Chat UI 框架、Browser Extension、企业 IM Bot（飞书/Slack）
**典型指标：**DAU/留存、会话成功率、首轮命中率、满意度（CSAT）

B1. 文本内容生产（Text Content）

**典型热词：**写作助手、摘要、润色、结构化写作、模板化写作
**典型工具：**Docs 插件、Markdown 生成器、引用与大纲工具
**典型指标：**编辑节省时间、一次通过率、事实错误率、用户采纳率

B2. 办公与知识工作（Office & KM）

**典型热词：**Meeting Minutes、Action Items、Enterprise KB、SOP/PRD Copilot
**典型工具：**会议转写（ASR）、知识库（Confluence/Notion/飞书文档）+ RAG
**典型指标：**检索命中率、引用覆盖率、工单减少量、知识复用率

B3. 编程与研发（AI Coding）

**典型热词：**Copilot、Code Review、PR Summary、Test Gen、Bug Fix
**典型工具：**IDE 插件、CI 集成、SAST/依赖扫描
**典型指标：**合并周期缩短、缺陷密度、测试覆盖率提升、回滚率

B4. 数据分析与 BI（Data & Analytics）

**典型热词：**NL2SQL、ChatBI、Auto Insights、RCA Draft、Metric Copilot
**典型工具：**语义层/指标平台、SQL Gateway、BI（Tableau/PowerBI/Looker）
**典型指标：**查询正确率、口径一致率、洞察采纳率、误报/漏报率

B5. 图像与设计（Image/Design）

**典型热词：**Text-to-Image、Inpainting、Outpainting、风格迁移、商品图
**典型工具：**Stable Diffusion 系、Photoshop 插件、素材库/品牌规范
**典型指标：**审核通过率、点击率提升、制作周期缩短、侵权风险事件数

B6. 视频（Video）

**典型热词：**T2V、I2V、自动剪辑、分镜、数字人
**典型工具：**剪辑工具链、字幕/配音流水线、素材管理
**典型指标：**完播率、制作时长节省、内容合规命中率、返工率

B7. 语音（Voice）

**典型热词：**ASR、TTS、语音助手、外呼、同传、音色克隆
**典型工具：**流式 ASR、TTS 引擎、呼叫中心系统
**典型指标：**WER（识别错词率）、实时延迟、通话完成率、投诉率

B8. 业务职能 Copilot（Role-based）

**典型热词：**Sales Copilot、客服助手、财务助手、法务审阅、HR 助手
**典型工具：**CRM/工单/ERP 连接器、审批流、权限体系
**典型指标：**人效提升、转化率、工单一次解决率、合规错误数

B9. 行业与场景（Vertical & Scenarios）

**典型热词：**行业知识库、流程助手、合规 AI、领域大模型
**典型工具：**行业数据源、术语库、本体/知识图谱、私有化部署
**典型指标：**业务 KPI（因行业而异）、可解释性、合规通过率、风险事件数

C. Agent 层（Agent：让 AI 能做事的行为范式）

**判断框架：**解决“从回答到行动（Plan→Act）”；输出“可执行的任务完成”；失败会表现为“乱调用工具/越权/跑偏/不可控成本”。

C1. Agent 运行形态（Runtime Shapes）

**典型热词：**Single Agent、Multi-Agent、Autonomous、Computer Use、RPA+LLM
**典型工具：**Browser Agent、Desktop Automation、Sandbox Runtime
**典型指标：**任务完成率、平均步数、回退/重试率、人工介入率

C2. Agent 关键模块（Core Modules）

**典型热词：**Planner、Memory、Tools、State Machine、Reflection、Human-in-the-loop
**典型工具：**LangGraph、Temporal（工作流）、向量库（记忆）、Policy Engine
**典型指标：**计划可解释性、工具调用成功率、记忆命中率、错误恢复时间

C3. Agent 推理-行动模式（Reason+Act Patterns）

**典型热词：**ReAct、Plan-and-Execute、Self-Consistency、Debate、Critic
**典型工具：**Prompt 模板库、Eval Harness、轨迹回放
**典型指标：**偏航率（off-track）、工具误用率、输出一致性、最短路径比

C4. Agent 框架与平台（Frameworks）

**典型热词：**LangChain/LangGraph、AutoGen、CrewAI、Semantic Kernel、Assistants
**典型工具：**这些框架本体 + 连接器市场 + Tracing
**典型指标：**开发周期、可维护性（变更影响面）、可观测覆盖率

C5. Agent 工具生态（Tools Ecosystem）

**典型热词：**Connectors、Tool Calling、MCP、Function Schema、Permissions
**典型工具：**OpenAPI/JSON Schema、API Gateway、OAuth、Secrets Manager
**典型指标：**越权拦截率、工具错误率、凭证泄露事件数、审计覆盖率

D. 编排与自动化层（Workflow / Automation）

**判断框架：**解决“把 AI 节点接入业务系统并形成流程”；输出“可重复运行的自动化”；失败会表现为“流程不稳定、不可审计、改一次崩一片”。

D1. 低代码自动化（iPaaS / Workflow）

**典型热词：**n8n、Zapier、Make、Pipedream、Activepieces、Connector、Trigger/Action
**典型工具：**上述平台 + Webhook + Code Node + Secrets
**典型指标：**运行成功率、平均执行时长、失败重试率、变更导致的回归率

D2. BPM / 流程引擎（Business Process）

**典型热词：**BPMN、DMN、流程编排、审批链、补偿/回滚
**典型工具：**Camunda/Flowable/Zeebe（同类）、规则引擎
**典型指标：**流程吞吐、平均流转时长、节点驳回率、补偿触发率

D3. RPA（桌面自动化）

**典型热词：**UI Automation、Record/Replay、Selector、RPA+LLM、Computer Use
**典型工具：**企业 RPA 平台、Browser Automation、OCR（兜底）
**典型指标：**选择器失效率、界面变更导致失败率、人工接管率

D4. 数据/任务编排（Orchestration）

**典型热词：**DAG、Schedule、Retry、Backfill、Event-driven、Streaming
**典型工具：**Airflow/Dagster/Prefect、Kafka、任务队列
**典型指标：**任务 SLA、失败重跑次数、积压（lag）、端到端延迟

D5. 集成与中台（Integration）

**典型热词：**API Gateway、ESB、MQ、Webhook、Rate Limit、Idempotency
**典型工具：**Kong/Apigee（同类）、Kafka/RabbitMQ、OIDC/OAuth
**典型指标：**调用成功率、P95 延迟、限流命中率、重复请求率

E. 企业级 AI 工程栈（从 Demo 到生产）

**判断框架：**解决“可控、可观测、可评测、可合规的生产系统”；输出“稳定可运营的 AI 能力”；失败会表现为“上线后不可复现/不可追责/成本失控/安全事故”。

E0. 参考架构（Reference Architecture）

**典型热词：**Multi-tenant、Isolation、Audit、SLA、Policy-as-Code
**典型工具：**K8s、API Gateway、IAM、日志/审计平台
**典型指标：**可用性（SLA）、隔离强度、审计覆盖率、变更失败率

E1. RAG（检索增强生成）

**典型热词：**Ingestion、Chunking、Hybrid Search、Re-rank、Grounding、Citations、ACL RAG
**典型工具：**LlamaIndex/LangChain RAG、Unstructured（解析类）、Re-ranker、向量库
**典型指标：**检索命中率、引用正确率、答案可证据率、权限泄露为 0（硬指标）

E2. 向量库 / 检索底座（Vector & Search）

**典型热词：**Vector DB、ANN（HNSW/IVF/PQ）、Hybrid、Metadata Filter、Shard/Replica
**典型工具：**Milvus/Qdrant/Weaviate/pgvector/ES 向量、Embedding 服务
**典型指标：**Recall@K、P95 检索延迟、索引构建时长、成本/容量比

E3. 知识增强（Knowledge Augmentation）

**典型热词：**Knowledge Graph、本体（Ontology）、GraphRAG、Entity Linking、RDF/Property Graph
**典型工具：**Neo4j（同类）、图 ETL、实体消歧、图查询（Cypher/Gremlin）
**典型指标：**实体覆盖率、关系正确率、问答可解释性提升、冷启动收益

E4. 观测与评测（Observability & Evals）

**典型热词：**Tracing、Span、Prompt Playground、Eval Harness、Regression、Golden Set、Replay、Red Team
**典型工具：**OpenTelemetry、Langfuse/LangSmith（同类）、Phoenix/Arize（同类）、Evals 框架
**典型指标：**P95 延迟、单位请求成本、失败率、正确率/胜率、回归检出率（release gate）

E5. 安全与护栏（Guardrails）

**典型热词：**Prompt Injection、Jailbreak、PII/DLP、Tool Permission、Policy Engine、Content Safety
**典型工具：**Guardrails 框架、DLP、OPA（策略）、KMS/Vault（密钥）
**典型指标：**越狱成功率（越低越好）、PII 泄露=0、违规输出率、拦截误杀率

E6. 缓存与成本治理（Cost & Performance）

**典型热词：**Semantic Cache、Prefix Cache、Routing、Model Mix、Budget、Rate Limit、Circuit Breaker
**典型工具：**Redis/KeyDB、API Gateway、路由器（自研/框架）、配额系统
**典型指标：**Cache Hit Rate、单位成本、峰值吞吐、降级触发次数、预算超标率

E7. 部署与推理（Serving & Deployment）

**典型热词：**vLLM/TGI、Streaming、Autoscaling、Canary、Blue-Green、GPU Scheduling
**典型工具：**KServe、Triton、K8s GPU Operator、CI/CD、Feature Flag
**典型指标：**TTFT、P95、GPU 利用率、发布回滚率、容量水位（headroom）

E8. LLMOps（生命周期管理）

**典型热词：**Prompt Registry、Model Registry、Dataset Versioning、Feedback Loop、Human Labeling、Drift
**典型工具：**Prompt 管理（内建/第三方）、数据集版本库、标注平台、在线反馈采集
**典型指标：**提示变更回归率、反馈采集率、标注吞吐、漂移告警命中率

E9. 数据治理（Data Governance）

**典型热词：**ACL、Row/Column Security、Lineage、Audit Log、Data Classification、Retention
**典型工具：**IAM、数据目录/血缘工具、审计日志、脱敏/加密
**典型指标：**权限命中正确率、审计覆盖率、数据泄露事件=0、合规通过率

F. 周边生态（热词高发层）

**判断框架：**解决“让工程更快、更稳、更可复用”；输出“标准/工具/资产库”；失败会表现为“团队各搞各的、重复造轮子、质量不可控”。

F1. Prompt 工程与模板（Prompt Engineering）

**典型热词：**Prompt Patterns、System Prompt、Few-shot、CoT/ReAct、JSON Schema、Tool Spec
**典型工具：**Prompt Playground、模板库、lint/测试用例（Prompt Unit Test）
**典型指标：**提示稳定性（方差）、结构化输出成功率、提示回归失败率

F2. 数据合成与标注（Data Flywheel）

**典型热词：**Synthetic Data、Active Learning、Human Feedback、Preference Data、Edge Cases
**典型工具：**Label Studio（同类）、数据生成脚本、质检流程
**典型指标：**标注一致性（IAA）、边界样本覆盖率、数据污染率、训练收益曲线

F3. 插件/工具市场（Tools / Connectors）

**典型热词：**Connectors、Tool Marketplace、MCP、OpenAPI Tools、OAuth
**典型工具：**连接器平台、API 目录、Secrets 管理
**典型指标：**接入时间、连接器稳定性、权限误配率、工具调用成功率

F4. 多模态输入输出组件（Enablers）

**典型热词：**OCR、Document AI、Layout Parsing、ASR/TTS Pipeline、Screen Parsing
**典型工具：**PDF 解析器、OCR 引擎、ASR/TTS 服务、版面恢复
**典型指标：**OCR 准确率、版面还原率、ASR WER、端到端延迟

F5. 开源社区与评测基准（Open Source & Benchmarks）

**典型热词：**Leaderboards、SWE-bench、RAGAS、AgentBench、Arena
**典型工具：**lm-eval-harness、CI 评测门禁、Benchmark 套件
**典型指标：**基准得分、回归差值、可复现实验率、覆盖面（tasks）

F6. 标准与协议（Standards & Protocols）

**典型热词：**OpenAPI、JSON Schema、MCP、Content Provenance、Watermarking
**典型工具：**Schema 校验、签名/溯源工具、策略与合规规则库
**典型指标：**协议兼容率、工具接入成功率、溯源覆盖率、伪造检测命中率

G. 算力与基础设施层（Compute & Infra：大底座）

**判断框架：**解决“算力供给与运行成本”；输出“稳定算力与平台能力”；失败会表现为“训练/推理跑不动、延迟飙升、成本不可控”。

G1. 硬件层（Hardware）

**典型热词：**GPU/TPU/NPU、VRAM、HBM、NVLink、IB、Edge AI、AI PC
**典型工具：**GPU 驱动/监控、容量规划、设备编排
**典型指标：**GPU 利用率、显存水位、功耗、成本/小时、故障率

G2. 资源与平台层（Platform）

**典型热词：**K8s、Autoscaling、Multi-tenant、Quota、GPU Scheduling、Service Mesh
**典型工具：**Kubernetes、GPU Operator、HPA、Istio/Envoy
**典型指标：**集群利用率、调度失败率、扩缩容耗时、SLO 达成率

G3. 存储与数据底座（Storage）

**典型热词：**Object Storage、Lakehouse、Feature Store、Metadata、Lineage、Logs
**典型工具：**S3/OSS、Delta/Iceberg（同类）、日志系统、元数据目录
**典型指标：**吞吐/IOPS、成本/GB、数据可追溯率、延迟（读写）

G4. 加速软件栈（Acceleration）

**典型热词：**CUDA/ROCm、FlashAttention、Kernel Fusion、TensorRT、ONNX Runtime
**典型工具：**TensorRT、Triton、ONNX Runtime、Profiler
**典型指标：**tokens/s、TTFT、端到端延迟、算子占比、加速收益%

H. 治理与风险层（Governance & Risk：企业必备）

**判断框架：**解决“可控与可追责”；输出“制度+门禁+审计”；失败会表现为“安全事故/合规事故/舆情与法律风险”。

H1. 风险类型（Risk Taxonomy）

**典型热词：**Hallucination、Prompt Injection、Data Leakage、Bias、IP Risk、Model Drift
**典型工具：**风险清单/分级、红队脚本库、合规检查器
**典型指标：**事故数、严重度分布、越狱成功率、泄露=0、漂移告警命中率

H2. 治理机制（Governance Mechanisms）

**典型热词：**RACI、人机分工、审批链、审计留痕、Policy-as-Code、Least Privilege
**典型工具：**IAM、OPA（策略）、KMS/Vault、审计日志、变更门禁
**典型指标：**审计覆盖率、违规拦截率、误杀率、发布门禁通过率

H3. 组织与流程（Org & Process）

**典型热词：**AI CoE、模型治理委员会、Release Gate、红队演练、培训与使用规范
**典型工具：**制度文档、培训体系、应急预案、发布流程
**典型指标：**合规通过率、培训覆盖率、事件响应时间（MTTR）、复发率