AI(人工智能)大地图
A. 模型层(Model Layer:能力的源头)
**判断框架:**解决“能力从哪来、上限在哪、怎么训练/适配/推理”;输出“模型能力与成本曲线”;失败会表现为“能力不够/不可控/成本爆炸/延迟不可用”。
A0. AI 基础范式(Paradigms)
- **典型热词:**Symbolic AI、ML/DL、Self-supervised、RL、Generative AI、Diffusion
- **典型工具:**scikit-learn、PyTorch、TensorFlow/JAX、Ray
- **典型指标:**Accuracy/F1/AUC、Loss、样本效率、泛化误差、稳定性(方差/漂移)
A1. 基础模型 / Foundation Models(大模型家族)
-
**典型热词:**LLM、VLM、多模态、Embedding、MoE、World Model、SLM/端侧
-
**典型工具:**Hugging Face Transformers、Diffusers、OpenAI/Anthropic/Google API、Ollama(本地)
-
**典型指标:**能力基准(MMLU/GPQA/…)、上下文长度、幻觉率、对齐一致性、单位 token 成本
-
A1.1 LLM(文本大语言模型)
-
A1.1.1 通用指令模型(Chat / Instruct)
- A1.1.1.1 多轮对话与工具使用(Chat + Tools)
-
A1.1.2 代码模型(Code LLM)
- A1.1.2.1 代码生成/补全/重构/修复
-
A1.1.3 领域模型(Domain LLM)
- A1.1.3.1 法务/财务/医疗/客服/科研
-
A1.1.4 小模型与端侧模型(SLM / On-device)
- A1.1.4.1 低延迟/隐私/离线
-
-
A1.2 Embedding Model(向量表征)
-
A1.2.1 文本向量
- A1.2.1.1 语义检索/聚类/相似度
-
A1.2.2 多模态向量
- A1.2.2.1 跨模态检索
-
-
A1.3 VLM(视觉-语言)
-
A1.3.1 图像理解(VQA/OCR-aware)
- A1.3.1.1 图表/表格/截图理解
-
A1.3.2 视觉推理
- A1.3.2.1 目标识别+关系推断
-
-
A1.4 图像生成(Image Gen)
-
A1.4.1 文生图
- A1.4.1.1 风格化/局部重绘/编辑
-
A1.4.2 图生图
- A1.4.2.1 超分/去噪/修复
-
-
A1.5 语音/音频(Speech/Audio)
-
A1.5.1 ASR
- A1.5.1.1 流式识别/说话人分离
-
A1.5.2 TTS
- A1.5.2.1 音色/情绪/韵律
-
A1.5.3 音频理解
- A1.5.3.1 事件识别/场景分类
-
A1.5.4 音乐生成
- A1.5.4.1 作曲/编曲/伴奏
-
-
A1.6 视频(Video)
-
A1.6.1 视频理解
- A1.6.1.1 检索/动作识别/摘要
-
A1.6.2 视频生成
- A1.6.2.1 T2V/I2V
-
A1.6.3 视频编辑
- A1.6.3.1 剪辑/风格转换
-
-
A1.7 多模态大模型(Multimodal FM)
-
A1.7.1 多模态联合输入输出
- A1.7.1.1 跨模态推理与对齐
-
A1.7.2 屏幕/界面理解(Computer Use)
- A1.7.2.1 看屏幕→操作
-
-
A1.8 结构化/时序/图(Structured/TS/Graph)
-
A1.8.1 NL2SQL/指标解释
- A1.8.1.1 对话式 BI
-
A1.8.2 时序预测与异常
- A1.8.2.1 告警归因
-
A1.8.3 图推理/GNN
- A1.8.3.1 关系网络/知识图谱推理
-
-
A1.9 世界模型/具身(World/Embodied)
-
A1.9.1 机器人控制闭环
- A1.9.1.1 Perception-Plan-Act
-
A1.9.2 空间智能与导航
- A1.9.2.1 SLAM/场景建模
-
A2. 模型结构与架构(Architectures)
- **典型热词:**Decoder-only、MoE、Sparsity、KV Cache、Long-Context、Diffusion U-Net、ControlNet
- **典型工具:**Transformers、DeepSpeed、FSDP、FlashAttention、xFormers
- **典型指标:**参数量/激活占用、吞吐 tokens/s、TTFT、显存占用、训练稳定性(loss spike)
A3. 训练与对齐(Training & Alignment)
- **典型热词:**Pretraining、SFT、RLHF/RLAIF、DPO、Alignment、Red Team、Adversarial Training
- **典型工具:**DeepSpeed、Accelerate、TRL、Weights & Biases、Label Studio
- **典型指标:**训练 loss/perplexity、对齐偏好胜率、拒答/越狱成功率、数据质量(重复率/污染率)
A4. 适配、压缩与个性化(Adaptation & Compression)
- **典型热词:**LoRA/QLoRA、PEFT、Distillation、Quantization(INT8/INT4)、GGUF、On-device
- **典型工具:**PEFT、bitsandbytes、GGML/GGUF 工具链、TensorRT/ONNX Runtime
- **典型指标:**质量回退幅度、模型大小、推理延迟、端侧功耗、个性化命中率/满意度
A5. 推理与服务(Inference & Serving)
- **典型热词:**Serving、Batching、Speculative Decoding、KV Cache、Streaming、Router/Fallback
- **典型工具:**vLLM、TGI、Triton、KServe、Istio/Envoy
- **典型指标:**P50/P95 延迟、TTFT、吞吐 QPS/tokens/s、GPU 利用率、失败率/超时率
A6. 模型供给形态(Supply Modes)
- **典型热词:**API、Managed Endpoint、Self-host、Hybrid、Model Mix、Routing、SLA
- **典型工具:**OpenAI/Anthropic/Google、Azure/AWS/GCP、API Gateway、Feature Flag
- **典型指标:**单位成本($/1M tokens)、SLA、合规覆盖(地域/数据)、可用性(99.9%)
A7. 评测基准(Benchmarks)
- **典型热词:**MMLU、SWE-bench、RAGAS、AgentBench、MT-Bench、Red Team Evals
- **典型工具:**lm-eval-harness、OpenAI Evals、Ragas、DeepEval
- **典型指标:**准确率/胜率、任务完成率、引用正确率、越狱率、回归失败率(regression)
B. 生成式应用层(AIGC:输出内容的产品形态)
**判断框架:**解决“用户真正要的产出是什么”;输出“可交付内容/可用功能”;失败会表现为“看起来聪明但不可用、不可复用、不可规模化”。
B0. 通用入口形态(Entry Points)
- **典型热词:**Chatbot、Copilot、Answer Engine、AI Search
- **典型工具:**Chat UI 框架、Browser Extension、企业 IM Bot(飞书/Slack)
- **典型指标:**DAU/留存、会话成功率、首轮命中率、满意度(CSAT)
B1. 文本内容生产(Text Content)
- **典型热词:**写作助手、摘要、润色、结构化写作、模板化写作
- **典型工具:**Docs 插件、Markdown 生成器、引用与大纲工具
- **典型指标:**编辑节省时间、一次通过率、事实错误率、用户采纳率
B2. 办公与知识工作(Office & KM)
- **典型热词:**Meeting Minutes、Action Items、Enterprise KB、SOP/PRD Copilot
- **典型工具:**会议转写(ASR)、知识库(Confluence/Notion/飞书文档)+ RAG
- **典型指标:**检索命中率、引用覆盖率、工单减少量、知识复用率
B3. 编程与研发(AI Coding)
- **典型热词:**Copilot、Code Review、PR Summary、Test Gen、Bug Fix
- **典型工具:**IDE 插件、CI 集成、SAST/依赖扫描
- **典型指标:**合并周期缩短、缺陷密度、测试覆盖率提升、回滚率
B4. 数据分析与 BI(Data & Analytics)
- **典型热词:**NL2SQL、ChatBI、Auto Insights、RCA Draft、Metric Copilot
- **典型工具:**语义层/指标平台、SQL Gateway、BI(Tableau/PowerBI/Looker)
- **典型指标:**查询正确率、口径一致率、洞察采纳率、误报/漏报率
B5. 图像与设计(Image/Design)
- **典型热词:**Text-to-Image、Inpainting、Outpainting、风格迁移、商品图
- **典型工具:**Stable Diffusion 系、Photoshop 插件、素材库/品牌规范
- **典型指标:**审核通过率、点击率提升、制作周期缩短、侵权风险事件数
B6. 视频(Video)
- **典型热词:**T2V、I2V、自动剪辑、分镜、数字人
- **典型工具:**剪辑工具链、字幕/配音流水线、素材管理
- **典型指标:**完播率、制作时长节省、内容合规命中率、返工率
B7. 语音(Voice)
- **典型热词:**ASR、TTS、语音助手、外呼、同传、音色克隆
- **典型工具:**流式 ASR、TTS 引擎、呼叫中心系统
- **典型指标:**WER(识别错词率)、实时延迟、通话完成率、投诉率
B8. 业务职能 Copilot(Role-based)
- **典型热词:**Sales Copilot、客服助手、财务助手、法务审阅、HR 助手
- **典型工具:**CRM/工单/ERP 连接器、审批流、权限体系
- **典型指标:**人效提升、转化率、工单一次解决率、合规错误数
B9. 行业与场景(Vertical & Scenarios)
- **典型热词:**行业知识库、流程助手、合规 AI、领域大模型
- **典型工具:**行业数据源、术语库、本体/知识图谱、私有化部署
- **典型指标:**业务 KPI(因行业而异)、可解释性、合规通过率、风险事件数
C. Agent 层(Agent:让 AI 能做事的行为范式)
**判断框架:**解决“从回答到行动(Plan→Act)”;输出“可执行的任务完成”;失败会表现为“乱调用工具/越权/跑偏/不可控成本”。
C1. Agent 运行形态(Runtime Shapes)
- **典型热词:**Single Agent、Multi-Agent、Autonomous、Computer Use、RPA+LLM
- **典型工具:**Browser Agent、Desktop Automation、Sandbox Runtime
- **典型指标:**任务完成率、平均步数、回退/重试率、人工介入率
C2. Agent 关键模块(Core Modules)
- **典型热词:**Planner、Memory、Tools、State Machine、Reflection、Human-in-the-loop
- **典型工具:**LangGraph、Temporal(工作流)、向量库(记忆)、Policy Engine
- **典型指标:**计划可解释性、工具调用成功率、记忆命中率、错误恢复时间
C3. Agent 推理-行动模式(Reason+Act Patterns)
- **典型热词:**ReAct、Plan-and-Execute、Self-Consistency、Debate、Critic
- **典型工具:**Prompt 模板库、Eval Harness、轨迹回放
- **典型指标:**偏航率(off-track)、工具误用率、输出一致性、最短路径比
C4. Agent 框架与平台(Frameworks)
- **典型热词:**LangChain/LangGraph、AutoGen、CrewAI、Semantic Kernel、Assistants
- **典型工具:**这些框架本体 + 连接器市场 + Tracing
- **典型指标:**开发周期、可维护性(变更影响面)、可观测覆盖率
C5. Agent 工具生态(Tools Ecosystem)
- **典型热词:**Connectors、Tool Calling、MCP、Function Schema、Permissions
- **典型工具:**OpenAPI/JSON Schema、API Gateway、OAuth、Secrets Manager
- **典型指标:**越权拦截率、工具错误率、凭证泄露事件数、审计覆盖率
D. 编排与自动化层(Workflow / Automation)
**判断框架:**解决“把 AI 节点接入业务系统并形成流程”;输出“可重复运行的自动化”;失败会表现为“流程不稳定、不可审计、改一次崩一片”。
D1. 低代码自动化(iPaaS / Workflow)
- **典型热词:**n8n、Zapier、Make、Pipedream、Activepieces、Connector、Trigger/Action
- **典型工具:**上述平台 + Webhook + Code Node + Secrets
- **典型指标:**运行成功率、平均执行时长、失败重试率、变更导致的回归率
D2. BPM / 流程引擎(Business Process)
- **典型热词:**BPMN、DMN、流程编排、审批链、补偿/回滚
- **典型工具:**Camunda/Flowable/Zeebe(同类)、规则引擎
- **典型指标:**流程吞吐、平均流转时长、节点驳回率、补偿触发率
D3. RPA(桌面自动化)
- **典型热词:**UI Automation、Record/Replay、Selector、RPA+LLM、Computer Use
- **典型工具:**企业 RPA 平台、Browser Automation、OCR(兜底)
- **典型指标:**选择器失效率、界面变更导致失败率、人工接管率
D4. 数据/任务编排(Orchestration)
- **典型热词:**DAG、Schedule、Retry、Backfill、Event-driven、Streaming
- **典型工具:**Airflow/Dagster/Prefect、Kafka、任务队列
- **典型指标:**任务 SLA、失败重跑次数、积压(lag)、端到端延迟
D5. 集成与中台(Integration)
- **典型热词:**API Gateway、ESB、MQ、Webhook、Rate Limit、Idempotency
- **典型工具:**Kong/Apigee(同类)、Kafka/RabbitMQ、OIDC/OAuth
- **典型指标:**调用成功率、P95 延迟、限流命中率、重复请求率
E. 企业级 AI 工程栈(从 Demo 到生产)
**判断框架:**解决“可控、可观测、可评测、可合规的生产系统”;输出“稳定可运营的 AI 能力”;失败会表现为“上线后不可复现/不可追责/成本失控/安全事故”。
E0. 参考架构(Reference Architecture)
- **典型热词:**Multi-tenant、Isolation、Audit、SLA、Policy-as-Code
- **典型工具:**K8s、API Gateway、IAM、日志/审计平台
- **典型指标:**可用性(SLA)、隔离强度、审计覆盖率、变更失败率
E1. RAG(检索增强生成)
- **典型热词:**Ingestion、Chunking、Hybrid Search、Re-rank、Grounding、Citations、ACL RAG
- **典型工具:**LlamaIndex/LangChain RAG、Unstructured(解析类)、Re-ranker、向量库
- **典型指标:**检索命中率、引用正确率、答案可证据率、权限泄露为 0(硬指标)
E2. 向量库 / 检索底座(Vector & Search)
- **典型热词:**Vector DB、ANN(HNSW/IVF/PQ)、Hybrid、Metadata Filter、Shard/Replica
- **典型工具:**Milvus/Qdrant/Weaviate/pgvector/ES 向量、Embedding 服务
- **典型指标:**Recall@K、P95 检索延迟、索引构建时长、成本/容量比
E3. 知识增强(Knowledge Augmentation)
- **典型热词:**Knowledge Graph、本体(Ontology)、GraphRAG、Entity Linking、RDF/Property Graph
- **典型工具:**Neo4j(同类)、图 ETL、实体消歧、图查询(Cypher/Gremlin)
- **典型指标:**实体覆盖率、关系正确率、问答可解释性提升、冷启动收益
E4. 观测与评测(Observability & Evals)
- **典型热词:**Tracing、Span、Prompt Playground、Eval Harness、Regression、Golden Set、Replay、Red Team
- **典型工具:**OpenTelemetry、Langfuse/LangSmith(同类)、Phoenix/Arize(同类)、Evals 框架
- **典型指标:**P95 延迟、单位请求成本、失败率、正确率/胜率、回归检出率(release gate)
E5. 安全与护栏(Guardrails)
- **典型热词:**Prompt Injection、Jailbreak、PII/DLP、Tool Permission、Policy Engine、Content Safety
- **典型工具:**Guardrails 框架、DLP、OPA(策略)、KMS/Vault(密钥)
- **典型指标:**越狱成功率(越低越好)、PII 泄露=0、违规输出率、拦截误杀率
E6. 缓存与成本治理(Cost & Performance)
- **典型热词:**Semantic Cache、Prefix Cache、Routing、Model Mix、Budget、Rate Limit、Circuit Breaker
- **典型工具:**Redis/KeyDB、API Gateway、路由器(自研/框架)、配额系统
- **典型指标:**Cache Hit Rate、单位成本、峰值吞吐、降级触发次数、预算超标率
E7. 部署与推理(Serving & Deployment)
- **典型热词:**vLLM/TGI、Streaming、Autoscaling、Canary、Blue-Green、GPU Scheduling
- **典型工具:**KServe、Triton、K8s GPU Operator、CI/CD、Feature Flag
- **典型指标:**TTFT、P95、GPU 利用率、发布回滚率、容量水位(headroom)
E8. LLMOps(生命周期管理)
- **典型热词:**Prompt Registry、Model Registry、Dataset Versioning、Feedback Loop、Human Labeling、Drift
- **典型工具:**Prompt 管理(内建/第三方)、数据集版本库、标注平台、在线反馈采集
- **典型指标:**提示变更回归率、反馈采集率、标注吞吐、漂移告警命中率
E9. 数据治理(Data Governance)
- **典型热词:**ACL、Row/Column Security、Lineage、Audit Log、Data Classification、Retention
- **典型工具:**IAM、数据目录/血缘工具、审计日志、脱敏/加密
- **典型指标:**权限命中正确率、审计覆盖率、数据泄露事件=0、合规通过率
F. 周边生态(热词高发层)
**判断框架:**解决“让工程更快、更稳、更可复用”;输出“标准/工具/资产库”;失败会表现为“团队各搞各的、重复造轮子、质量不可控”。
F1. Prompt 工程与模板(Prompt Engineering)
- **典型热词:**Prompt Patterns、System Prompt、Few-shot、CoT/ReAct、JSON Schema、Tool Spec
- **典型工具:**Prompt Playground、模板库、lint/测试用例(Prompt Unit Test)
- **典型指标:**提示稳定性(方差)、结构化输出成功率、提示回归失败率
F2. 数据合成与标注(Data Flywheel)
- **典型热词:**Synthetic Data、Active Learning、Human Feedback、Preference Data、Edge Cases
- **典型工具:**Label Studio(同类)、数据生成脚本、质检流程
- **典型指标:**标注一致性(IAA)、边界样本覆盖率、数据污染率、训练收益曲线
F3. 插件/工具市场(Tools / Connectors)
- **典型热词:**Connectors、Tool Marketplace、MCP、OpenAPI Tools、OAuth
- **典型工具:**连接器平台、API 目录、Secrets 管理
- **典型指标:**接入时间、连接器稳定性、权限误配率、工具调用成功率
F4. 多模态输入输出组件(Enablers)
- **典型热词:**OCR、Document AI、Layout Parsing、ASR/TTS Pipeline、Screen Parsing
- **典型工具:**PDF 解析器、OCR 引擎、ASR/TTS 服务、版面恢复
- **典型指标:**OCR 准确率、版面还原率、ASR WER、端到端延迟
F5. 开源社区与评测基准(Open Source & Benchmarks)
- **典型热词:**Leaderboards、SWE-bench、RAGAS、AgentBench、Arena
- **典型工具:**lm-eval-harness、CI 评测门禁、Benchmark 套件
- **典型指标:**基准得分、回归差值、可复现实验率、覆盖面(tasks)
F6. 标准与协议(Standards & Protocols)
- **典型热词:**OpenAPI、JSON Schema、MCP、Content Provenance、Watermarking
- **典型工具:**Schema 校验、签名/溯源工具、策略与合规规则库
- **典型指标:**协议兼容率、工具接入成功率、溯源覆盖率、伪造检测命中率
G. 算力与基础设施层(Compute & Infra:大底座)
**判断框架:**解决“算力供给与运行成本”;输出“稳定算力与平台能力”;失败会表现为“训练/推理跑不动、延迟飙升、成本不可控”。
G1. 硬件层(Hardware)
- **典型热词:**GPU/TPU/NPU、VRAM、HBM、NVLink、IB、Edge AI、AI PC
- **典型工具:**GPU 驱动/监控、容量规划、设备编排
- **典型指标:**GPU 利用率、显存水位、功耗、成本/小时、故障率
G2. 资源与平台层(Platform)
- **典型热词:**K8s、Autoscaling、Multi-tenant、Quota、GPU Scheduling、Service Mesh
- **典型工具:**Kubernetes、GPU Operator、HPA、Istio/Envoy
- **典型指标:**集群利用率、调度失败率、扩缩容耗时、SLO 达成率
G3. 存储与数据底座(Storage)
- **典型热词:**Object Storage、Lakehouse、Feature Store、Metadata、Lineage、Logs
- **典型工具:**S3/OSS、Delta/Iceberg(同类)、日志系统、元数据目录
- **典型指标:**吞吐/IOPS、成本/GB、数据可追溯率、延迟(读写)
G4. 加速软件栈(Acceleration)
- **典型热词:**CUDA/ROCm、FlashAttention、Kernel Fusion、TensorRT、ONNX Runtime
- **典型工具:**TensorRT、Triton、ONNX Runtime、Profiler
- **典型指标:**tokens/s、TTFT、端到端延迟、算子占比、加速收益%
H. 治理与风险层(Governance & Risk:企业必备)
**判断框架:**解决“可控与可追责”;输出“制度+门禁+审计”;失败会表现为“安全事故/合规事故/舆情与法律风险”。
H1. 风险类型(Risk Taxonomy)
- **典型热词:**Hallucination、Prompt Injection、Data Leakage、Bias、IP Risk、Model Drift
- **典型工具:**风险清单/分级、红队脚本库、合规检查器
- **典型指标:**事故数、严重度分布、越狱成功率、泄露=0、漂移告警命中率
H2. 治理机制(Governance Mechanisms)
- **典型热词:**RACI、人机分工、审批链、审计留痕、Policy-as-Code、Least Privilege
- **典型工具:**IAM、OPA(策略)、KMS/Vault、审计日志、变更门禁
- **典型指标:**审计覆盖率、违规拦截率、误杀率、发布门禁通过率
H3. 组织与流程(Org & Process)
- **典型热词:**AI CoE、模型治理委员会、Release Gate、红队演练、培训与使用规范
- **典型工具:**制度文档、培训体系、应急预案、发布流程
- **典型指标:**合规通过率、培训覆盖率、事件响应时间(MTTR)、复发率