↓ 跳过正文

AI

当标量 reward 不够用时：GEPA 与 compound AI 的反思式文本进化

当标量 reward 不够用时：GEPA 与 compound AI 的反思式文本进化

2026年5月18日·5338 字·11 分钟

当标量 reward 不够用时：GEPA 与 compound AI 的反思式文本进化

从 RAG 到 Search Agent：检索、合成数据与评测的三条张力

从 RAG 到 Search Agent：检索、合成数据与评测的三条张力

2026年5月18日·4398 字·9 分钟

从 RAG 到 Search Agent：检索、合成数据与评测的三条张力

充分上下文：RAG 该测「够不够答」，而不只是「像不像相关」

充分上下文：RAG 该测「够不够答」，而不只是「像不像相关」

2026年5月18日·5316 字·11 分钟

充分上下文：RAG 该测「够不够答」，而不只是「像不像相关」

半结构化检索上的 Agent：STaRK 基准与 AvaTaR 优化

2026年5月18日·4883 字·10 分钟

半结构化检索上的 Agent：STaRK 基准与 AvaTaR 优化

REFRAG：把 RAG 上下文从「token 串」变成可压缩表示

REFRAG：把 RAG 上下文从「token 串」变成可压缩表示

2026年5月18日·5121 字·11 分钟

REFRAG：把 RAG 上下文从「token 串」变成可压缩表示

Judge-Time Compute：当 LLM 评测从「单次打分」变成可组合管线

Judge-Time Compute：当 LLM 评测从「单次打分」变成可组合管线

2026年5月18日·8905 字·18 分钟

Judge-Time Compute：当 LLM 评测从「单次打分」变成可组合管线

Data Agent：当「会写代码的模型」撞上真实数据栈

Data Agent：当「会写代码的模型」撞上真实数据栈

2026年5月18日·4848 字·10 分钟

Data Agent：当「会写代码的模型」撞上真实数据栈

Compound AI：当「一次 LLM 调用」不够用时

Compound AI：当「一次 LLM 调用」不够用时

2026年5月18日·4604 字·10 分钟

Compound AI：当「一次 LLM 调用」不够用时

AI 驱动搜索：当 RAG、Agent 与经典 IR 重新接线

AI 驱动搜索：当 RAG、Agent 与经典 IR 重新接线

2026年5月18日·4941 字·10 分钟

AI 驱动搜索：当 RAG、Agent 与经典 IR 重新接线

Agentic 主题建模：嵌入管线、LLM 与人在环内的工程权衡

Agentic 主题建模：嵌入管线、LLM 与人在环内的工程权衡

2026年5月18日·4974 字·10 分钟

Agentic 主题建模：嵌入管线、LLM 与人在环内的工程权衡

Agentic RAG：当检索管线长出「规划与工具环」

Agentic RAG：当检索管线长出「规划与工具环」

2026年5月18日·5035 字·11 分钟

Agentic RAG：当检索管线长出「规划与工具环」

Agent 监督栈：从静态评测到轨迹级可观测性

Agent 监督栈：从静态评测到轨迹级可观测性

2026年5月18日·4499 字·9 分钟

Agent 监督栈：从静态评测到轨迹级可观测性