当标量 reward 不够用时:GEPA 与 compound AI 的反思式文本进化2026年5月18日·5338 字·11 分钟当标量 reward 不够用时:GEPA 与 compound AI 的反思式文本进化
Judge-Time Compute:当 LLM 评测从「单次打分」变成可组合管线2026年5月18日·8905 字·18 分钟Judge-Time Compute:当 LLM 评测从「单次打分」变成可组合管线