使用大模型最让人抓狂的,往往不是它“能力不够”,而是它“不听话”。让它用 JSON 格式输出,它非要在前面加一段解释文字。让它控制在 200 字以内,它总是偷偷多写几十字。让它扮演客服角色,聊到一半它突然开始“理性分析”。这种“指令漂移”是生产环境中的大忌。

ChatGPT 5.5 发布后,我在 KULAAI(dl.877ai.cn)上做了一轮指令遵循专项测试。这个聚合平台能同时接入多个模型,我用同一套复杂指令集去测试各个模型的表现。结果发现,ChatGPT 5.5 在“长文本中的指令一致性”“多约束下的格式遵守”以及“模糊指令的主动澄清”这三个维度上,比上一代有了明显提升。这背后,很可能是一套全新的训练策略在起作用:基于指令层级结构的训练方法。

指令漂移的三个根因
要让模型“听话”,首先得搞清楚它为什么会“不听话”。指令漂移通常来自三个维度。

注意力稀释是最常见的原因。当 Prompt 很长时,模型对开头和结尾的指令记忆最清晰,对中间部分的指令敏感度会下降。你洋洋洒洒写了十条约束,模型可能只认真执行了前三条和后两条。

约束冲突是更隐蔽的问题。你在 Prompt 里要求“简洁回答”又要求“详细展开”,要求“专业严谨”又要求“口语化”。这些指令之间存在内在张力,模型在做选择题时,往往会选择最符合训练分布的表达方式,而不是你最看重的那一个。

角色遗忘则多发于长对话场景。你在一开始设定了“你是客服助手”,但聊到十几轮之后,模型逐渐“忘记”了这个设定,开始以通用助手的方式回复。

理解了这三个根因,就能理解为什么常规的 Prompt 优化治标不治本——问题的根源不在于 Prompt 写得不够好,而在于模型内部的指令理解机制需要升级。

指令层级结构:让模型学会“轻重缓急”
ChatGPT 5.5 在指令遵循上的提升,可能采用了一种新的训练策略:将指令按照重要性、作用域和约束力划分为不同的层级,让模型学会“在冲突时听谁的”。

第一层是核心指令层。这是最高优先级的指令,通常包括角色设定和安全约束。比如“你是客服助手”和“不回答违法问题”属于这一层。核心指令在任何情况下都不能被违背,即使与其他层级的指令产生冲突。

第二层是任务指令层。这层定义当前要完成的具体任务——写一篇文案、分析一段代码、翻译一篇文章。任务指令的重要性仅次于核心指令,但同一个对话中可能会出现多个任务指令的切换。

第三层是格式与风格指令层。这层约束输出的格式要求和语言风格,比如“用 JSON 输出”“口语化表达”“200 字以内”。格式指令在对话的特定阶段有效,当任务切换时,格式指令可能随之变化。

第四层是示例与参考层。这层通过具体的示例来隐式定义期望的行为。示例的优先级低于显式指令,但高于模型的默认行为。

这种层级结构的核心价值在于:当不同指令发生冲突时,模型有了明确的优先级排序。核心指令压倒一切,任务指令高于格式指令,显式指令高于隐式示例。这就解决了“Prompt 中同时要求简洁和详细时模型该怎么办”的问题。

训练方法的三个关键环节
指令层级结构不是靠 Prompt 工程就能实现的,它需要在训练阶段深度内化到模型行为中。

第一个环节是层级化的指令数据集构建。训练数据中的每条指令被显式标注了层级——是核心约束还是格式要求,是全局生效还是局部生效。更重要的是,数据集中包含了大量“指令冲突”的样本——故意让不同层级的指令相互矛盾,然后标注出正确的优先级选择。模型从这些样本中学会了“在冲突时先遵守谁”。

第二个环节是上下文长度对抗训练。注意力稀释是长 Prompt 场景下的顽疾。ChatGPT 5.5 在这方面可能引入了专门的训练策略——在超长 Prompt 的中段随机插入约束指令,然后在最终输出中专门检验这些“中段约束”是否被遵守。模型在大量此类训练后,对长文本中各个位置的指令敏感度趋于均匀。

第三个环节是多轮对话中的角色一致性强化。角色遗忘是多轮对话的痛点。ChatGPT 5.5 可能在这一块做了针对性强化——在训练数据中大量引入多轮对话样本,要求模型在数十轮对话中始终保持初始角色设定的行为特征。模型从中学会了“角色设定是全局约束,除非用户明确要求切换”。

对 Prompt 工程的影响
理解指令层级结构后,Prompt 的写法也需要相应调整。

把最重要的约束放在 Prompt 开头。 虽然 ChatGPT 5.5 对长文本各位置的注意力更均匀,但“首因效应”仍然存在——模型对开头信息更敏感。最关键的指令应该放在最前面,次要的放在后面。

区分指令的优先级。 在 Prompt 中用显式的优先级标注来引导模型的层级判断。比如“核心约束:你扮演客服助手”和“格式要求:用 JSON 输出”。这种层级标注符合模型的指令层级结构,执行效果更好。

避免指令冲突。 如果 Prompt 中同时要求了“简洁”和“详细”,模型会按优先级选择——但优先级是模型内部判断的,结果可能和你的预期不一致。更好的做法是在 Prompt 中就明确优先级,或者避免冲突指令。

善用示例。 示例是成本最低的指令约束方式。一段好的示例胜过大量文字描述。ChatGPT 5.5 从示例中学习行为模式的能力比上一代更强。

在 KULAAI 上做对比测试时,不同的模型对指令层级的理解确实存在差异。Grok 4.3 在严格遵守格式指令上更“死板”——说用 JSON 就绝对不加解释文字。ChatGPT 5.5 在这方面更灵活一些。如果你的场景对格式的绝对一致性要求极高,这一点值得在选型时纳入考量。

总结
ChatGPT 5.5 的指令遵循能力提升,本质上是一次从“听懂字面意思”到“理解指令意图”的质变。指令层级结构让模型学会了在复杂约束下做优先级排序,对抗训练让长文本中的注意力分配更均匀,角色一致性强化让长对话不再“忘本”。

对开发者来说,这意味着 Prompt 可以写得更简洁、更自然。以前需要反复强调的格式约束,现在模型更容易一次记住。但“听话”不等于“完美”——指令遵循能力的提升降低了沟通成本,却并没有消除对 Prompt 质量的需求。好的指令设计,仍然是决定输出质量的关键变量。

在 KULAAI 上同时接入 ChatGPT 5.5 和其他主流模型做指令遵循的对比测试,是理解各自能力边界的有效方式——不是为了找最强的模型,而是为了找到最“听得懂你话”的那个。