Hollis【实战课程】2026年大模型应用开发实战

闭源模型微调实战：OpenAI模型的微调流程与Function Calling定制

前言

随着大模型应用从“通用对话”走向“垂直业务”，Prompt Engineering 的局限性逐渐显现。当我们需要模型精准执行复杂的业务逻辑、掌握特定的工具调用规范，或者在降低 Token 消耗的同时保持高准确率时，微调（Fine-Tuning）成为了必经之路。

本文将结合 OpenAI 最新的微调规范，深入探讨闭源模型的微调流程，并重点拆解如何通过微调定制 Function Calling（函数调用）能力，打造工业级 Agent。

一、为什么 Function Calling 必须做微调？

在面试或工程实践中，我们常被问到：“光靠 Prompt 不够吗？”

Prompt 本质上是“规则”，而 LLM 的大脑并非 if-else 程序。对于复杂的业务流程，Prompt 存在三大瓶颈：
分支逻辑不稳定：当面临“缺信息需追问”、“多步调用”等复杂条件时，Prompt 难以保证模型稳定执行。
缺乏链式调用意识：Prompt 只能告诉模型“请调用工具”，但无法让模型真正理解工具之间的依赖关系（如：先查攻略，再查天气）。
Token 成本高昂：在 Prompt 中塞入大量工具定义和 Few-shot 示例，会严重挤占上下文窗口并增加计费。

微调的核心价值在于：将“规则”转化为模型的“肌肉记忆”，减少提示令牌（Prompt Tokens），并显著提高输出的准确性和一致性。

二、核心实战：Function Calling 训练数据构造

️ 注意：OpenAI 官方已弃用 function_call 和 functions 参数，强烈推荐使用 tools 参数。

构造高质量的 JSONL 训练文件是微调成功的基石。一个标准的 Function Calling 训练样本需要包含完整的“用户提问 -> 模型决策 -> 工具执行 -> 最终回复”闭环。

基础工具调用样本

{
"messages": [

{ "role": "user", "content": "旧金山现在的天气怎么样？" },
{
  "role": "assistant",
  "tool_calls": [
    {
      "id": "call_id_123",
      "type": "function",
      "function": {
        "name": "get_current_weather",
        "arguments": "{"location": "San Francisco, USA", "format": "celsius"}"
      }
    }
  ]
}

],
"tools": [

{
  "type": "function",
  "function": {
    "name": "get_current_weather",
    "description": "获取指定城市的当前天气",
    "parameters": {
      "type": "object",
      "properties": {
        "location": { "type": "string", "description": "城市和国家，例如 San Francisco, USA" },
        "format": { "type": "string", "enum": ["celsius", "fahrenheit"] }
      },
      "required": ["location", "format"]
    }
  }
}

]
}

带工具结果的合成回复样本

为了让模型学会如何“优雅地解释工具结果”，我们需要提供包含 tool 角色的完整对话链：

{
"messages": [

{ "role": "user", "content": "旧金山现在的天气怎么样？" },
{
  "role": "assistant",
  "tool_calls": [
    {
      "id": "call_id_123",
      "type": "function",
      "function": {
        "name": "get_current_weather",
        "arguments": "{"location": "San Francisco, USA", "format": "celsius"}"
      }
    }
  ]
},
{ "role": "tool", "tool_call_id": "call_id_123", "content": "21.0" },
{ "role": "assistant", "content": "旧金山目前的气温是 21 摄氏度。" }

],
"tools": []
}

三、进阶优化：Token 压缩与成本控制

微调的一大优势是降低推理成本。在训练完成后，我们可以通过以下策略在推理时大幅减少 Prompt Token：

省略说明：从函数和参数中删除 description 字段。
省略参数详情：从 properties 对象中删除整个 parameters 字段。
完全省略函数：直接从 tools 数组中删除整个函数对象。

原理：模型在微调阶段已经“记住”了这些工具的规范，推理时无需重复注入冗长的 Schema 定义。但请注意，微调数据集和后续推理调用中的函数定义必须保持严格一致。

四、工程避坑指南

数据量与质量
官方建议训练文件至少包含 10 个示例，但这仅是跑通流程的底线。对于复杂的业务逻辑（如多轮追问、Fallback 机制），建议准备数百至上千条高质量合成数据。

严格模式（Strict Mode）
在定义工具时，将 strict 设置为 true 可以强制模型输出符合 JSON Schema 的参数。
注意：如果使用的是微调模型，且模型在一个回合中触发了并行工具调用（Parallel Function Calling），严格模式将被自动禁用。

工具选择（Tool Choice）
在微调模型的推理阶段，可以通过 tool_choice 参数控制模型行为：
auto：模型自主决定是否调用工具。
required：强制模型调用一个或多个工具。
{"type": "function", "name": "xxx"}：强制调用特定工具。

五、总结

Function Calling 微调的难点不在于工具本身，而在于决策逻辑。一个优秀的 Agent 不仅要“会调用工具”，更要学会“什么时候反问”、“调用顺序是什么”以及“工具失败后如何优雅降级”。

通过高质量的 JSONL 数据构造、合理的 Token 压缩策略以及严谨的工程测试，我们可以将闭源模型从“聪明的文字处理器”真正打造成“可靠的业务执行引擎”。

互动：你在微调 Agent 时遇到过哪些“幻觉”或“死循环”问题？欢迎在评论区分享你的踩坑经验！*

Hollis【实战课程】2026年大模型应用开发实战

97it

引用和评论

Linux云计算大数据 Linux云计算-价值24800元-重磅首发-完结无秘（看主页）

GPT-5.5价格翻倍后该如何选型？Agent能力评测与最佳实践

Ollama ｜本地 AI 大模型部署工具使用教程

实测3款国内可用镜像站，只有o.zzmax稳定运行Gemini 3.1 Pro

全球LLM大模型客户端体验深度测评（二）：国产九大势力各显神通（截至2026年4月）

强推Qwen3.5-27B-Claude-4.6-Opus-Reasoning-Distilled 蒸馏模型

AI API 中转站评测：模型、稳定与治理三重解析

Hollis【实战课程】2026年大模型应用开发实战

97it

引用和评论

Linux云计算大数据 Linux云计算-价值24800元-重磅首发-完结无秘 （看主页）

GPT-5.5价格翻倍后该如何选型？Agent能力评测与最佳实践

Ollama ｜本地 AI 大模型部署工具使用教程

实测3款国内可用镜像站，只有o.zzmax稳定运行Gemini 3.1 Pro

全球LLM大模型客户端体验深度测评（二）：国产九大势力各显神通（截至2026年4月）

强推Qwen3.5-27B-Claude-4.6-Opus-Reasoning-Distilled 蒸馏模型

AI API 中转站评测：模型、稳定与治理三重解析

Linux云计算大数据 Linux云计算-价值24800元-重磅首发-完结无秘（看主页）