单模型创作有天花板。Grok 写文章结构强但语言偏克制,GPT 语言感染力强但有时废话多,Gemini 多模态理解好但中文写作不如前两者。死磕一个模型,总要在某些环节妥协。
这几个月在 KULAAI(dl.877ai.cn)上同时用 Grok 4.3、Gemini 2.5 和 GPT-5.5,摸索出一套“三模型分工”的创作工作流:Grok 搭骨架,Gemini 配视觉,GPT 做润色。三个模型各司其职,出来的内容既有结构又有温度,还图文并茂。
这篇文章分享这套工作流的具体分工和实操技巧。
为什么要三模型分工
写作这件事可以拆成三个核心环节:结构搭建、内容填充、语言打磨。
结构搭建需要逻辑清晰、重点突出、不跑题。这是 Grok 4.3 的强项——它指令遵从度高,不会在写大纲时自由发挥,生成的框架严谨且克制。
内容填充需要信息密度高、案例具体、数据准确。Grok 同样擅长,它不写废话,每段话都有信息增量。
语言打磨需要读起来有温度、有节奏、有感染力。这是 GPT-5.5 的强项——它语言自然流畅,能根据场景调整语气,能把一句干巴巴的话改得让人愿意读下去。
配图创意需要理解文章内容,生成与之匹配的视觉方案。这是 Gemini 2.5 的强项——它多模态理解能力强,能根据文章内容生成精准的配图提示词,甚至直接出图。
三个模型,覆盖了创作的四个核心环节。不用在一个模型上反复调 Prompt 调到崩溃。
第一步:用 Grok 4.3 搭建文章骨架
文章质量的上限,由骨架决定。骨架散掉,后面再怎么润色也救不回来。
我的做法: 把文章主题、目标读者、核心观点、字数要求、风格要求一股脑告诉 Grok 4.3,让它生成详细大纲。
Prompt 示例:
text
请为以下文章主题设计一个详细大纲。
文章主题:[主题]
目标读者:[读者画像]
核心观点:[你最想传达的 2-3 个核心观点]
字数要求:[如 2000 字]
风格:[如 技术实战/观点输出/产品评测]
要求:
- 包含文章标题(3-5 个备选)
- 详细到 H2 和 H3 级别
- 每个章节标注核心要点和预估字数
- 标注需要数据支撑或案例引用的位置
- 标注可以插入配图的位置和图片类型建议
Grok 4.3 生成的大纲,结构清晰、章节之间逻辑递进合理、重点突出。它不会像某些模型那样把大纲写得像散文,而是实实在在的“施工蓝图”。
拿到大纲后,我会快速审核一遍:逻辑顺不顺、重点偏不偏、有没有遗漏。大纲确认后,再让 Grok 4.3 逐章节填充初稿。
第二步:用 Grok 4.3 填充内容初稿
骨架有了,下一步是填充血肉。这个环节的核心要求是:信息密度高、逻辑严谨、不写废话。
我的做法: 按大纲章节逐一让 Grok 4.3 生成正文,每章单独 Prompt,确保每章都有足够的信息密度。
Prompt 示例:
text
请根据以下大纲章节,展开写正文。
大纲章节:[粘贴当前章节的大纲要点]
文章主题:[全文主题]
目标读者:[读者画像]
本章预估字数:[如 300 字]
要求:
- 信息密度高,每段话都有实质性内容
- 关键观点用具体案例或数据支撑
- 语言专业但不生硬
- 不写“本文”“笔者”“随着时代的发展”等废话词
- 段落短,适合碎片化阅读
Grok 4.3 的初稿特点很鲜明:精炼、克制、不废话。它的输出像一份“干货笔记”——每段话都有信息增量,不会为凑字数而写一堆修饰语。
但这也意味着它的初稿读起来可能“太干”。特别是开头和结尾,缺少情感共鸣和节奏变化。这正是下一步 GPT-5.5 要做的事。
在 KULAAI 上,我一般一次开两个对话窗口:一个给 Grok 4.3 逐章生成初稿,一个给 Gemini 2.5 同步出配图方案。两边并行,效率翻倍。
第三步:用 Gemini 2.5 出配图方案
纯文字文章和图文并茂的文章,阅读体验天差地别。但配图这件事,技术类作者尤其头疼——不知道哪里该放图、放什么图、图怎么设计。
Gemini 2.5 的多模态理解能力正好派上用场。
我的做法: 把 Grok 4.3 写好的初稿喂给 Gemini 2.5,让它分析文章内容,给出配图方案。
Prompt 示例:
text
请阅读以下文章,帮我设计配图方案。
文章内容:[粘贴 Grok 4.3 生成的初稿]
要求:
- 标注文章中适合插入配图的位置(至少 5 处)
- 每个配图位置说明:图片类型、图片内容描述、配图目的、建议尺寸
- 生成可直接使用的 AI 绘图提示词(英文,适合 Midjourney/DALL·E)
- 配色建议和排版风格建议
Gemini 2.5 给出的配图方案通常包含:封面图的设计思路和绘图提示词、核心概念的可视化图表建议、关键数据的信息图设计思路、章节分隔的过渡图方案。
它会根据文章内容理解该用什么类型的图——架构类文章建议用流程图,对比类文章建议用表格或对比图,教程类文章建议用步骤截图,观点类文章建议用有冲击力的概念图。
如果文章里有多处架构或流程图,Gemini 2.5 还能直接生成 Mermaid 代码,一键渲染成图。对于需要精确展示技术架构的开发者文章来说,这比 AI 绘图更可控、更准确。
第四步:用 GPT-5.5 做深度润色
Grok 的初稿“太干”,GPT-5.5 正好擅长“加温度”。这个环节的核心是:保留 Grok 的信息密度和逻辑结构,用 GPT-5.5 的语言能力让文章读起来更自然、更有感染力。
我的做法: 把 Grok 4.3 的初稿全文发给 GPT-5.5,给出明确的润色指令。
Prompt 示例:
text
请对以下文章进行深度润色。
文章内容:[粘贴 Grok 4.3 生成的初稿]
润色要求:
- 保留原文的所有信息点、数据、逻辑结构,不要改动核心内容
- 优化开头,让它更有吸引力(增加场景感或悬念)
- 优化结尾,让文章更有余味或行动号召
- 让段落之间的过渡更自然
- 把过于书面化的表达改成口语化但不随意的表达
- 增加适当的修辞和节奏变化
- 全文语气统一,风格 [技术实战/观点输出/深度分析]
- 润色后全文检查:是否有逻辑断裂、是否有信息遗漏、是否有过度修饰
GPT-5.5 的润色效果通常很自然。它不会大改 Grok 的结构——因为 Grok 的结构本身就很清晰——而是在语言层面做“微调”:开头加个场景引入、段落之间加个过渡句、结尾加个总结升华。
润色后的文章,既有 Grok 的逻辑严谨和信息密度,又有 GPT 的语言流畅和阅读节奏。读起来像一个人认真写的,不是机器拼凑的。
第五步:三模型协同的完整工作流
把以上步骤串起来,就是一套完整的三模型创作工作流。
阶段一,规划。 Grok 4.3 做大纲设计,确定文章结构、章节分配、核心要点。人工审核大纲,确认逻辑和重点。
阶段二,初稿。 Grok 4.3 逐章生成正文初稿,确保信息密度和逻辑严谨。Gemini 2.5 同步出配图方案,标注配图位置和绘图提示词。
阶段三,润色。 GPT-5.5 做全文深度润色,优化开头结尾、段落过渡、语言节奏。Gemini 2.5 生成配图。
阶段四,终审。 人工终审全文,核对数据准确性、检查配图匹配度、调整细节。发布。
这套流程跑下来,一篇 2000 字的技术文章,从大纲到终稿大约 2-3 小时。以前纯人工写,至少半天到一天。
在 KULAAI 上的一站式切换
这套三模型工作流能跑通,KULAAI 的聚合平台是关键基础设施。
不用在三个网页之间来回切换、复制粘贴。在 KULAAI 一个窗口里同时接入 Grok 4.3、Gemini 2.5 和 GPT-5.5,一键切换模型,同一篇文章的素材在不同模型之间无缝流转。
Grok 写完大纲直接切到 Gemini 出配图方案,Gemini 出完图切到 GPT 做润色,整个过程流畅到像在用同一个工具。
更实用的是 API 对接。三个模型的 API 在 KULAAI 上统一管理,一套 SDK 切换所有模型。这意味着这套工作流可以自动化——写个脚本,Grok 自动出初稿、Gemini 自动出配图、GPT 自动润色,人工只需要做最后的终审。
不同文章类型的模型侧重
这套分工不是一成不变的。根据文章类型,侧重点可以动态调整。
技术实战类: Grok 主导——结构设计、代码示例、步骤拆解,Grok 更擅长。GPT 只做开头和结尾的语言优化。Gemini 重点做架构图和流程图,用 Mermaid 生成。
观点输出类: Grok 搭逻辑框架,GPT 主导润色——观点的感染力、语言的锐度,GPT 更强。Gemini 做概念图和封面图,增加视觉冲击力。
产品评测类: Grok 做功能对比和结构化分析。GPT 做使用体验描述和情感表达。Gemini 做产品对比图、数据可视化图。
总结
Grok 4.3 写初稿——结构严谨、逻辑清晰、信息密度高。Gemini 2.5 做配图——精准理解文章内容,生成匹配的视觉方案。GPT-5.5 深度润色——优化语言节奏,增加阅读感染力。
三个模型不是互相替代,而是互相补充。Grok 的克制 + GPT 的温度 + Gemini 的视觉 = 一篇既有深度又好看的文章。
在 KULAAI 上一个窗口切换所有模型,让这套工作流跑得顺畅无比。创作不再是憋一篇文章改到崩溃,而是各取所长、高效协作。
**粗体** _斜体_ [链接](http://example.com) `代码` - 列表 > 引用。你还可以使用@来通知其他用户。