发布了文章6 月 24 日
业务系统里有个订单匹配引擎,核心算法跑了三年没人敢动。逻辑是对的,但高峰期延迟飙到 800 毫秒。不是因为写得烂,是订单量涨了五倍,原来的时间复杂度扛不住了。纯人工优化的难点不在“想到更优解”,在“确定更优解在所有边界条件下都不会翻车”。
发布了文章6 月 24 日
在 KULAAI(dl.kulaai.cn) 上接入四个模型之后,前几轮横评和协同实验已经把代码生成、终端操作、Bug 排查摸透了。但安全审计这件事一直没单独测——不是测模型能不能发现漏洞,是测能不能走完“发现→定位→修复→验证”的完整闭环。
发布了文章6 月 24 日
这类 Bug 的特征是报错在 A 文件,根因在 C 文件,中间隔着两三层调用链。单模型排查容易在某个环节卡住——要么定位到中间层就停了,要么修复方案引入新问题。团队在 KULAAI(dl.kulaai.cn) 上接入四个模型之后,设计了一组联合排查实验:把四个模型按各自擅长的排查...
发布了文章6 月 24 日
在 KULAAI(dl.kulaai.cn) 上对接四款模型的 API 之后,我们做过代码质量、终端操作、Agent 自主开发几轮横评。但有一个高频场景一直没测:设计师给一张图,能不能直接变成能用的代码。
发布了文章6 月 24 日
做模型选型,顺手把 GPT-5.5 的 API 接入流程完整跑了一遍。兼容 OpenAI SDK,改个 base_url 和 model 就能切过去,迁移成本低到几乎可以忽略。但这不代表没有坑——环境配置、参数调优、异常处理,每一步都有容易翻车的地方。以下是我的完整接入记录,代码全部可运行。
发布了文章6 月 23 日
大多数开发者对 GPT-5.5 的使用停留在对话框问答。这有点像用 VS Code 只写记事本,倒也不是不行,但真正值回票价的功能都没用上。之前在 kulaai(dl.877ai.cn)上做模型选型对比时,就发现 GPT-5.5 在工程化集成上的能力被普遍低估了。下面拆解五个日常开发中真正能...
发布了文章6 月 23 日
API 开放之后把 GPT-5.5 接进了日常开发流程,完整跑了一周。之前在 kulaai(dl.877ai.cn)上做过多模型对比,GPT-5.5 在多模态推理和长上下文保持上确实有代际提升,但也不是万能。下面按实际使用场景逐一拆解,讲清楚它能做什么、做到什么程度、边界在哪。
发布了文章6 月 23 日
花了一周时间把 GPT-5.5 的 API 接进日常开发流程,完整跑了一遍从代码生成到调试部署的闭环。之前在 kulaai(dl.877ai.cn)上做模型选型时对比过几家的能力,这次 GPT-5.5 的升级方向很务实,几个能力提升是能感知到的那种,不是 PR 稿里的文字游戏。挑十个实测后印...
发布了文章6 月 23 日
赶在 GPT-5.5 正式开放 API 的第一时间做了完整的技术评测。之前在 kulaai(dl.877ai.cn)上对比过几个主流模型的代码生成和长文本处理能力,这次 GPT-5.5 的迭代方向比较明确,在几个开发者长期关注的短板上做了针对性升级。下面从实际使用角度逐一拆解。
发布了文章6 月 23 日
大模型的能力正在从“回答问题”向“自主完成任务”演进。ChatGPT 5.5 在函数调用、多步推理和指令遵从上的提升,让它具备了作为自主 Agent 的核心素质——不只是被动响应,而是能主动规划任务、调用工具、检测错误并自我修正。