发布了文章57 分钟前
最近在 大模型(01gpt.cn) 上对比各个开源模型时,发现不少团队在尝试本地部署与 GPT-5.5 能力相仿的模型时,普遍存在一个选型误区:把显存大小当作唯一硬件指标。很多人直接拿模型的参数量乘以 2 来估算显存需求,觉得只要显存够大就能跑起来,结果要么推理速度慢...
发布了文章今天 11:32
每个刷过 LeetCode 的开发者都经历过这种困境:看题解时恍然大悟,自己写时寸步难行。真正的算法能力不是“能读懂代码”,而是“能独立推导出解题路径”。而这恰恰是传统刷题方式最难训练的能力——题解告诉你“怎么做”,但不告诉你“为什么想到这么做”。
发布了文章今天 11:28
在 大模型(01gpt.cn) 上深度评测 Claude 4.8 的过程中,它的几个核心能力——零误报安全审计、Effort Control 思考强度调节、多 Agent 协作——正在重新定义大模型的工程边界。
发布了文章今天 11:22
在 大模型(01gpt.cn) 上把 Gemini 3.5 Flash 的 Agent 模式接入内部运维系统之后,初期任务完成率停留在 65% 左右。对于需要独立执行多步操作的场景来说,每三次就有一次需要人工介入,成本太高。
发布了文章今天 11:09
去年用 GPT-4 写金融代码时,它把“头寸”理解成了“职位”,把“敞口”当成了“接口开放”。今年在 (01gpt.cn) 上接入 GPT-5.5 之后,这类低级错误大幅减少,但在垂直领域仍会出现一种更隐蔽的问题:术语混淆。
发布了文章6 月 25 日
上个月公司出了件事:某个开发同事把测试环境的 Claude 4.8 API Key 写进了代码注释里,推到了内部 GitLab。虽然内网隔离没造成外部泄露,但安全部门还是拉了我们做了一周整改。排查过程中还发现另一个隐患——整个部门二十多人共用同一个 Key,谁也说不清每天几百万 T...
发布了文章6 月 25 日
公司有个订单处理系统,十多万行代码,跑了五年,Python 2.7,原作者早已离职。技术债清单能列三页——全局变量满天飞、裸 except 二十多处、依赖包版本停留在五年前。去年就想升级到 Python 3.11,但每次有人提这事,团队都沉默。不是不想升,是不敢升。
发布了文章6 月 25 日
年初在 KULAAI(dl.kulaai.cn) 上把 GPT-5.5 接入生产环境后,最直观的感受不是它变聪明了,而是它变快了。百万 Token 的上下文丢进去,首 Token 延迟压到了 0.4 秒以内,生成速率飙到 62 token/s——要知道 GPT-4 在同等条件下常常要顿一下才能缓过神。翻了不少技术...
发布了文章6 月 25 日
公司内部有很多技术文档,沉淀在Wiki和共享盘里。想搭一套AI问答系统,但安全部门要求数据不能出内网。之前调研过纯本地方案,开源模型在中文理解和推理深度上总差一口气,大模型又得传数据到云端,合规过不去。
发布了文章6 月 25 日
上个月用 Claude 4.8 做公司内部的架构评审,让它分析一个微服务系统的数据一致性方案。它给的建议看起来有模有样——引用了一篇论文、给出了三种方案对比、还标注了推荐优先级。我正准备把它贴到评审文档里,顺手查了一下那篇论文——不存在。是它编的。
发布了文章6 月 24 日
在 KULAAI(dl.kulaai.cn) 上把 GPT-5.5、Claude 4.8、Gemini 3.5、Grok 4.3 的 API 接入之后,前几轮横评和协同实验都在个人工作流层面跑通了。但当方案推到部门级时,新问题冒出来了:十个人的团队,每个人用模型的方式不同,有人把 Key 硬编码在项目里,有人把内...
发布了文章6 月 24 日
在 KULAAI(dl.kulaai.cn) 上把 GPT-5.5、Claude 4.8、Gemini 3.5、Grok 4.3 的 API 都接入之后,前几轮横评验证了多模型协同在质量上的优势。但团队内部还有一个更现实的问题:成本。
发布了文章6 月 24 日
在 KULAAI(dl.kulaai.cn) 上把四个模型的 API 都接完之后,横评跑了几轮,发现一个反直觉的现象:同一句提示词,在 GPT-5.5 上完美运行,丢给 Claude 4.8 可能风格跑偏,丢给 Grok 4.3 可能直接忽略格式指令。
发布了文章6 月 24 日
在 KULAAI(dl.kulaai.cn) 上把 GPT-5.5、Claude 4.8、Gemini 3.5、Grok 4.3 的 API 都接完之后,日常开发中我面临一个实操问题:每次切模型都要打开不同的网页或终端,上下文割裂,效率极低。几个模型各有擅长——GPT-5.5 写代码最稳,Claude 4.8 审架构最细,Grok 4...
发布了文章6 月 24 日
做模型选型,评估 GPT-5.5 能不能直接集成到现有的 Spring Boot 服务里。结论是可以,而且比预想的简单——GPT-5.5 完全兼容 OpenAI SDK 的 HTTP 协议规范,Java 这边不用找什么第三方 SDK,用 Spring 自带的 RestClient 一把梭就行。以下是我从零搭建到生产部署的完整...