DigitalOcean - SegmentFault 思否

Laravel 开发者已在 DigitalOcean 上开通超过 10 万台服务器

DigitalOcean

6 月 23 日

阅读 3 分钟

158

2011 年，Taylor Otwell 最初创建 Laravel 是为了帮自己更快地验证创业点子。当时他还在跟企业级的 .NET 和 COBOL 系统打交道，心里想的是找个更简单的途径来构建现代 Web 应用。

砍掉 60% AI 推理成本：深度解构 DigitalOcean 推理路由器的 MoE 门控与智能分流机制

DigitalOcean

6 月 17 日

阅读 15 分钟

307

这是刚打到你们生产 API 的一个请求： {代码...} 一个语法检查。答案是：没有，没问题。任何 $0.10/百万 token 档次的模型都能在一秒内正确回答。现在，三秒后同一 agent 会话发了下一个请求： {代码...} 这完全是另一种类型的请求。它需要架构推理、对分布式系统权衡的理解，以及综合出多步迁移计划的能力。这是适合前...

百亿参数开源模型托管成本账：从按 Token 计费到单卡 GPU 服务器怎么选？

DigitalOcean

6 月 15 日

阅读 9 分钟

354

对于一个百亿参数以下的模型，难点不在于能不能托管——几乎任何服务商都能提供一台能跑得动的机器；真正的挑战在于找到与你的流量模式、定制需求和预算相匹配的托管方案。大多数人的目光都集中在大模型上，这很正常：它们因为参数规模大而性能最强。但越来越多的用户发现，随着 LLM 技术的进步，较小的模型已经能很好地满...

Mythos级最强 AI 模型 Claude Fable 5 现已上线 DigitalOcean无服务器推理

DigitalOcean

6 月 10 日

阅读 3 分钟

378

Claude Fable 5现已在DigitalOcean Serverless Inference（无服务器推理）全面上线，将Anthropic目前最强大的通用模型带给所有DigitalOcean用户，为自主知识工作与编程任务提供前沿推理能力。

AI Agent 成本失控怎么办？从 Kimi K2.6 看 Token 计费为何不再适用

DigitalOcean

6 月 9 日

阅读 10 分钟

371

Kimi K2.6，月之暗面的一万亿参数混合专家模型，于 2026 年 5 月在 DigitalOcean 无服务器推理上线：将前沿级别的智能编码能力带到一个兼容 OpenAI 的端点，并与 DigitalOcean 现有云资源同一账单计费。

深度评测：RAG 向量数据库选型指南 —— OpenSearch、Weaviate、pgvector 怎么选？

DigitalOcean

6 月 8 日

阅读 4 分钟

473

大模型与 RAG（检索增强生成）技术正在重塑企业应用。作为 AI 落地底层必不可少的基础设施，向量数据库（Vector Database）的选型直接决定了 AI Agent 的响应速度、检索准确率以及整体工程架构的运维成本。

Claude Code 的开源替代方案：用 OpenCode + DigitalOcean 实现模型自由

DigitalOcean

6 月 2 日

阅读 6 分钟

511

如果你一直在使用 Claude Code 直接在终端中获取 AI 辅助，你已经知道这种体验有多强大。你描述一个任务，智能体就会读取你的文件、编辑代码、运行命令并报告结果，全程无需离开命令行。Claude Code 唯一的真正缺点是它专为 Anthropic 的模型而构建，其定价与 Anthropic 订阅绑定，而且你的代码会经过 Anthropic 的基础...

为AI编程降本！OpenCode 原生支持 DigitalOcean 推理路由器

DigitalOcean

5 月 29 日

阅读 2 分钟

430

如今的 AI 编程智能体（Coding agents）普遍存在一个严重的成本超支问题。无论你是设计系统架构还是编写单行文档字符串（Docstring），每一次请求往往都会被路由到同一个昂贵的前沿模型（Frontier model）上，比如 Claude。其后果就是：产生了不必要的 Token 消耗、推高了推理成本，并且应用对任务的复杂性或预算限制几...

为什么说，传统的通用云正在成为 AI 应用持续增长的“隐形障碍”

DigitalOcean

5 月 20 日

阅读 7 分钟

550

在 2023 年，每一次关于 AI 领导力的对话都集中在模型训练成本上。而到了 2026 年，更大的挑战已不再仅仅是训练，而是推理（Inference）。训练是一次性或偶尔发生的。而推理则发生在用户的每一次提示词输入、智能体的每一次工具调用、RAG 检索或应用生成的每一次回复中。

AI 推理产品省钱指南：如何通过基建优化降低 80% 推理成本？

DigitalOcean

5 月 13 日

阅读 3 分钟

499

在AI产品圈，我们似乎陷入了一种“模型焦虑”：今天 GPT 更新了，明天Claude 推理更强了，后天某个开源模型在榜单上屠榜了。产品经理忙着追新Prompt，开发者连夜切API。但如果我们换个视角，把时间轴拉长到产品全生命周期，会发现一个反直觉的真相：当模型逐渐标准化、商品化，真正决定AI应用能否存活、能否盈利、能否规模...

DigitalOcean VPC 网络故障排查 Runbook 实战指南

DigitalOcean

5 月 7 日

阅读 19 分钟

488

当 DigitalOcean VPC 发生网络故障时，若每位响应人员都遵循相同的诊断顺序而非即兴发挥，问题就能更快得到解决。本教程将引导你构建一个可复用的 runbook，用于应对常见的 VPC 故障，使用的工具包括 ping、traceroute、tcpdump、nmap、dig、nslookup、nmcli、ss 和 curl，并展示如何将最具重复性的检查步骤自动化，转化...

AI变智能体，传统云不够用了：成本降67%，延迟降40%的新解法

DigitalOcean

5 月 6 日

阅读 4 分钟

466

AI 是在循环中运行的。智能体会思考，然后行动，接着再次思考。单个用户任务就可能跨越数十万个 token，调用五六个工具，访问知识库，编写代码，执行代码，并持久化状态，这一切都发生在返回答案之前。我们现有的云并非为此而生。超大规模的云厂商（例如 AWS、GCP）提供数百种为昨日应用而构建的服务，却把集成工作留给...

DigitalOcean 打造 AI 原生云，帮助 AI 应用大幅降低成本与运维复杂度

DigitalOcean

4 月 29 日

阅读 2 分钟

434

过去仅仅是一次模型调用，如今已演变成一个持续交互的系统。现在的应用程序会编排多个模型，检索并合成数据，执行工具，并在生产环境中重复这一循环。这些不再是“无状态请求”，而是更像基础设施而非软件特性的动态系统。

DigitalOcean 助力 ACE Studio：推理延迟降40%，训练效率翻倍

DigitalOcean

4 月 28 日

阅读 2 分钟

511

ACE Studio 是一款面向制作人、作曲家和专业词曲作者打造的 AI 原生音乐工作站。公司提供前沿工具，包括人声合成和由 AI 驱动的乐器，用于简化创作流程。正如 CTO 兼联合创始人 Sean Zhao 所说：“ACE Studio 是面向制作人和作曲家的下一代音乐创作工具。”

无封号焦虑！Claude Code 官方插件 +VS Code ，稳定接入的配置指南

DigitalOcean

4 月 22 日

阅读 6 分钟

2.2k

之前的文章只需一个 API！教你用 Continue/Kilo 插件在 VS Code 里丝滑切换 Qwen3 与 Opus 4.6 介绍了如何使用 DigitalOcean 的 Serverless Inference 服务配置 VS Code 插件使用 Opus4.6 或者 OpenAI 系列模型，但是由于默认的 API 格式为 Open AI 格式，Opus4.6 无法使用 Anthropic 官方的 Claude Code 和 Claude Cod...

Claude 强制身份验证后，国内开发者都在用什么方案？

DigitalOcean

4 月 20 日

阅读 3 分钟

631

最近这段时间，大量的国内 Claude 用户开始收到类似的通知。有人被要求上传护照，有人被要求实时自拍，还有人直接账号就被锁了，问客服得到的回复是"验证不通过"。

快速体验 NVIDIA NemoClaw：10 分钟上手指南

DigitalOcean

4 月 9 日

阅读 4 分钟

675

在 GTC 2026 大会上，NVIDIA 发布了 NemoClaw。这是一个开源技术栈，可以让你轻松又安全地运行 OpenClaw 自主代理。OpenClaw 是一个开源的代理平台，黄仁勋把它称为“个人 AI 的操作系统”。我们在之前的教程里介绍过如何在DigitalOcean Droplet 云服务器上运行 OpenClaw。而 NemoClaw 走了另一条路：它通过 NVIDIA 的云，...

拒绝 GPU 集群资源浪费：教你打造自动化降本的 AI 运维 Agent

DigitalOcean

4 月 8 日

阅读 10 分钟

624

在云端管理 GPU 集群需要在性能和成本之间不断平衡。一个闲置的 GPU Droplet 云服务器如果整夜运行，每月账单就会增加数百美元。传统监控仪表板只显示原始指标，但仍需要人工判断机器是"在工作"还是"在浪费钱"。

DigitalOcean 收购 Katanemo Labs：迎接 Agent 时代，重塑基础设施

DigitalOcean

4 月 3 日

阅读 2 分钟

586

DigitalOcean 正在全力构建全球领先的Agent 推理云。我们的使命很清晰：为 AI 原生企业提供一个坚实底座，让它们能在生产环境中大规模运行推理任务。今天，我们正式宣布收购 AI Agent 基础设施领域的领先公司 Katanemo Labs, Inc.。

教你用Continue/Kilo插件在VS Code里丝滑切换Qwen3与Opus 4.6

DigitalOcean

4 月 1 日

阅读 4 分钟

860

很多开发者为了追求极致的代码理解力，会订阅多个大模型，但往往面临“订阅费昂贵”和“模型切换麻烦”的痛点。其实，对于追求高效率的开发者来说，DigitalOcean 推理云平台的 Gradient Serverless Inference 提供了一个非常便捷的方法：它提供了一套标准化的 API 接口，让你能以一个 API、按量计费的方式，在编辑器里直接调...

当所有人都在讨论 AI 工具时，我们已经用 AI 跑通了一家公司

DigitalOcean

3 月 31 日

阅读 3 分钟

502

过去一年，AI 几乎进入了每一家公司的讨论清单。但在卓普云，我们发生的变化并不是“多用了一些工具”，而是：一整套业务执行逻辑，开始由 AI 协同运行。

OpenClaw 多智能体部署：弹性扩展、零运维

DigitalOcean

3 月 27 日

阅读 3 分钟

502

OpenClaw 迅速成为构建个人 AI 助手的热门开源框架，可以连接 Slack、微信、飞书等消息平台。随着更多开发者从本地实验转向常驻助手，挑战从构建智能体转变为长期可靠地运营——通常还要跨多个智能体处理不同的工作流。

如何使用DigitalOcean Gradient 平台上的无服务器推理

DigitalOcean

3 月 26 日

阅读 3 分钟

509

无服务器推理理所当然地成为人工智能用户技术圈和非技术圈最热门的话题之一，这背后有其充分理由。虽然部署自定义模型通常需要控制部署的方方面面，但无服务器技术免去了维护和管理模型部署及 API 端点的麻烦。这对于众多不同的智能体大语言模型用例来说，可能极为有用。

使用 DigitalOcean 实现 Claude Code “低配订阅 + 外部 Token”

DigitalOcean

3 月 25 日

阅读 3 分钟

569

本文将介绍，通过开源工具，配合 DigitalOcean 云平台的大模型 API 服务，直接使用 Claude Opus 4.6、Sonnet 以及其他任意一种模型。价格与官方持平的同时，统一平台管理，多 team、多 token、支付宝支付。

高性能、低成本推理新标准：NVIDIA Dynamo 1.0 现已上线 DigitalOcean 推理云平台

DigitalOcean

3 月 23 日

阅读 2 分钟

609

上周在 NVIDIA GTC 上发布的 NVIDIA Dynamo 1.0 现已面向 DigitalOcean 客户开放，有助于提升性能并降低成本。NVIDIA Dynamo 1.0 在 NVIDIA GB200 NVL 系统上提供 7 倍推理性能提升，通过与 DigitalOcean 的智能推理云结合，客户可以以更低的成本获得更高性能，同时受益于无缝部署。在共同努力下，DigitalOcean 与 NVIDI...

OpenClaw 用不了 Claude？90%团队都卡在这一步

DigitalOcean

3 月 18 日

阅读 4 分钟

932

目前，很多企业与个人开发者都已经用上了 OpenClaw（小龙虾）。但是，不论你的 OpenClaw 是部署在本地电脑，还是部署在国内的云平台上，很多 AI 团队在实际使用时，都会遇到这些问题：

OpenClaw Skills 是什么？功能、安装与使用指南

DigitalOcean

3 月 16 日

阅读 6 分钟

843

OpenClaw Skills 旨在让使用 OpenClaw 的 AI 智能体更加实用、模块化且功能强大。你不需要从零构建所有能力，而是可以将特定功能——例如调用 API、查询数据库、检索文档或执行工作流——打包为可复用组件，让智能体在需要时调用。

NVIDIA B300 vs H200：GPU 参数、性能与 DeepSeek 推理能力解析

DigitalOcean

3 月 12 日

阅读 6 分钟

随着大语言模型在各行各业的快速落地，GPU 选型已成为 AI 企业最重要的技术决策之一。2026 年初正式出货的 NVIDIA B300（Blackwell Ultra）凭借其 288GB HBM3e 显存和强大的推理性能，正在成为企业部署 DeepSeek 等大模型的新选择。本文将为你全面解析 B300 的技术规格、与前代产品的性能差异，以及在运行 DeepSeek 系列...

DigitalOcean 基于 NVIDIA GPU 如何为 Workato 降低 67% AI 推理成本

DigitalOcean

3 月 10 日

阅读 7 分钟

777

Workato 的 AI 研究实验室专注于帮助客户利用智能体 AI 能力扩展生产自动化，这些系统可以推理、执行并协调跨业务的工作。目前，Workato 服务超过 12,000 家全球企业客户，例如 Broadcom（博通）、Intuit（财务软件领域的 SaaS 巨头）、Box 等公司。

如何在云端运行Kimi K2.5：从配置到部署全攻略

DigitalOcean

3 月 9 日

阅读 7 分钟

1.2k

Moonshot AI 的又一力作。Kimi K2.5 是一款视觉智能体模型，在 OpenRouter热门模型榜单上名列前茅，且在多项基准测试中超越闭源模型，充分展现了研究层面的突破。从架构、训练和实现的角度来看，这款模型值得深入探索。