OceanBase 4.4.2 LTS:从稳定承载关键业务到赋能AI实时决策

今天 10:46
阅读 5 分钟
42
推荐系统推了用户刚买的商品、风控模型放过了刚被标记的欺诈账户、智能客服答非所问……这些“AI 翻车”的背后,有一个被低估的真相:决定 AI 质量的,不仅是模型参数,更是数据的新鲜度、完整性与一致性。
封面图

基于 OceanBase seekdb 实现 LLM Wiki 的功能扩展

今天 10:35
阅读 7 分钟
49
前不久,AI 领域知名研究者 Andrej Karpathy 开源了他的 LLM Wiki——一个用大语言模型维护的个人知识库。它的思路非常简洁:把知识以纯文本形式存在本地,由 LLM 负责理解和更新。这个项目一经发布便引发了广泛讨论,很多开发者开始思考:LLM + 本地存储,到底能把“个人知识管理”做到什么程度?
封面图

OceanBase seekdb:Fork Database补上数据分支的最后一块拼图

6 月 23 日
阅读 10 分钟
111
你打开 SQL 编辑器,开始写 LEFT JOIN + CASE WHEN + UNION ALL……写完发现漏了 NULL 的情况,改。改完发现排序不对,再改。折腾半小时,终于拿到差异,复制粘贴给 Agent,让它改代码。Agent 改完,你再跑一遍这套 SQL……
封面图

OceanBase混合搜索的POC调优与性能排查手册

6 月 23 日
阅读 4 分钟
114
系统上线后的稳定运维,开发者绕不开这几个核心问题:怎么写查询、混合检索怎么调、性能怎么测、出问题怎么排查。本文将围绕这些关键环节,梳理一套可落地的向量查询调优最佳实践,帮助开发者少走弯路、快速上手。
封面图

OceanBase 备份数据清理:原因、策略与排查

6 月 22 日
阅读 15 分钟
134
OceanBase 的数据,包括业务数据和数据变化的日志(WAL 日志或 REDO 日志),OceanBase 的备份自然包括数据备份和日志备份。虽然终端用户只关心数据,但是数据库的设计里,WAL 日志就是数据安全,多副本复制和高可用的必不可少的成本。在 OLAP 业务里,这个日志的成本可能还会非常的突出。
封面图

OceanBase seekdb 在世界杯冠军预测中的数据建模与概率模拟

6 月 22 日
阅读 36 分钟
164
2026 年世界杯首次扩军到 48 支球队,赛程变成 12 个小组、104 场比赛。对预测来说,难点不只是球队变多,而是路径组合变多:小组第三也可能晋级,而且淘汰赛对阵会受到小组排名影响,所以预测冠军的难度也呈指数级上升。
封面图

OceanBase observer进程意外终止后的自动拉起行为分析

6 月 18 日
阅读 11 分钟
266
本文中的 OCP 版本不低于 4.4.0 ,OceanBase 版本不低于 4.2.5 。更早期的版本,这里就不专门花时间来研究了。模拟 OB 进程被杀场景首先从一个简单的场景入手。如果服务器没有宕机,只把 OB 进程杀掉,OB 进程是否会自动拉起?又是谁拉起的?OB 进程名叫 observer ,这里直接杀进程。 {代码...} 过了差不多 1 分钟后, O...
封面图

从存储到遗忘:OceanBase PowerMem中Agent记忆的工程处理流程

6 月 18 日
阅读 11 分钟
193
以一条消息的流转路径为线索,以 PowerMem 为例,跟踪它在 Agent 记忆系统中从写入到淘汰的完整生命周期,看看一路上遗忘这个设计是怎么工作的(简单来说,从一条消息写入 Agent 记忆系统的那一刻起,衰减就在发生,而真正决定记忆命运的,是它有没有被再次访问)。
封面图

OceanBase × Flink 数据集成系列:第二篇,采用 JDBC 标准协议同步实时数据

6 月 16 日
阅读 9 分钟
380
Apache Flink 是一个开源的流处理框架,专为分布式、高吞吐和高性能的实时数据处理场景设计。OceanBase 官方提供了基于 JDBC 的 Flink Connector,可以在 Flink 中通过标准 JDBC 协议将数据高效写入 OceanBase,支持 MySQL 兼容模式和 Oracle 兼容模式,适用于实时数据同步、流式计算结果写入等场景。
封面图

借助 OceanBase,bubseek 使 Agent 痕迹服务于团队洞察

6 月 16 日
阅读 6 分钟
249
bub 是一个框架,但是框架意味着什么呢?我想可能是:A common shape for Agent,一个相对稳定的基线微框架,支持深度私人定制。这很容易让人想起《红色警戒》里的基地车,收起来能跑,展开能造。bub 就是那个基地车,不是基地本身,而是让基地成为可能的东西。
封面图

旁路导入连接器在OceanBase与Flink数据集成中的批量写入实践

6 月 15 日
阅读 17 分钟
392
Apache Flink 是一个开源的分布式流处理框架,广泛应用于实时和批量数据处理场景。OceanBase Flink DirectLoad 连接器(flink-connector-oceanbase-directload)是专门为 OceanBase 数据库设计的高性能数据导入工具,它利用 OceanBase 的旁路导入(Direct Load)技术,能够以极高的吞吐量将大批量数据快速写入数据库。
封面图

OceanBase 入库服务演进:数百亿日吞吐下,K8s 弹性架构替代手动调度

6 月 15 日
阅读 4 分钟
291
背景源于我司海量稀疏型存储引擎正在从Eggroll迁移到OceanBase。原架构下,海量数据入库依托Hadoop集群的MapReduce能力,通过提高离线资源可大幅提升入库吞吐。但迁移到OceanBase后,问题来了——OceanBase原生提供的入库方式是一个本地脚本,没有分布式调度、没有弹性伸缩、没有高可用保障,显然扛不住日均数百亿级别的数...
封面图

基于 OceanBase 的向量 POC 规划指南

6 月 12 日
阅读 8 分钟
342
在 AI 应用快速落地的今天,向量数据已成为企业构建智能检索、推荐系统、大模型知识库等场景的重要数据组成部分。然而,从选型评估到生产部署,许多团队仍面临同一个困境:索引怎么选、资源怎么算、表怎么建、参数怎么配——每一次 POC 都要从零摸索。
封面图

使用 OceanBase 时,Agent Skill 访问 Memory 的 MoonBit + Wasm 技术选择

6 月 12 日
阅读 5 分钟
279
一个 Agent 如果每次对话都从零开始,就很难长期工作。它需要记住用户偏好、项目背景、历史决策、工具使用经验,也需要知道过去哪些方案成功过,哪些方案失败过。
封面图

花三年时间整理出的向量数据库最佳实践

6 月 12 日
阅读 20 分钟
340
AI 时代,各种 AI Infra 都离不开向量数据的存储、检索。而做向量场景的 PoC,每次都要重新算一遍内存、选一遍索引、调一遍参数……
封面图

基于OceanBase和LangChain的智能体方案,支持Agent快速生产化

6 月 11 日
阅读 4 分钟
292
5月30日,OceanBase社区联合LangChain中国社区在上海举办了一场meetup。LangChain&OceanBase社区大使“沧海九粟”正式发布了基于OceanBase和LangChain打造的智能体系统解决方案——AgentSeek。
封面图

从非结构化到知识资产:PaddleOCR与OceanBase支撑第一公里

6 月 11 日
阅读 4 分钟
373
与其追求看似颠覆性的“最后一公里”,我们更应该务实关注 AI 数字化转型的“第一公里”——如何将企业内大量非结构化的数据,通过 PaddleOCR 等工具进行解析,并经过入库流程,真正沉淀为企业级可用的知识资产。这是当前阶段我们需要聚焦的关键。
封面图

神经元至代码工程:PowerMem 中的遗忘设计

6 月 10 日
阅读 6 分钟
402
如果 AI Agent 将所有我说过的话都记住,会是一个什么样的场景?乍一听很合理,作为一个合格好用的 Agent 当然是要将对方说过的话都记住,这样就会越用越聪明,就像人类的也是通过不断的学习记忆进行成长。但事实是这里一个反直觉的现实是,真正真实可靠的 memory 并不是将所有内容都记住就万事大吉。在记住的同时,遗忘...
封面图

Flink 实时写入 OceanBase:从 HBase 迁移的技术方案

6 月 8 日
阅读 16 分钟
371
你正在为 HBase 运维成本高昂而发愁吗?你是否在寻找实时数据流的最佳落地存储方案?Flink + OceanBase OBKV-HBase,可能是你一直在等的答案!为什么你需要关注这个方案?场景一:HBase 迁移的"最后一公里"如果你的团队正在考虑从 HBase 迁移到 OceanBase,但担心:•❌ 现有的 Flink 实时数据流如何无缝迁移?•❌ HBase AP...
封面图

AI删库造成700万关注,OceanBase总结事故经过及AI检讨

6 月 8 日
阅读 7 分钟
336
事情发生在 4 月 24 日,周五下午。那天 PocketOS 创始人 Jer Crane 用 Cursor 搭配 Claude Opus 4.6,让 AI Agent 去 staging 环境跑一条常规任务(注意这个配置:Cursor + Opus,全行业最贵的那一档)。
封面图

DeepMind CEO谈通往AGI的最后四年——OceanBase提取三个待解难题

6 月 5 日
阅读 6 分钟
435
Google DeepMind CEO、2024 年诺贝尔化学奖得主 Demis Hassabis 在一期播客节目《Agents, AGI & The Next Big Scientific Breakthrough》[1] 中,预测 AGI(通用人工智能)有望在 2030 年实现,并介绍了当前 AI 的几个致命短板。
封面图

OceanBase seekdb 1.3.0:相较1.2.0吞吐提升22倍,P99抖动低于10%

6 月 5 日
阅读 4 分钟
439
如果你正在为 Agent 选向量数据库,大概率参考的是 ann-benchmarks 或者各家官方发的性能对比。那些测试跑的是这样的负载:先批量导入全部数据,建好索引,再做只读查询。
封面图

OceanBase 在央国企关键业务中的应用:从发电到用电全链路覆盖

6 月 4 日
阅读 5 分钟
413
步入 “十五五” 发展新阶段,电力产业迈入全新发展阶段。传统火电持续优化升级,风电、光伏、水电等清洁能源加速布局,新型电力系统建设稳步推进。伴随全社会用电量持续增长,源网荷储高效协同,行业坚守能源保供底线,深耕绿色低碳发展,全力打造高效、清洁、智能、可靠的现代化电力体系。
封面图

OceanBase 解决 LSM 性能尖峰问题的技术方案被顶会收录,延迟与吞吐同步优化

6 月 4 日
阅读 3 分钟
378
日前,由厦门大学、穆罕默德·本·扎耶德人工智能大学(MBZUAI)与OceanBase团队联合撰写的论文《Tetris: Lightweight Hyperparameter Auto-Tuning for Mitigating Performance Spikes in LSM-KVS》被数据库领域顶级会议 ICDE 2026(Proceedings of the 42nd IEEE International Conference on Data Engineering)录用。
封面图

OceanBase与AI Agent Harness:工作原理与组件拆解

6 月 3 日
阅读 8 分钟
440
你可能已经搭过聊天机器人,甚至用几个工具撸了一个 ReAct 循环(就是 Reasoning + Acting,边想边干)。Demo 跑起来一切美好,但一上生产环境就原形毕露:模型转头就忘了三步前干过啥,工具调用悄无声息地挂掉,上下文窗口里塞满了没用的垃圾。
封面图

为何需要All-in-one数据底座?基于Harness的价值与实践探讨

6 月 3 日
阅读 4 分钟
723
兹拉坦发表了一篇文章分析主流 Agent 框架 LangChain 公司从零构建数据库的举措,一个事实是 Agent 竞赛正从模型层悄然转向数据层。当 Agent 运行产生海量半结构化、高频写入、长生命周期的 trace 数据时,传统数据库架构难免捉襟见肘;而数据在观测平台、向量库、缓存系统之间反复搬运,更让"沉淀—提炼—反哺"的闭环效率...
封面图

OceanBase seekdb 驱动的洞察 Agent:实现内在可观测能力

5 月 28 日
阅读 4 分钟
317
bub 给出的答案是:一个有边界、有证据、可以交接的 Agent。这是一个 Agent 框架,只提供精心设计的轻内核,其他功能可通过插件和 skills 自由拓展,在架构上和最近因 OpenClaw 而大火的 Pi 相类似。它的 tape 设计完整记录了 Agent 的每一次思考、每一次工具调用、每一个结果。
封面图

OceanBase 4.4.2 LTS 系列:Agent时代,数据库应突破存储边界

5 月 28 日
阅读 5 分钟
343
OpenClaw——这个 GitHub 星标突破 28 万的开源 AI Agent 框架,让“养虾”成为了技术圈的热词。AI 不再只是“能聊天的助手”,而是能接管电脑、自主干活的“数字员工”:自动整理文件、处理邮件、写代码调试、做调研报告,甚至在你开会的时候替你修完几个 Bug、发完一篇推文。
封面图

OceanBase助力咕咚:处理120亿条运动数据的技术架构

5 月 27 日
阅读 3 分钟
471
作为中国首款 GPS 运动社交软件,自 2009 年成立以来,咕咚已陪伴跑者穿越十五载风雨。凭借“软件+硬件+服务”的一体化模式,咕咚持续领跑跑步细分赛道——截至 2026 年 4 月,累计注册用户突破 2 亿,覆盖全球 210 个国家和地区,麾下汇聚 20 万+运动团,线上线下赛事举办超 1200 场。
封面图

东软采用OceanBase打造“智慧人社”一体化方案,实现数智化提升

5 月 27 日
阅读 4 分钟
452
随着“十四五”规划进入收官之年,“十五五”规划全面擘画,数字中国建设进入深水区。人社部门作为服务亿万群众的核心民生部门,如何实现从“数字化”到“数智化”的跨越?
封面图