SF
Apache SeaTunnel
Apache SeaTunnel
注册登录
关注博客
注册登录
主页
关于
RSS
白鲸开源受邀出席 2026 AMD EPYC 行业生态峰会,共探 DataOps 驱动制造业数智化升级
SeaTunnel
6 月 25 日
阅读 2 分钟
101
6月10日,由 AMD 主办的“芯联生态·智合共赢”2026 AMD EPYC 行业生态峰会——深圳站制造业专场成功举办。作为 DataOps 领域的重要技术服务商,白鲸开源受邀出席本次峰会,与来自制造业、人工智能、高性能计算及产业生态领域的专家学者、企业代表齐聚一堂,共同探讨算力驱动智能制造发展的新路径。
当 Cancel 一直无法结束:记一次 Apache SeaTunnel 中 CANCELING 状态卡死问题的排查过程
SeaTunnel
6 月 25 日
阅读 5 分钟
108
此前,我在 Apache SeaTunnel 中曾处理过一个问题:用户执行 Cancel 操作后,任务有时会一直停留在 CANCELING 状态,无法结束。
Apache SeaTunnel Zeta Engine 的 Basic Auth 是怎么工作的?
SeaTunnel
6 月 25 日
阅读 7 分钟
84
Zeta Engine 明明已经启动了,REST 服务也正常监听端口,但是访问 /overview、/running-jobs、/job-info 这些接口时,却返回了:
我用 CodeX+WhaleStudio Skill 10 分钟创建了 Snowflake 数据仓库!
SeaTunnel
6 月 17 日
阅读 5 分钟
299
如果有一天,在 WhaleStudio 中创建同步任务、编写 SQL、搭建 DAG、排查任务异常这些工作都能交给 Agent 自动完成,那么数据工程师的价值还体现在哪里?未来的数据平台又该扮演怎样的角色?
基于 SeaTunnel 与 DolphinScheduler 实现 MySQL 到 Doris 离线定时增量同步
SeaTunnel
6 月 17 日
阅读 4 分钟
345
在企业数据平台建设过程中,数据同步是一项非常常见的需求。随着业务规模不断增长,全量同步带来的数据库压力和资源消耗也会越来越大。因此,在实际生产环境中,增量同步往往是更常见的选择。
从学生贡献者到 Apache SeaTunnel Committer:Doyeon Kim 的开源成长之路
SeaTunnel
6 月 17 日
阅读 5 分钟
375
还记得去年我们曾经采访过的韩国小姐姐吗?韩国萌系新人贡献者爆刷存在感:加入半年,活跃度已经拉满!短短 2 年之内,她已经正式被邀请成为 Apache SeaTunnel 社区的 Committer 啦!👏🏻👏🏻
Snowflake Summit 26 见闻实感:Goodbye Data, Hello AI
SeaTunnel
6 月 10 日
阅读 8 分钟
327
感谢 Snowflake 这次邀请我以 Snowflake 雪花大使身份参加 Snowflake Summit。这次大会给我的触动比预想中更大,大家知道,我一直做从事数据行业,早期在 Teradata,后来在 IBM,后来在企业里 Lenovo、中金、万达等管大数据,后来成为 Apache Software Foundation Member,现在是白鲸开源 CEO,所以我一直对数据行业非常...
同程旅行数据困境大破解!借 Apache SeaTunnel 打造统一数据通道
SeaTunnel
6 月 10 日
阅读 2 分钟
421
随着生成式 AI 技术的发展,企业对数据基础设施提出了新的要求。除了传统的结构化数据之外,文本、图片、音频等多模态数据正在快速增长。面对更加丰富的数据类型和更加复杂的数据链路,如何构建统一、高效且易于治理的数据通道平台,成为许多企业关注的重要课题。
87 个 PR 迭代复盘|Apache SeaTunnel 5 月版本重点更新解读
SeaTunnel
6 月 10 日
阅读 13 分钟
335
据社区统计,2026 年 5 月 apache/seatunnel 仓库累计合入 87 个 PR。本月核心迭代方向为持续完善 Connector-V2,补齐各类细节,做到生产环境可用;深耕 Zeta 引擎,优化高可用、故障恢复、监控和测试;同时强化 CI 安全与回归测试,保障主干分支迭代效率。
Demo 演示 | 基于 Apache SeaTunnel 实现从 MySQL CDC 到 PostgreSQL 全量数据同步
SeaTunnel
6 月 10 日
阅读 7 分钟
396
本文详细演示了如何通过 Apache SeaTunnel 2.3.9 实现 MySQL CDC 到 PostgreSQL 的全量数据同步。
又一 SeaTunnel Committer 诞生!天翼云科技曾毅将力推 Connector 升级与 AI 数据集成落地
SeaTunnel
6 月 4 日
阅读 6 分钟
407
嘿,朋友们!最近 Apache SeaTunnel 开源项目可谓喜讯传来,天翼云科技的大数据工程师曾毅受邀成为 Committer 的一员,为项目注入新活力!
SeaTunnel 进阶指南:解锁 MySQL-CDC 实时增量采集神技
SeaTunnel
6 月 4 日
阅读 14 分钟
424
实时增量采集:变更数据捕获(CDC)mysql-cdc 官方文档:[链接]cdc 可以==一个 seatunnel 的 cdc 任务监控多个表==,进行同步必须用 mysql8.0.33 以上的 jdbc 驱动下载地址:[链接]1、SeaTunnel 支持几个数据库的 CDC?[链接] {代码...} 2、CDC 的 SeaTunnel 服务启动后,不会停止一个标准的 CDC(Change Data Captur...
未来十年的数据工程:从 Modern Data Stack 到 Data Engineering Harness
SeaTunnel
5 月 27 日
阅读 5 分钟
400
我们把数据采集从数据库里拆出来,形成了 Data Ingestion,用FiveTran、Airbyte、Apache SeaTunnel来解决ELT / CDC / Reverse ETL;
速戳!王学鹏 Apache SeaTunnel Committer 养成记
SeaTunnel
5 月 27 日
阅读 2 分钟
391
作为资深贡献者,王学鹏这次能当选 Committer 绝非偶然。长久以来,他在社区默默耕耘,点点滴滴的贡献大家都看在眼里。从初涉开源,到成为 Apache 基金会顶级项目的 Committer ,他心里肯定藏了不少故事,成长路上也有诸多感悟。
Apache SeaTunnel 设置钉钉通知详细教程,亲测可用!
SeaTunnel
5 月 27 日
阅读 10 分钟
396
说明背景使用 Seatunnel 执行数据同步. 部署参考 部署 Apache-Seatunnel 服务问题需要在任务报错或者其他关键事件发送钉钉消息通知SeaTunnel 本身不支持消息通知, 必须依赖 DolphinScheduler 或其他外部工具方案利用SeaTunnel提供的事件监听器功能编写自定义插件, 捕捉报错事件, 发送消息通知群机器人配置通过命令行提交...
干货!SeaTunnel(2.3.12)高阶用法(一):核心概念之数据流
SeaTunnel
5 月 20 日
阅读 3 分钟
509
SeaTunnel 不是“source → sink”的线性工具👉 它是一个 “数据流(DataStream / DataFlow)驱动的 DAG 执行引擎”
打开实时数据同步新思路:SeaTunnel 选择性捕获数据库变更怎么用?
SeaTunnel
5 月 20 日
阅读 4 分钟
437
在现代数据架构中,实时捕获和处理数据变更是构建数据湖、实时数仓及业务分析的关键技术。Apache SeaTunnel通过读取数据库的事务日志(如MySQL的Binlog),能够高效、准确地捕获数据表的变更事件(INSERT, UPDATE, DELETE)。
(八)收官篇 | 数据平台最后一公里:数据集成开发设计与上线治理实战
SeaTunnel
5 月 15 日
阅读 6 分钟
599
本文是 《新兴数据湖仓架构搭建与开发规范全攻略》 系列第 8 篇,也是整个系列的收官篇。前面的内容已经系统梳理了湖仓架构、调度体系、DataOps 开发规范、工作流设计、资源隔离与稳定性治理等核心内容,而本篇则聚焦数据平台最基础的一层——数据集成。
AI 让 SeaTunnel 读源码和调试过时了吗?
SeaTunnel
5 月 15 日
阅读 11 分钟
546
在本周的 Apache SeaTunnel Meetup 上,项目活跃贡献者 梁尧博为我们分享了一场非常精彩的话题——AI 时代下如何更高效地进行 SeaTunnel 本地调试。他通过细致的讲解,从环境准备到调试跑通的整个过程都进行了详细的展示,让已经或者打算上手 SeaTunnel 的观众都对如何进行源码调试、问题定位和自己修 bug 有了更直观和深...
杀疯了!SeaTunnel AI CLI 解锁数据集成新玩法
SeaTunnel
5 月 15 日
阅读 8 分钟
475
每个数据工程师都经历过这样的场景:业务方说"帮我把 MySQL 的用户表同步到 S3"——你心里知道这件事本质上就是从 A 搬到 B。但接下来你要查文档、学参数、写 HOCON、调试报错,一个"简单"的需求花了两小时。
万字长文,码住!SeaTunnel 2.3.12 部署及 7 个 Demo(含 CDC 实时采集)
SeaTunnel
5 月 11 日
阅读 43 分钟
626
SeaTunnel部署及其Demo从上图可以看出seatunnel的conf(执行命令文件),主要是source、transform、sink组成📥 Source(数据源):作用:从各种数据源读取数据🔄 Transform(数据转换):作用:对数据进行清洗、转换、加工📤 Sink(数据目标):作用:将处理后的数据写入目标系统jdbc的文档(官方):[链接]mysql的source文档...
Apache SeaTunnel 4 月有何新动作?连接器增强与 Zeta 稳定性提升等亮点速览
SeaTunnel
5 月 11 日
阅读 11 分钟
596
4 月份月报来啦!社区梳理了 2026 年 4 月份 Apache SeaTunnel 合入 origin/dev 的 31 个带 PR 号代码提交,从功能特性、性能优化、Bug 修复、架构改进展开,对如 Doris Stream Load 增强等关键变更做源码级拆解,并附上当月 PR 贡献者名单,快来看看你在名单上吗?😊
AI 时代,SeaTunnel 调试“会配会跑” 为何远远不够?
SeaTunnel
4 月 29 日
阅读 2 分钟
540
在数据驱动的时代,Apache SeaTunnel 宛如数据世界的桥梁,连接起各个关键环节。但在使用过程中,调试难题是否常让你苦恼?现在,转机来了!2026 年 5 月 12 日晚 8 点,SeaTunnel 视频号直播间将开启一场别开生面的线上用户交流会。
SeaTunnel + AI:一句“我要做什么”,能不能直接变成一份能跑的配置?
SeaTunnel
4 月 23 日
阅读 11 分钟
531
围绕 Apache SeaTunnel Discussion #10651 的一些思考:AI 写配置,难的从来不是“写出来”,而是“写出来以后真能用。”
信创迁移神器!Apache SeaTunnel 搞定瀚高数据库读写一把过
SeaTunnel
4 月 23 日
阅读 3 分钟
578
想用Apache SeaTunnel对接瀚高数据库该怎么配?本文分享实战经验,瀚高数据库基于PostgreSQL内核,直接用标准JDBC驱动即可连接。文中给出了瀚高MySQL模式读写PG模式、Doris数据迁移至瀚高的配置示例,操作顺畅。
(六)以 WhaleStudio 三层开发管理框架为例,分享一套可落地的 DataOps 开发规范
SeaTunnel
4 月 9 日
阅读 3 分钟
742
随着数据平台从“能跑”走向“稳定运行”,团队面临的问题也在发生变化。早期更多关注任务是否成功执行,而在规模扩大之后,问题逐渐转向权限是否可控、链路是否清晰、变更是否可管理以及故障是否能够恢复。
成为 ASF Member 有路径?他来现身说“法”
SeaTunnel
4 月 9 日
阅读 3 分钟
571
不久前,他受邀成为 Apache Software Foundation(ASF)Member。借这个契机,我们和他做了一次完整的交流。相比一段荣誉的确认,这次对话更像一次回溯:从数据集成,到开源参与,再到系统设计与社区理解,一个工程师是如何一步步走到这里的。
Apache SeaTunnel 3 月,这些大动作你都知道吗?
SeaTunnel
4 月 9 日
阅读 3 分钟
538
嘿!2026 年 3 月月报来啦!Apache SeaTunnel 社区超给力~ 26 位小伙伴踊跃参与代码贡献,发布了 2.3.13 新版本,新增 5 个连接器,核心引擎、文件连接器、CDC、Transform 均得到大幅增强,并修复 Bug 20+ 项。
从 Apache SeaTunnel 走向 ASF Member:一位开发者的长期主义样本
SeaTunnel
3 月 25 日
阅读 4 分钟
593
最近,Apache Software Foundation 在会议上经过讨论,一致同意向多位 Apache SeaTunnel 项目的 PMC Member 发出邀请,邀请他们成为象征基金会最高荣誉的 ASF Member。其中,王海林也位列其中。
Apache SeaTunnel 提速不难,JVM 参数这样调
SeaTunnel
3 月 25 日
阅读 5 分钟
739
作为是一个高性能的分布式数据集成平台,针对 Apache SeaTunnel 进行合理的 JVM 调优对于提升作业吞吐量、降低延迟以及保证系统稳定性至关重要。JVM 参数应该怎么调呢?本文将详细介绍 SeaTunnel 的 JVM 参数配置位置、参数优先级、核心调优参数及最佳实践。
1
(current)
2
3
4
下一页
1
(current)
下一页