6.10 使用DataWorks完成数据同步

注意:

本章假设您已经对DataWorks的基本概念有一定了解,查看DataWorks的文档

本章只是介绍如何使用DataWorks完成各个数据源与HybridDB之间的同步

  1. 配置白名单

    将DataWorks的IP网段加入HybridDB白名单里面,目的是让DataWorks可以访问HybridDB。

    DataWorks的IP网段列表参见

  2. 添加数据源

    • 以项目管理员身份进入 DataWorks 管理控制台,单击对应项目操作栏中的 进入工作区

    • 单击顶部菜单栏中的 数据集成,导航至 数据源 页面。

    • 单击 新增数据源,弹出支持的数据源类型。如下图:

    • 在新建数据源弹出框中,选择数据源类型。

    • 数据源类型:阿里云数据库(HybridDB)。

    • 数据源名称: 由英文字母、数字、下划线组成且需以字符或下划线开头,长度不超过 60 个字符。

    • 数据源描述:对数据源进行简单描述,不得超过 80 个字符。

    • 实例 ID:HybridDB 的实例 ID,可以在 HybridDB 的管控台查找,如下图所示:

    • 主账号ID:账号基本信息安全设置里找到相应的信息,如下图所示:

    • 用户名/密码:数据库对应的用户名和密码。

      注意

      需要先添加HybridDB白名单才能连接成功, 看第一步查看如何添加白名单。

  3. 数据同步

    注意

    目前DataWorks是支持HybridDB同步到任意数据源,及任意数据源同步到HybridDB。下面以ODPS同步到HybridDB为例

    • 单击顶部菜单栏中的 数据集成,导航至 任务列表页面,点击新建任务

    • 选择好相应的数据源和表,如下图

    • 运行同步。

results matching ""

    No results matching ""