# 数据源管理

    # 数据源作用

    平台将根据数据源读取数据所在位置。

    # 数据源类型

    数据源分为内部(INTERNAL)和外部(EXTERNAL)两类。

    # 内部数据源

    支持 MySQL,主要针对企业内部系统。当前内部数据源仅供查看历史数据使用。

    # 外部数据源

    外部数据源除支持 MySQL 外,还支持 Oracle、Db2、CUSTOM、HANA、PostgreSQL、Kafka、ODPS 等类型,主要针对外部客户所提供的数据。

    外部数据源同样可用于创建外部数据模型以及数据集成,此外在数据导出中仅可选择外部数据源进行导出。

    # 添加数据源

    # 添加 MySQL 数据源

    进入 数据治理 > 数据源管理 > 新增数据源,选择数据源类型为 MySQL 并配置数据库。保存成功后即可在数据源管理页面查看。

    • 测试连接:点击确认数据源是否连通。若测试失败,请检查用户名或密码以及其他相关配置是否正确。

    • 自动探知:对于 MySQL 类型的数据源,可自动探知模型,无需手动建模。

    # 添加 Kafka 数据源

    选择数据源类型为 Kafka,配置示意如下:

    # 添加 Elasticsearch 数据源

    选择数据源类型为 Elasticsearch,配置示意如下:

    在描述框中添加导入索引和类型信息。

    {"index":"label","type":"label"}
    

    # 添加 ODPS 数据源

    选择数据源类型为 ODPS,配置示意如下:

    在描述框中添加补充信息,以逗号分隔。

    {"partition":"ds=123,ms=123","tunnelServer":"http://dt.odps.aliyun.com"}
    

    # 同一数据源下多个前缀相同的 MySQL 表(分库分表)

    适用于同一数据库下有多张名称为 “ABC_数字” 的表的场景。

    {"tablePrefix":"c_level_change_log_","tableMin":"0","tableMax":"251"}
    
    • tablePrefix:代表表名的前缀。

    • tableMin:代表开始的后缀。

    • tableMax:代表结束的后缀。

    对于此类数据源,仅需配置一个数据模型即可,模型名称为上文提及的 ABC 部分,无需添加数字。完成数据集成节点配置且运行后,上述所有表的数据将集成至同一表中。

    # 数据源查询

    平台支持根据数据源名称、分类、类型、标签等条件筛选数据源。

    # 数据源一键同步

    若数据源连接信息发生变化,可在数据源详情页面一键同步工作流。

    随后可通过历史同步记录查看同步状态。

    # 数据源导入导出

    平台支持批量导入导出数据源。