- StarRocks
- 产品简介
- 快速开始
- 表设计
- 数据导入
- 数据提取
- 使用StarRocks
- 管理手册
- 参考手册
- SQL参考
- 用户账户管理
- 集群管理
- ADMIN CANCEL REPAIR
- ADMIN CHECK TABLET
- ADMIN REPAIR
- ADMIN SET CONFIG
- ADMIN SET REPLICA STATUS
- ADMIN SHOW CONFIG
- ADMIN SHOW REPLICA DISTRIBUTION
- ADMIN SHOW REPLICA STATUS
- ALTER SYSTEM
- CANCEL DECOMMISSION
- CREATE RESOURCE GROUP
- CREATE FILE
- DROP FILE
- INSTALL PLUGIN
- SHOW BACKENDS
- SHOW BROKER
- SHOW FRONTENDS
- SHOW FULL COLUMNS
- SHOW INDEX
- SHOW PLUGINS
- SHOW TABLE STATUS
- SHOW FILE
- UNINSTALL PLUGIN
- DDL
- ALTER DATABASE
- ALTER TABLE
- ALTER VIEW
- ALTER RESOURCE
- BACKUP
- CANCEL BACKUP
- CANCEL RESTORE
- CREATE DATABASE
- CREATE INDEX
- CREATE MATERIALIZED VIEW
- CREATE REPOSITORY
- CREATE RESOURCE
- CREATE TABLE AS SELECT
- CREATE TABLE LIKE
- CREATE TABLE
- CREATE VIEW
- CREATE FUNCTION
- DROP DATABASE
- DROP INDEX
- DROP MATERIALIZED VIEW
- DROP REPOSITORY
- DROP RESOURCE
- DROP TABLE
- DROP VIEW
- DROP FUNCTION
- HLL
- RECOVER
- RESTORE
- SHOW RESOURCES
- SHOW FUNCTION
- TRUNCATE TABLE
- DML
- ALTER ROUTINE LOAD
- BROKER LOAD
- CANCEL LOAD
- CANCEL EXPORT
- DELETE
- EXPORT
- GROUP BY
- INSERT
- PAUSE ROUTINE LOAD
- RESUME ROUTINE LOAD
- CREATE ROUTINE LOAD
- SELECT
- SHOW ALTER
- SHOW BACKUP
- SHOW DATA
- SHOW DATABASES
- SHOW DELETE
- SHOW DYNAMIC PARTITION TABLES
- SHOW EXPORT
- SHOW LOAD
- SHOW PARTITIONS
- SHOW PROPERTY
- SHOW REPOSITORIES
- SHOW RESTORE
- SHOW ROUTINE LOAD
- SHOW ROUTINE LOAD TASK
- SHOW SNAPSHOT
- SHOW TABLES
- SHOW TABLET
- SHOW TRANSACTION
- SPARK LOAD
- STOP ROUTINE LOAD
- STREAM LOAD
- 数据类型
- 辅助命令
- 函数参考
- 日期函数
- convert_tz
- curdate
- current_timestamp
- curtime
- datediff
- date_add
- date_format
- date_sub
- date_trunc
- day
- dayname
- dayofmonth
- dayofweek
- dayofyear
- from_days
- from_unixtime
- hour
- minute
- month
- monthname
- now
- second
- str_to_date
- timediff
- time_slice
- timestampadd
- timestampdiff
- to_date
- to_days
- unix_timestamp
- utc_timestamp
- week
- weekofyear
- year
- date_floor
- hours_diff
- minutes_diff
- months_diff
- seconds_diff
- weeks_diff
- years_diff
- quarter
- timestamp
- time_to_sec
- str2date
- microseconds_add
- microseconds_sub
- 加密函数
- 地理位置函数
- 字符串函数
- JSON 函数
- 模糊/正则匹配函数
- 工具函数
- 聚合函数
- Bitmap函数
- 数组函数
- bit函数
- cast函数
- hash函数
- 条件函数
- 百分位函数
- 数学函数
- 日期函数
- 系统变量
- 错误码
- 系统限制
- SQL参考
- 常见问题解答
- 性能测试
- Release Notes
CloudCanal 数据导入
介绍
CloudCanal 社区版是一款由 ClouGence 公司 发行的集结构迁移、数据全量迁移/校验/订正、增量实时同步为一体的免费数据迁移同步平台。产品包含完整的产品化能力,助力企业打破数据孤岛、完成数据互融互通,从而更好的使用数据。
下载安装
功能说明
推荐使用 v2.2.5.0 及以上的 CloudCanal 版本写入 StarRocks。
建议您在使用 CloudCanal 将 增量数据 导入至 StarRocks 时,控制导入的频率,CloudCanal 写入 StarRocks 的默认导入频率可以通过参数
realFlushPauseSec
调整,默认为 10 秒。当前社区版本最大的内存配置为 2GB,如果同步任务运行产生 OOM 异常或者 GC 停顿严重,可以调小以下参数来减少批次大小,从而减少内存占用。全量参数为
fullBatchSize
和fullRingBufferSize
,增量参数为increBatchSize
和increRingBufferSize
。支持的源端以及功能项:
数据源 \ 功能项 结构迁移 全量数据迁移 增量实时同步 数据校验 Oracle 源端 支持 支持 支持 支持 PostgreSQL 源端 支持 支持 支持 支持 Greenplum 源端 支持 支持 不支持 支持 MySQL 源端 支持 支持 支持 支持
使用方法
CloudCanal 提供了完整的产品化能力,用户在可视化界面完成数据源添加和任务创建即可自动完成结构迁移、全量迁移、增量实时同步。下文演示如何将 MySQL 数据库中的数据迁移同步到对端 StarRocks 中。其他源端同步到 StarRocks 也可以按照类似的方式进行。
前置条件
首先参考 CloudCanal 安装部署参考文档 完成 CloudCanal 社区版的安装和部署。
添加数据源
- 登录 CloudCanal 平台
- 数据源管理-> 新增数据源
- 选择自建数据库中 StarRocks
Tips:
Client 地址:为 StarRocks 提供给 MySQL Client 的服务端口,CloudCanal 主要用其查询库表的元数据信息。
Http 地址:Http 地址主要用于接收 CloudCanal 数据导入的请求。
任务创建
添加好数据源之后可以按照如下步骤进行数据迁移、同步任务的创建。
- 任务管理-> 任务创建
- 选择 源 和 目标 数据库
- 点击 下一步
- 选择 增量同步,并且启用 全量数据初始化
- 不勾选 DDL 同步(暂不支持)
- 点击下一步
- 选择订阅的表,结构迁移自动创建的表为主键模型的表,因此暂不支持无主键表
- 点击下一步
- 配置列映射
- 点击下一步
- 创建任务
- 查看任务状态。任务创建后,会自动完成结构迁移、全量、增量阶段。
参考资料
更多关于 CloudCanal 同步 StarRocks 的资料,可以查看