编辑

StarRocks version 2.2

2.2.4

发布日期: 2022 年 8 月 3 日

功能优化

  • Hive 外表支持 Schema Change 同步。#9010
  • Broker Load 支持导入 Parquet 文件中的 ARRAY 类型数据。#9131

问题修复

修复了如下 Bug:

  • 通过 Kerberos 认证使用 Broker Load 时无法使用多个 keytab 文件。#8820 #8837
  • 执行 stop_be.sh 后立刻退出进程,Supervisor 重新拉起服务可能失败。#9175
  • 错误的 Join Reorder 优先级导致 Join 字段报错 “Column cannot be resolved”。#9063 #9487

2.2.3

发布日期: 2022 年 7 月 24 日

Bug 修复

  • 修复资源组删除过程中的错误。#8036
  • 线程资源不足导致 Thrift server 退出。#7974
  • CBO 在一些场景下 join reorder 会无法输出结果。 #7099 #7831 #6866

2.2.2

发布日期: 2022 年 6 月 29 日

功能优化

  • 支持跨数据库使用 UDF 。 #6865 #7211

  • 优化表结构变更 (Schema Change) 等内部处理的并发控制,降低对 FE 元数据的压力,减少在高并发、大数据量导入场景下容易发生导入积压和变慢的问题。#6838

Bug 修复

修复了如下 bug:

  • 执行 CTAS 时创建的新表副本数错误( replication_num )。#7036

  • 执行 ALTER ROUTINE LOAD 后可能造成元数据丢失。 #7068

  • Runtime filter 无法下推到窗口。 #7206 #7258

  • Pipeline 中潜在的内存泄漏问题。 #7295

  • 停止 Routine Load 任务可能导致死锁。#6849

  • 一些 profile 统计信息的修正。 #7074 #6789

  • get_json_string 函数对 JSON 数组处理错误。 #7671

2.2.1

发布日期: 2022 年 6 月 2 日

功能优化

  • 通过重构部分热点代码和降低锁粒度优化导入性能,减少长尾延迟。 #6641
  • 在 FE 的审计日志中添加每个查询所消耗部署 BE 机器的 CPU 和内存信息。 #6208 #6209
  • 支持在主键模型表和更新模型表中使用 JSON 数据类型。 #6544
  • 通过降低锁粒度和 BE 汇报 (report) 请求去重减少 FE 负荷,优化部署大量 BE 时的汇报性能并解决大规模集群中 Routine Load 任务卡住的问题。 #6293

Bug 修复

修复了如下 Bug:

  • 修复 SHOW FULL TABLES FROM DatabaseName 语句中转义字符解析报错的问题。 #6559
  • FE 磁盘空间占用过快的问题(通过回滚 BDBJE 版本修复该bug)。#6708
  • 修复启用列式扫描 (enable_docvalue_scan=true) 后,因返回的数据中没有相关字段导致 BE 宕机的问题。#6600

2.2.0

发布日期: 2022 年 5 月 22 日

新功能

  • 【公测中】发布资源组管理功能。通过使用资源组来控制 CPU、内存的资源使用,让不同租户的大小查询在同一集群执行时,既能实现资源隔离,又能合理使用资源。相关文档,请参见资源组
  • 【公测中】实现 Java UDF 框架,支持使用 Java 语法编写 UDF(用户自定义函数),扩展 StarRocks 的函数功能。相关文档,请参见 Java UDF
  • 【公测中】导入数据至主键模型时,支持更新部分列。在订单更新、多流 JOIN 等实时数据更新场景下,仅需要更新与业务相关的列。相关文档,请参见 主键模型的表支持部分更新
  • 【公测中】支持 JSON 数据类型和函数。相关文档,请参见 JSON
  • 支持通过外表查询 Apache Hudi 的数据,进一步完善了数据湖分析的功能。相关文档,请参见 Apache Hudi 外表
  • 新增如下函数:

功能优化

  • 重构CBO优化器的 Parser 和 Analyzer,优化代码结构并支持 Insert with CTE 等语法。提升复杂查询的性能,包括公用表表达式(Common Table Expression,CTE)复用等。
  • 优化查询Apache Hive外表中基于对象存储(Amazon S3、阿里云OSS、腾讯云COS)的外部表的性能,优化后基于对象存储的查询性能可以与基于HDFS的查询性能基本持平。支持ORC格式文件的延迟物化,提升小文件查询性能。相关文档,请参见 Apache Hive 外表
  • 通过外表查询 Apache Hive 的数据时,缓存更新通过定期消费 Hive Metastore 的事件(包括数据变更、分区变更等),实现自动增量更新元数据。并且,还支持查询 Apache Hive 中 DECIMAL 和 ARRAY 类型的数据。相关文档,请参见 Apache Hive 外表
  • 优化 UNION ALL 算子性能,性能提升可达2-25倍。
  • 正式发布 Pipeline 引擎,支持自适应调节查询的并行度,并且优化了 Pipeline 引擎的 Profile。提升了高并发场景下小查询的性能。
  • 导入 CSV 文件时,支持使用多个字符作为行分隔符。

Bug 修复

  • 修复主键模型的表导入数据和 COMMIT 时产生死锁的问题。#4998
  • 解决 FE(包含 BDBJE)的一系列稳定性问题。#4428#4666#2
  • 修复 SUM 函数对大量数据求和时返回结果溢出的问题。#3944
  • 修复 ROUND 和 TRUNCATE 函数返回结果的精度问题。#4256
  • 修复 SQLancer 发现的一系列问题,请参见 SQLancer 相关 issues

其他

Flink 连接器 flink-connector-starrocks 支持 Flink 1.14 版本。

升级注意事项

  • 版本号低于 2.0.4 或者 2.1.x 中低于 2.1.6 的用户,升级参考 StarRocks 升级注意事项.
  • 升级后如果碰到问题需要回滚,请在 fe.conf 文件中增加 ignore_unknown_log_id=true。这是因为新版本的元数据日志新增了类型,如果不加这个参数,则无法回滚。最好等做完 checkpoint 之后再设置 ignore_unknown_log_id=false 并重启 FE,恢复正常配置。