您现在的位置是:首页 > 编程 > 

【Apache Doris】周FAQ集锦:第 17 期

2025-07-29 15:16:46
【Apache Doris】周FAQ集锦:第 17 期 引言 欢迎查阅本周的 Apache Doris 社区 FAQ 栏目!在这个栏目中,每周将筛选社区反馈的热门问题和话题,重点回答并进行深入探讨。旨在为广大用户和开发者分享有关 Apache Doris 的常见问题。通过这个每周 FAQ 栏目,希望帮助社区小伙伴更好地了解和应用 Apache Doris,促进经验交流和技术共享。 SQL问题

【Apache Doris】周FAQ集锦:第 17 期

引言

欢迎查阅本周的 Apache Doris 社区 FAQ 栏目!

在这个栏目中,每周将筛选社区反馈的热门问题和话题,重点回答并进行深入探讨。旨在为广大用户和开发者分享有关 Apache Doris 的常见问题。

通过这个每周 FAQ 栏目,希望帮助社区小伙伴更好地了解和应用 Apache Doris,促进经验交流和技术共享。



SQL问题

Q1 查询时报:

代码语言:javascript代码运行次数:0运行复制
process memory used 48.26 GB exceed limit 50.21 GB or sys available memory 1.54 GB less than low water mark 1.60 GB.

A1 通常是资源不足导致,低于低水位线了,可参考如下几种排查思路:

1. 单个任务跑不出来时,可能是SQL任务较大,导致资源不足。这种场景可以先分析SQL任务能否进行大拆小地拆分下;如果是包含大表计算,分析有没有分区设计,更好地利用分区裁剪能力。

2. 当前查询任务是否较多,如果是并发执行比较多时,分析是否可以错峰对任务进行编排。

. 分析BE内存的使用情况,即内存是否有正常释放,是否出现内存泄漏,导致资源紧缺的问题,可以结合memtrakcer进行初步分析

数据操作问题

Q2 doris中update更新和delete删除操作频繁有什么影响?

A2 doris中不推荐小数据量频繁的更新和删除操作。可以理解 update 和 delete 是查+写入的过程,少量高频的操作本身会导致查数据耗费性能,同时 compaction的触发会比较频繁,集整体也有会压力。尽可能使用部分列更新和批量删除的特性去代替此类操作。

Q doris进行drop column后多久会清理磁盘数据?

A drop column这类schema change的操作不会立即执行删除,需要做完一次base compactoin才会清理对应的磁盘数据。

Q4 使用flink-doris-connector整库同步mysql到doris时报:

代码语言:javascript代码运行次数:0运行复制
Caused by: java.: io.MySqlConnection$MySqlConnectionConfiguration.<init>(Lio/debezium/config/Configuration;Ljava/util/Properties;)

A4 mysql-cdc包引入错误导致,如下图所示,需要使用flink-sql-connector-xx胖包。

Q5 doris的倒排索引如何自定义分词?

A5 doris的倒排索引会对词组进行分词,对于某些特定组合如果不想让其进行分词,可以在be/dict/user.dict.utf8中加上这个特定组合,比如加入“欢迎加入doris”这个词组会被视为一个整体,不再对其进行分词。

具体内容可查阅:

Q6 doris的ccr跨集数据同步是否支持多个源端集到一个目标集?

A6 特定条件地支持。多源表不能到一个目标表,多源到一个目的集,表不同或者库不同是可以的。

Q7 doris 数据根部均匀是怎么保证的,例如对于扩容后怎么确保数据是均匀的?

A7 世界最好的算法还是随机,doris扩缩容后首先会做自动数据均衡的,均衡操作后数据就基本均匀了。所有的调度到最后,会发现随机是最均匀最好的。数据每个分片大小可控,查询复杂度不可控,在这两个不可控的前提下,做任何的调度效果都不佳。

运维常见问题

Q8 doris-manager挂了,是否会影响doris服务,后续有没有考虑设计manager高可用?

A8 如下:

1. doris-manager挂了绝不会影响doris服务。这是manager设计的基本要求,所以manager不用高可,也不需要弄这么复杂。

2. manager叫做管控面,doris叫数据面,管控面不能影响到数据面,这些是基本设计原则。

doris-manager内容可查阅:

Q9 doris官方文档的SSB测试中,SSB宽表测试结果和标准SSB测试结果有什么区别?

A9 区别是标准ssb有join场景,ssb flat宽表没有join场景。ssb 主要是测多表join的,clickhouse将其改成宽表后,就没有join了,ssb flat宽表对于ck就擅长了。

其它问题

Q10 doris是否支持存算分离的部署模式?

A10 Apache Doris的.0大版本已在最近推出,主要新特性也是存算分离架构,当前已经有不少Doris用户在测试环境体验中,欢迎大家多多关注和试用!

存算分离内容可查阅:

本文参与 腾讯云自媒体同步曝光计划,分享自。原始发表:2024-07-20,如有侵权请联系 cloudcommunity@tencent 删除集设计数据apache测试

#感谢您对电脑配置推荐网 - 最新i3 i5 i7组装电脑配置单推荐报价格的认可,转载请说明来源于"电脑配置推荐网 - 最新i3 i5 i7组装电脑配置单推荐报价格

本文地址:http://www.dnpztj.cn/biancheng/1224841.html

相关标签:无
上传时间: 2025-07-25 22:35:56
留言与评论(共有 19 条评论)
本站网友 近视恢复
20分钟前 发表
少量高频的操作本身会导致查数据耗费性能
本站网友 闫云达
19分钟前 发表
比如加入“欢迎加入doris”这个词组会被视为一个整体
本站网友 网贷平台
22分钟前 发表
重点回答并进行深入探讨
本站网友 北京印象小区
28分钟前 发表
所有的调度到最后
本站网友 李海波
24分钟前 发表
不再对其进行分词
本站网友 smartqq
22分钟前 发表
分析有没有分区设计
本站网友 给宝宝吃什么奶粉好
29分钟前 发表
尽可能使用部分列更新和批量删除的特性去代替此类操作
本站网友 阴道之道
4分钟前 发表
2. manager叫做管控面
本站网友 商业地产策划案例
22分钟前 发表
运维常见问题 Q8 doris-manager挂了
本站网友 大学生玩死亡游戏
9分钟前 发表
多源表不能到一个目标表
本站网友 浙江建设职业技术学院地址
27分钟前 发表
后续有没有考虑设计manager高可用?A8 如下: 1. doris-manager挂了绝不会影响doris服务
本站网友 声音素材
17分钟前 发表
欢迎大家多多关注和试用! 存算分离内容可查阅: 本文参与 腾讯云自媒体同步曝光计划
本站网友 禁止吸烟的标志
18分钟前 发表
这些是基本设计原则
本站网友 莫比乌斯带
26分钟前 发表
可以在be/dict/user.dict.utf8中加上这个特定组合
本站网友 蛇最怕什么
5分钟前 发表
可以在be/dict/user.dict.utf8中加上这个特定组合
本站网友 儿童饮食食谱
15分钟前 发表
doris-manager内容可查阅: Q9 doris官方文档的SSB测试中
本站网友 兴化新闻
6分钟前 发表
可以结合memtrakcer进行初步分析 数据操作问题 Q2 doris中update更新和delete删除操作频繁有什么影响?A2 doris中不推荐小数据量频繁的更新和删除操作
本站网友 出租车电话
3分钟前 发表
分析有没有分区设计