您现在的位置是:首页 > 编程 > 

【Apache Doris】周FAQ集锦:第 20 期

2025-07-27 01:26:30
【Apache Doris】周FAQ集锦:第 20 期 引言 欢迎查阅本周的 Apache Doris 社区 FAQ 栏目!在这个栏目中,每周将筛选社区反馈的热门问题和话题,重点回答并进行深入探讨。旨在为广大用户和开发者分享有关 Apache Doris 的常见问题。通过这个每周 FAQ 栏目,希望帮助社区小伙伴更好地了解和应用 Apache Doris,促进经验交流和技术共享。 SQL问题

【Apache Doris】周FAQ集锦:第 20 期

引言

欢迎查阅本周的 Apache Doris 社区 FAQ 栏目!

在这个栏目中,每周将筛选社区反馈的热门问题和话题,重点回答并进行深入探讨。旨在为广大用户和开发者分享有关 Apache Doris 的常见问题。

通过这个每周 FAQ 栏目,希望帮助社区小伙伴更好地了解和应用 Apache Doris,促进经验交流和技术共享。



SQL问题

Q1 doris查询时报:

代码语言:javascript代码运行次数:0运行复制
errCode = 2, detailMessage = ereids cost too much time ( > 5s )

A1 通常可以调大如下参数解决:

代码语言:javascript代码运行次数:0运行复制
set global nereids_timeout_second = 0;

Q2 doris 外部表和内部表固定sql如何通过cache提高重复查询效率?

A2 Doris 自己管理的 Cache 目前均为 LRU 淘汰策略,均支持单独通过参数控制容量和淘汰时长。

Data Cache 默认关闭,需要在 FE 和 BE 中设置相关参数进行开启。Data Cache 功能仅作用于针对文件的外表查询(如 Hive、Hudi )。对内表查询,或非文件的外表查询(如 JDBC、Elasticsearch)等无影响。

代码语言:javascript代码运行次数:0运行复制
-- 单个会话中开启 Data Cache 
SET enable_file_cache = true; 
-- 全局开启 Data Cache 
SET GLOBAL enable_file_cache = true; 

在2.1.及以上版本,ereids优化器在fe的内存中保存缓存的关键信息,比如非确定函数及其评估值,在关键信息未发生变化时可以跳过sql解析,优化了sql cache的查询速度。

代码语言:javascript代码运行次数:0运行复制
# 确保  的cache_enable_sql_mode=true(默认是 true) 
vim fe/conf/ 
cache_enable_sql_mode=true 

-- 在 MySQL 命令行中设置变量 
set [global] enable_sql_cache=true; doris cache 

内存分析内存可查阅:

/

Q doris中针对非主键又是不等连接的字段,有什么适合的索引?场景是创建时间加不到主键去

A 原则上不等连接性能较差,2.1的版本社区加上了不等连接的rf,会有一定优化。

这种场景建议从连接字段上分析一下有没有改进的空间,比如字符串变int 或 null变not null。

Q4 doris插入大量数据的时候报错:

代码语言:javascript代码运行次数:0运行复制
[S1000]: Packet for query is too large 
(2,74,157 > 1,048,576). 
You can change this value on the server by 
setting the 'max_allowed_packet' variable.

A4 如下:

代码语言:javascript代码运行次数:0运行复制
-- 全局调大相关参数
set global max_allowed_packet = 104857600;

-- 查看相关参数修改后的值
show variables like '%max_allowed_packet%'

数据操作问题

Q5 doris升级后,查询结果是对的,插入目标表后就会出现空值?

A5 通常原因是升级后此变量为false,致insert into select没有走pipeline引擎:

代码语言:javascript代码运行次数:0运行复制
-- 开启 
set global enable_nereids_dml_with_pipeline = true;

Q6 flink-doris-connector 是否兼容flink 1.20

A6 支持,master分支即可。

flink-doris-connector内容可查阅:

/

Q7 doris 2.1.版本使用回写hive的功能时报:

代码语言:javascript代码运行次数:0运行复制
Failed to execute CTAS Reason: 
errCode = 2, detailMessage = Unknown engine name: hive

A7 使用hive回写功能时,需要注意几个点:

代码语言:javascript代码运行次数:0运行复制
-- 1. 开启全局新优化器 
set global enable_nereids_planner = true 

-- 2. 关闭回退 
set global enable_fallback_to_original_planner=false 

一些从老版本升级上来的集,上述参数的默认值可能还是老的,所以需要手动调整。另外,建议升级至>= 2.1.5 的稳定版本。

Q8 doris 弹性计算节点C,如果sql是外部表和内部表关联时,是如何查询的(外部表在什么节点查,内部表在什么节点查,中间聚合又在什么节点执行)?

A8 能利用到的节点,是 内表能用的节点,和外表能用的节点的合集。C弹性计算节点内容可查阅:

运维常见问题

Q9 一共只有96G内存,doris是分成个2G内存的节点快,还是只有一个96G的节点快?

A9 只有一个快。

单个大内存节点可以避免数据在多个节点之间的传输开销,特别是对于一些需要大量内存进行复杂计算的任务。此外,管理一个节点相对来说比管理多个节点更加简单。

其它问题

Q10 doris是否有集规模对应能支持多少数据量查询的压测数据?

A10 集规模评估没有通用的压测数据指标。

可以先参考1C : 4G Mem,1C : 50G 数据的常规模式来估算;例如 20T(密集型热数据/非全量数据) * 1024 = 204 / 50 ≈ 409C,目前这个规模的计算存储节点预估 64C * 6 = 84C;硬盘建议最好是SSD的,be属于计算密集型的组件,iops要求较高。

实际的集规模,与业务相关度特别高,比如是日志类数据,是一些报表数据之类的,还是查询是多表关联居多,还是单表的?这个对于扫描量而言差距都较大;又比如假设数据是按天级存储的,虽然有一个T,但可能是存了一年的,那每天可能就个G,其实如果按天去查询的话,扫描量就很小。所以,需要根据业务数据进行压测评估,通常和场景并发及数据需求计算复杂度有关。

本文参与 腾讯云自媒体同步曝光计划,分享自。原始发表:2024-08-0,如有侵权请联系 cloudcommunity@tencent 删除连接内存数据apache集

#感谢您对电脑配置推荐网 - 最新i3 i5 i7组装电脑配置单推荐报价格的认可,转载请说明来源于"电脑配置推荐网 - 最新i3 i5 i7组装电脑配置单推荐报价格

本文地址:http://www.dnpztj.cn/biancheng/1224815.html

相关标签:无
上传时间: 2025-07-25 22:32:49
留言与评论(共有 19 条评论)
本站网友 福建城
4分钟前 发表
【Apache Doris】周FAQ集锦:第 20 期 引言 欢迎查阅本周的 Apache Doris 社区 FAQ 栏目!在这个栏目中
本站网友 快餐外送
4分钟前 发表
通常和场景并发及数据需求计算复杂度有关
本站网友 不孕不育病因
28分钟前 发表
048
本站网友 想起你的脸
29分钟前 发表
比如非确定函数及其评估值
本站网友 35亿韩元等于多少人民币
19分钟前 发表
如有侵权请联系 cloudcommunity@tencent 删除连接内存数据apache集
本站网友 组策略编辑器
3分钟前 发表
均支持单独通过参数控制容量和淘汰时长
本站网友 洋甘菊精油的作用
15分钟前 发表
需要注意几个点:代码语言:javascript代码运行次数:0运行复制-- 1. 开启全局新优化器 set global enable_nereids_planner = true -- 2. 关闭回退 set global enable_fallback_to_original_planner=false 一些从老版本升级上来的集
本站网友 破解电信
5分钟前 发表
会有一定优化
本站网友 hct
18分钟前 发表
Q4 doris插入大量数据的时候报错: 代码语言:javascript代码运行次数:0运行复制[S1000]
本站网友 中国剪报
19分钟前 发表
C弹性计算节点内容可查阅: 运维常见问题 Q9 一共只有96G内存
本站网友 bmp格式
28分钟前 发表
这种场景建议从连接字段上分析一下有没有改进的空间
本站网友 帕金森的治疗方法
13分钟前 发表
74
本站网友 装修材料品牌
13分钟前 发表
2.1的版本社区加上了不等连接的rf
本站网友 春天喝什么茶
23分钟前 发表
Data Cache 功能仅作用于针对文件的外表查询(如 Hive
本站网友 女人挣钱的门路
2分钟前 发表
重点回答并进行深入探讨
本站网友 深圳医院在线咨询
8分钟前 发表
单个大内存节点可以避免数据在多个节点之间的传输开销
本站网友 quan
20分钟前 发表
建议升级至>= 2.1.5 的稳定版本
本站网友 珠江御景湾
12分钟前 发表
那每天可能就个G