【Apache Doris】周FAQ集锦:第 20 期
【Apache Doris】周FAQ集锦:第 20 期
引言
欢迎查阅本周的 Apache Doris 社区 FAQ 栏目!
在这个栏目中,每周将筛选社区反馈的热门问题和话题,重点回答并进行深入探讨。旨在为广大用户和开发者分享有关 Apache Doris 的常见问题。
通过这个每周 FAQ 栏目,希望帮助社区小伙伴更好地了解和应用 Apache Doris,促进经验交流和技术共享。
SQL问题
Q1 doris查询时报:
代码语言:javascript代码运行次数:0运行复制errCode = 2, detailMessage = ereids cost too much time ( > 5s )
A1 通常可以调大如下参数解决:
代码语言:javascript代码运行次数:0运行复制set global nereids_timeout_second = 0;
Q2 doris 外部表和内部表固定sql如何通过cache提高重复查询效率?
A2 Doris 自己管理的 Cache 目前均为 LRU 淘汰策略,均支持单独通过参数控制容量和淘汰时长。
Data Cache 默认关闭,需要在 FE 和 BE 中设置相关参数进行开启。Data Cache 功能仅作用于针对文件的外表查询(如 Hive、Hudi )。对内表查询,或非文件的外表查询(如 JDBC、Elasticsearch)等无影响。
代码语言:javascript代码运行次数:0运行复制-- 单个会话中开启 Data Cache
SET enable_file_cache = true;
-- 全局开启 Data Cache
SET GLOBAL enable_file_cache = true;
在2.1.及以上版本,ereids优化器在fe的内存中保存缓存的关键信息,比如非确定函数及其评估值,在关键信息未发生变化时可以跳过sql解析,优化了sql cache的查询速度。
代码语言:javascript代码运行次数:0运行复制# 确保 的cache_enable_sql_mode=true(默认是 true)
vim fe/conf/
cache_enable_sql_mode=true
-- 在 MySQL 命令行中设置变量
set [global] enable_sql_cache=true; doris cache
内存分析内存可查阅:
/
Q doris中针对非主键又是不等连接的字段,有什么适合的索引?场景是创建时间加不到主键去
A 原则上不等连接性能较差,2.1的版本社区加上了不等连接的rf,会有一定优化。
这种场景建议从连接字段上分析一下有没有改进的空间,比如字符串变int 或 null变not null。
Q4 doris插入大量数据的时候报错:
代码语言:javascript代码运行次数:0运行复制[S1000]: Packet for query is too large
(2,74,157 > 1,048,576).
You can change this value on the server by
setting the 'max_allowed_packet' variable.
A4 如下:
代码语言:javascript代码运行次数:0运行复制-- 全局调大相关参数
set global max_allowed_packet = 104857600;
-- 查看相关参数修改后的值
show variables like '%max_allowed_packet%'
数据操作问题
Q5 doris升级后,查询结果是对的,插入目标表后就会出现空值?
A5 通常原因是升级后此变量为false,致insert into select没有走pipeline引擎:
代码语言:javascript代码运行次数:0运行复制-- 开启
set global enable_nereids_dml_with_pipeline = true;
Q6 flink-doris-connector 是否兼容flink 1.20
A6 支持,master分支即可。
flink-doris-connector内容可查阅:
/
Q7 doris 2.1.版本使用回写hive的功能时报:
代码语言:javascript代码运行次数:0运行复制Failed to execute CTAS Reason:
errCode = 2, detailMessage = Unknown engine name: hive
A7 使用hive回写功能时,需要注意几个点:
代码语言:javascript代码运行次数:0运行复制-- 1. 开启全局新优化器
set global enable_nereids_planner = true
-- 2. 关闭回退
set global enable_fallback_to_original_planner=false
一些从老版本升级上来的集,上述参数的默认值可能还是老的,所以需要手动调整。另外,建议升级至>= 2.1.5 的稳定版本。
Q8 doris 弹性计算节点C,如果sql是外部表和内部表关联时,是如何查询的(外部表在什么节点查,内部表在什么节点查,中间聚合又在什么节点执行)?
A8 能利用到的节点,是 内表能用的节点,和外表能用的节点的合集。C弹性计算节点内容可查阅:
运维常见问题
Q9 一共只有96G内存,doris是分成个2G内存的节点快,还是只有一个96G的节点快?
A9 只有一个快。
单个大内存节点可以避免数据在多个节点之间的传输开销,特别是对于一些需要大量内存进行复杂计算的任务。此外,管理一个节点相对来说比管理多个节点更加简单。
其它问题
Q10 doris是否有集规模对应能支持多少数据量查询的压测数据?
A10 集规模评估没有通用的压测数据指标。
可以先参考1C : 4G Mem,1C : 50G 数据的常规模式来估算;例如 20T(密集型热数据/非全量数据) * 1024 = 204 / 50 ≈ 409C,目前这个规模的计算存储节点预估 64C * 6 = 84C;硬盘建议最好是SSD的,be属于计算密集型的组件,iops要求较高。
实际的集规模,与业务相关度特别高,比如是日志类数据,是一些报表数据之类的,还是查询是多表关联居多,还是单表的?这个对于扫描量而言差距都较大;又比如假设数据是按天级存储的,虽然有一个T,但可能是存了一年的,那每天可能就个G,其实如果按天去查询的话,扫描量就很小。所以,需要根据业务数据进行压测评估,通常和场景并发及数据需求计算复杂度有关。
本文参与 腾讯云自媒体同步曝光计划,分享自。原始发表:2024-08-0,如有侵权请联系 cloudcommunity@tencent 删除连接内存数据apache集#感谢您对电脑配置推荐网 - 最新i3 i5 i7组装电脑配置单推荐报价格的认可,转载请说明来源于"电脑配置推荐网 - 最新i3 i5 i7组装电脑配置单推荐报价格
推荐阅读
留言与评论(共有 19 条评论) |
本站网友 福建城 | 4分钟前 发表 |
【Apache Doris】周FAQ集锦:第 20 期 引言 欢迎查阅本周的 Apache Doris 社区 FAQ 栏目!在这个栏目中 | |
本站网友 快餐外送 | 4分钟前 发表 |
通常和场景并发及数据需求计算复杂度有关 | |
本站网友 不孕不育病因 | 28分钟前 发表 |
048 | |
本站网友 想起你的脸 | 29分钟前 发表 |
比如非确定函数及其评估值 | |
本站网友 35亿韩元等于多少人民币 | 19分钟前 发表 |
如有侵权请联系 cloudcommunity@tencent 删除连接内存数据apache集 | |
本站网友 组策略编辑器 | 3分钟前 发表 |
均支持单独通过参数控制容量和淘汰时长 | |
本站网友 洋甘菊精油的作用 | 15分钟前 发表 |
需要注意几个点:代码语言:javascript代码运行次数:0运行复制-- 1. 开启全局新优化器 set global enable_nereids_planner = true -- 2. 关闭回退 set global enable_fallback_to_original_planner=false 一些从老版本升级上来的集 | |
本站网友 破解电信 | 5分钟前 发表 |
会有一定优化 | |
本站网友 hct | 18分钟前 发表 |
Q4 doris插入大量数据的时候报错: 代码语言:javascript代码运行次数:0运行复制[S1000] | |
本站网友 中国剪报 | 19分钟前 发表 |
C弹性计算节点内容可查阅: 运维常见问题 Q9 一共只有96G内存 | |
本站网友 bmp格式 | 28分钟前 发表 |
这种场景建议从连接字段上分析一下有没有改进的空间 | |
本站网友 帕金森的治疗方法 | 13分钟前 发表 |
74 | |
本站网友 装修材料品牌 | 13分钟前 发表 |
2.1的版本社区加上了不等连接的rf | |
本站网友 春天喝什么茶 | 23分钟前 发表 |
Data Cache 功能仅作用于针对文件的外表查询(如 Hive | |
本站网友 女人挣钱的门路 | 2分钟前 发表 |
重点回答并进行深入探讨 | |
本站网友 深圳医院在线咨询 | 8分钟前 发表 |
单个大内存节点可以避免数据在多个节点之间的传输开销 | |
本站网友 quan | 20分钟前 发表 |
建议升级至>= 2.1.5 的稳定版本 | |
本站网友 珠江御景湾 | 12分钟前 发表 |
那每天可能就个G |