spark报错OutOfMemory「建议收藏」

全栈程序员-用户IM • 2022年4月16日下午3:00 • 未分类

最近在使用spark进行分析的时候几千万的数据量感觉不多但是跑起来非常慢内存溢出OutOfMemory1.然后在有使用map的地方在map之前进行分区repartition2.join会有shuffle产生shuffle也会产生数据溢出3.map也可以换成 mapPartitions并且适当调整分区数200400 其他的还有很多我用的就这些然后任务可以跑出来。…

大家好，又见面了，我是你们的朋友全栈君。

最近在使用spark进行分析的时候几千万的数据量感觉不多但是跑起来非常慢

内存溢出OutOfMemory

1.然后在有使用map的地方在map之前进行分区repartition

2.join会有shuffle产生 shuffle也会产生数据溢出

3.map也可以换成 mapPartitions 并且适当调整分区数 200 400

其他的还有很多我用的就这些然后任务可以跑出来。

还有什么错误比如 reset by peer还有什么255的错误

报错信息没有记录

然后使用配置文件去调整

config.set("spark.network.timeout","100000")
    config.set("spark.executor.heartbeatInterval","100s")
    config.set("spark.executor.memory", "50g")
    config.set("spark.shuffle.blockTransferService", "nio")

没用

主要是代码问题。。。

版权声明：本文内容由互联网用户自发贡献，该文观点仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容，请发送邮件至举报，一经查实，本站将立刻删除。

发布者：全栈程序员-用户IM，转载请注明出处：https://javaforall.cn/127866.html原文链接：https://javaforall.cn

【正版授权，激活自己账号】： Jetbrains全家桶Ide使用，1年售后保障，每天仅需1毛

【官方授权正版激活】： 官方授权正版激活支持Jetbrains家族下所有IDE 使用个人JB账号...

赞 (0)

全栈程序员-用户IM

0 0

zabbix监控面试题[通俗易懂]

zabbix监控面试题[通俗易懂]监控基础概论zabbix并非监控，而是实现监控的工具Zabbix-server是一个c/s和b/s结构安装zabbbix的服务器安装时和php7.1有冲突：若此机器上已经安装php7.1就安装不上zabbix监控知识体系为什么要使用监控1.对系统不间断实时监控2.实时反馈系统当前状态3.保证服务可靠性安全性4.保证业务持续稳定运行如果去到…

全栈程序员-用户IM
2022年6月12日
2022最新手机号码正则

2022最新手机号码正则2022最新手机号码正则

全栈程序员-用户IM
2022年5月31日
python dropna()用法「建议收藏」

python dropna()用法「建议收藏」pythondropna()用法**DataFrme.dropna(axis=0,how=’any’,thresh=None,subset=None,inplace=False)参数：axis:默认axis=0。0为按行删除,1为按列删除how:默认‘any’。‘any’指带缺失值的所有行/列;’all’指清除一整行/列都是缺失值的行/列thresh:int,保留含有int个非nan值的行subset:删除特定列中包含缺失值的行或列inplac

全栈程序员-用户IM
2022年9月18日
drp错误集锦—“Cannot return from outside a function or method”

drp错误集锦—“Cannot return from outside a function or method”

全栈程序员-用户IM
2022年2月6日
JAVASocket实现聊天室「建议收藏」

JAVASocket实现聊天室「建议收藏」JAVASocket实现聊天室文章目录JAVASocket实现聊天室Sokcet是什么JAVASOCKET编程中的两个重要对象ServerSocket构造方法acceptbindcloseSocket构造方法getInputStream，getOutputStreamclose聊天室实现服务端实现客户端实现读线程实现写线程实现运行结果Sokcet是什么socket本质上是两个端点之间的通…

全栈程序员-用户IM
2022年6月15日
POJ 3177 Redundant Paths POJ 3352 Road Construction（双连接）

POJ 3177 Redundant Paths POJ 3352 Road Construction（双连接）

全栈程序员-用户IM
2022年1月13日

发表回复

关注全栈程序员社区公众号