基于AWS云服务的批处理系统架构

全栈程序员-用户IM • 2021年9月3日下午10:00 • 未分类

基于AWS云服务的批处理系统架构

在AWS执行批处理任务时，允许按需配置多部分作业处理的应用架构，可用于对异构的系统的瞬时或延迟部署，并可扩展为“网格”型工作节点，通过并联的大批量任务处理实现快速收敛。面向批处理应用程序现在可以有很多的地方利用这种风格按需加工，包括理赔处理，大规模改造，媒体转码和多部分的数据处理工作。

批处理架构通常是高可变使用模式的代名词，即在一段低使用率后有明显的使用峰值（例如，月末的处理）。构建一个批处理架构有很多的方法。本文给出了一个基本的批处理架构，用来支持作业调度，作业状态检查，上传原始数据，输出作业结果，网格管理，以及报告作业性能的数据。

1. 作业管理器部署在EC2 实例上，用户通过Elastic IP与之交互。作业管理器组件控制着进程的接收，调度，启动，管理以及完成批处理作业，同时也可以访问最终的结果，作业和worker状态，以及作业的进展信息。

2. 原始的作业数据被上传到一个高可用的永久存储器中，即S3.

3. 根据用户的行为，作业管理器将单独的作业任务插入到SQS中。

4. Worker节点是使用AutoScaling组服务的 EC2 实例。这个组是一个保证了worker 节点健康和可扩展的容器。Worker 节点自动地从输入队列中提取作业部分，同时执行批处理步骤列表中的单独任务。

5. worker 节点产生的中间数据存储在 Amazon S3中。

6. 作业进展信息和统计信息存储在分析存储区。分析存储区既可以用AmazonSimpleDB 或 RDS 实例.

7. 作为可选项, 已完成的任务可以插入到AmazonSQS 队列中，用于链式结构的再次处理节点。

版权声明：本文内容由互联网用户自发贡献，该文观点仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容，请发送邮件至举报，一经查实，本站将立刻删除。

发布者：全栈程序员-用户IM，转载请注明出处：https://javaforall.cn/109560.html原文链接：https://javaforall.cn

【正版授权，激活自己账号】： Jetbrains全家桶Ide使用，1年售后保障，每天仅需1毛

【官方授权正版激活】： 官方授权正版激活支持Jetbrains家族下所有IDE 使用个人JB账号...

赞 (0)

全栈程序员-用户IM

0 0

图解Kafka中的数据采集和统计机制 | 文末送30本书任你选[通俗易懂]

图解Kafka中的数据采集和统计机制 | 文末送30本书任你选[通俗易懂]在讲解kafka限流机制之前,我想先讲解一下Kafka中的数据采集和统计机制你会不会好奇,kafka监控中,那些数据都是怎么计算出来的比如下图这些指标这些数据都是通过Jmx获取的kafka监控指标,那么我们今天老探讨一下,这些指标都是怎么被计算出来的在开始分析之前,我们可以自己思考一下如果让你统计前一分钟内的流速,你会怎么统计才能够让数字更加精确呢？我相信你脑海中肯定出现了一个词：滑动窗口在kafka的数据采样和统计中,也是用了这个方法,通过多个样本Sample进行采样,并合并统计当然

全栈程序员-用户IM
2022年5月12日
echarts实现中国地图(Vue)

1，安装echartsnpminstallecharts–save2,引入importechartsfrom”echarts”;import’echarts/map/js/china.js’//引入中国地图数据（*********重中之重）3，配制option{visualMap:{//地图图例show:true,left:26,bottom

全栈程序员-用户IM
2022年4月5日
00005__VSCode__xml格式化代码插件

00005__VSCode__xml格式化代码插件1XML或HTML格式化代码缩进安装插件：Vetur2格式化代码的快捷键如下OnWindows：Shift+Alt+FOnMac：Shift+Option+FOnUbuntu：Ctrl+Shift+I

全栈程序员-用户IM
2022年7月16日
黑盒测试的常见的测试用例设计方法有哪些[通俗易懂]

黑盒测试的常见的测试用例设计方法有哪些[通俗易懂]测试用例怎么设计？一般根据业务知识掌握，之前已有的回归测试用例，测试知识库，测试需求开始设计。黑盒测试的常见的测试用例设计方法有哪些？1）等价类划分：等价类是指某个输入域的子集合.在该子集合中,各个输入数据对于揭露程序中的错误都是等效的.并合理地假定:测试某等价类的代表值就等于对这一类其它值的测试.因此,可以把全部输入数据合理划分为若干等价类,在每一个等价类中取一个数据作为测试的输入条件,就可以用少量代表性的测试数据.取得较好的测试结果.等价类划分可有两种不同的情况:有效等价类和无效等价类.

全栈程序员-用户IM
2022年6月29日
训练过程–Batchsize（总之一般情况下batchsize能设多大就设多大）[通俗易懂]

尽可能地设大batchsize "LargeBatchLargeBatch在keypoints上也是有用的，大概能提到0.4到0.3的点的AP。"在利用ImageNet训练AlexNet模型时，其中每GPU的最优批量大小为512。如果我们希望使用大量GPU并保证每GPU皆拥有理想的执行效率，则应当将批量大小设定为16×512=8192。 "Tra…

全栈程序员-用户IM
2022年4月18日
Ext applyTo和renderTo的区别和用法「建议收藏」

Ext applyTo和renderTo的区别和用法「建议收藏」extjs中经常会用到renderTo或applyTo配置选项。这里，我就比较下两者的区别与用法。1、renderTo与render方法对应2、applyTo与applyToMarkup方法对应一、applyTo的使用：1、applyTo所指向的el元素必须要有父节点。2、applyTo所指向的el元素实际上是充当了对象要渲染的模板，对象是渲染在其父节点内。即对象实例化后所

全栈程序员-用户IM
2022年7月28日

发表回复

关注全栈程序员社区公众号