没有找到合适的产品?
联系客服协助选型:023-68661681
提供3000多款全球软件/控件产品
针对软件研发的各个阶段提供专业培训与技术咨询
根据客户需求提供定制化的软件开发服务
全球知名设计软件,显著提升设计质量
打造以经营为中心,实现生产过程透明化管理
帮助企业合理产能分配,提高资源利用率
快速打造数字化生产线,实现全流程追溯
生产过程精准追溯,满足企业合规要求
以六西格玛为理论基础,实现产品质量全数字化管理
通过大屏电子看板,实现车间透明化管理
对设备进行全生命周期管理,提高设备综合利用率
实现设备数据的实时采集与监控
利用数字化技术提升油气勘探的效率和成功率
钻井计划优化、实时监控和风险评估
提供业务洞察与决策支持实现数据驱动决策
原创|行业资讯|编辑:况鱼杰|2020-06-03 10:13:33.943|阅读 362 次
概述:Apache Hadoop Ozone是一个分布式键值存储,可以同时管理大小文件。Ozone旨在解决HDFS相对于小文件的规模限制。HDFS旨在存储大文件,对于Namenode,HDFS上建议的文件数量为3亿个,并且扩展规模不能超过此限制。
# 界面/图表报表/文档/IDE等千款热门软控件火热销售中 >>
相关链接:
Apache Hadoop Ozone是一个分布式键值存储,可以同时管理大小文件。Ozone旨在解决HDFS相对于小文件的规模限制。HDFS旨在存储大文件,对于Namenode,HDFS上建议的文件数量为3亿个,并且扩展规模不能超过此限制。
有助于实现可扩展性的Ozone的主要功能是:
突破10亿个密钥之旅,超越了HDFS可扩展性限制
在Ozone中达到十亿个对象一直是该项目的重要里程碑之一。使用在5个节点(每个节点有50个线程)上运行的自定义作业填充数据。Ozone在11个节点的群集(1个OM,1个SCM和9个数据节点)上运行,花了56个小时才达到10亿个对象,每个对象的大小均为10KB。选择10KB的原因是用小文件测量Ozone性能。
Ozone能够以〜5000个对象/秒的持续速率写入对象,这进一步突出了Ozone的小文件处理能力,在整个测试过程中,它能够提供相同的吞吐量。
一些重要的细节:
来自OzoneManger的持续交易
OzoneManger总共处理了20亿笔交易,每个对象有两笔交易(一个用于打开文件,另一个用于提交文件)。OzoneManger(OM)以大约12毫秒的延迟处理了10亿个对象中的这些操作。恒定的等待时间还凸显了OzoneManager上没有长时间的GC暂停。
小元数据开销
每个10KB大小的十亿个密钥存储在2121个5GB容器中,这大大减少了SCM的块元数据,与在OFS中报告的2121个容器相比,HDFS中报告了10亿个块。另一方面,OM上的十亿个密钥在SSD上总共占用了127 GB的空间。
测试环境
该测试在Apache Hadoop Ozone 0.5.0(Beta)版本上运行。
硬件
该测试是在AWS EC2实例类型为m5a.4xlarge的情况下执行的,其中具有用于OzoneManager和Storage Container Manager数据库的SSD。
结论
HDFS围绕小文件的已知限制和名称空间规模限制导致存储节点利用率不足,GC问题和Namenode不稳定,以及大型数据湖部署的名称空间碎片。Ozone通过处理数十亿个各种大小的文件来克服这些限制,因此可以在单个名称空间中部署大型数据湖。 具有更高规模的Ozone体系结构以及对对象存储用例的支持,可以满足私有云环境中对大数据存储的需求,在私有云环境中,计算和存储的分类正在迅速发展。
关于Cloudera
在 Cloudera,我们相信数据可以使今天的不可能,在明天成为可能。我们使人们能够将复杂的数据转换为清晰而可行的洞察力。Cloudera 为任何地方的任何数据从边缘到人工智能提供企业数据云平台服务。在开源社区不懈创新的支持下, Cloudera推动了全球最大型企业的数字化转型历程。了解更多,请联系在线客服。
慧都大数据专业团队为企业提供Cloudera大数据平台搭建,免费业务咨询,定制开发等完整服务,快速、轻松、低成本将任何Hadoop集群从试用阶段转移到生产阶段。
欢迎拨打慧都热线023-68661681或咨询慧都在线客服,我们有专业的大数据团队,为您提供免费大数据相关业务咨询!
本站文章除注明转载外,均为本站原创或翻译。欢迎任何形式的转载,但请务必注明出处、不得修改原文相关链接,如果存在内容上的异议请邮件反馈至chenjj@evget.com
通过AI技术的深度整合,TestComplete将测试成功率提升至行业领先水平,让团队真正体验到测试自动化的全部价值。工程师们不再被困在无尽的测试维护中,而是可以将精力集中在更重要的质量保障和创新工作上。这种"即时数据集+自愈测试"的组合,不仅解决了测试数据准备和测试维护两大核心难题,更重新定义了智能质量保障的新标准。
Java测试平台Parasoft Jtest通过智能分析代码依赖关系,实现了“代码变更≠全量重测”的突破。它能够自动识别直接和间接受影响的测试用例,仅运行必要测试,同时与质量洞察平台深度集成,帮助团队从战术测试迈向战略级质量管控,彻底解决了传统单元测试的资源错配与效率瓶颈问题。
Copilot 在 Visual Studio 中迎来了全新升级,不仅带来了更智能的默认模型,还提供了更多模型选择,以及更便捷的使用和计费管理方式,全面提升开发体验!
财富管理软件团队采用TestComplete解决WPF界面自动化测试难题,通过原生控件识别、Jenkins集成实现夜间回归测试,结合模块化设计与数据驱动策略,达成90%自动化测试覆盖率,显著提升测试效率并降低维护成本,满足敏捷开发需求。
一款用于数据驱动的云优先型企业的平台。
Cloudera Data Warehouse今天,明天及未来的现代分析数据库。
Cloudera DataFlowCloudera DataFlow是一个可扩展的实时流分析平台。
Cloudera Machine Learning使AI第一企业能够通过自助服务访问受控数据。
CDP Data CenterCDP Data Center是用于本地IT环境的全面数据管理和分析平台。
服务电话
重庆/ 023-68661681
华东/ 13452821722
华南/ 18100878085
华北/ 17347785263
客户支持
技术支持咨询服务
服务热线:400-700-1020
邮箱:sales@evget.com
关注我们
地址 : 重庆市九龙坡区火炬大道69号6幢
慧都科技 版权所有 Copyright 2003-
2025 渝ICP备12000582号-13 渝公网安备
50010702500608号