1. 首页 > 科技快讯 >

数据平台建设方案 数据平台建设方案设计

大家好我是小周,数据平台建设方案,关于数据平台建设方案设计很多人还不知道,那么现在让我们一起来看看吧!

数据平台建设方案 数据平台建设方案设计数据平台建设方案 数据平台建设方案设计


1、整体而言,大数据平台从平台部署和数据分析过程可分为如下几步:1、linux系统安装一般使用开源版的Redhat系统--CentOS作为底层平台。

2、为了提供稳定的硬件基础,在给硬盘做RAID和挂载数据存储节点的时,需要按情况配置。

3、例如,可以选择给HDFS的namenode做RAID2以提高其稳定性,将数据存储与操作系统分别放置在不同硬盘上,以确保操作系统的正常运行。

4、互联网是个神奇的大网,大数据开发和软件定制也是一种模式,这里提供最详细的报价,如果真的想做,可以来这里,这个手技的开始数字是一八七中间的是三儿零最后的是一四二五零,按照顺序组合起来就可以找到,想说的是,除非想做或者了解这方面的内容,如果只是凑热闹的话,就不要来了。

5、2、分布式计算平台/组件安装目前国内外的分布式系统的大多使用的是Hadoop系列开源系统。

6、Hadoop的核心是HDFS,一个分布式的文件系统。

7、在其基础上常用的组件有Yarn、Zookeeper、Hive、Hbase、Sqoop、Impala、ElasticSearch、Spark等。

8、先说下使用开源组件的优点:1)使用者众多,很多bug可以在网上找的答案(这往往是开发中最耗时的地方)。

9、2)开源组件一般免费,学习和维护相对方便。

10、3)开源组件一般会持续更新,提供必要的更新服务『当然还需要手动做更新操作』。

11、4)因为代码开源,若出bug可自由对源码作修改维护。

12、再简略讲讲各组件的功能。

13、分布式集群的资源管理器一般用Yarn,『全名是Yet Another ResourceNegotiator』。

14、常用的分布式数据数据『仓』库有Hive、Hbase。

15、Hive可以用SQL查询『但效率略低』,Hbase可以快速『近实时』读取行。

本文到这结束,希望上面文章对大家有所帮助。

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至836084111@qq.com 举报,一经查实,本站将立刻删除。

联系我们

工作日:9:30-18:30,节假日休息