【大数据面试题】020 你使用过哪些大数据平台?有什么区别?

一步一个脚印,一天一道面试题。

因为大数据早已脱离了当初只要搭建 Hadoop 集群就算成功的蛮荒时代。为了各个大数据组件使用方便,国内的大企业都用上了大数据平台,这些平台会集成,图形化管理,升级各类组件。比如你可以图表的形式去了解集群状态,存储使用等。非常方便。然后现在的面试也很多会问有没有使用到公司在用的大数据平台。那这次也就简单说说咱们国内相对常见的大数据平台吧。

Ambari:

简单总结免费的,Apache 开源的大数据平台,2022年1月停止维护
实际使用:Ambari作为一款开源的集群管理工具,在Hadoop生态系统中被广泛应用,并且得到了很多企业和组织的认可和使用。
优点:提供了集中式的管理、监控和诊断功能,易于安装和配置,具有直观的可视化界面和配置工具,使得Hadoop集群的管理更加简单高效。
缺点:出问题,组件升级的时候要去自己排查,比较麻烦,而且已经停止维护了。

Cloudera:

简单总结:付费的,有问题可以找售后,所以也有不少大公司会买来用。
实际使用:Cloudera是一家大数据元老公司,其大数据平台被广泛应用于各种规模的企业,拥有大量的用户和案例。
优点:提供了全面的数据管理、处理和分析解决方案,包括CDH和Cloudera Manager等组件,具有丰富的功能和强大的技术支持,有很好的售后
缺点

阿里云大数据平台:

简单总结:许多互联网企业不好自己搭建集群,就找阿里云来做云集群,云计算。
实际使用:阿里云大数据平台以其稳定性、弹性扩展性和安全性而受到广泛欢迎,在国内外企业中应用广泛。
优点:提供了多种大数据计算和存储服务,如MaxCompute、DataWorks、实时计算等,具有高度的灵活性和可扩展性。
缺点:有些企业考虑数据安全等原因,不喜欢上云。

结合招聘要求,实际用的比较多的大数据平台除了上述 3 个,还有 微软Azure云平台星环大数据平台华为云腾讯云
这篇文章知识有限,多多见谅,有什么意见问题可以评论指出,谢谢。

我是 近未来,祝你变得更强!

相关推荐

  1. 数据面试023 Spark RDD 是什么

    2024-03-25 20:50:04       35 阅读
  2. 数据面试024 Spark 3 升级了些什么

    2024-03-25 20:50:04       32 阅读

最近更新

  1. docker php8.1+nginx base 镜像 dockerfile 配置

    2024-03-25 20:50:04       94 阅读
  2. Could not load dynamic library ‘cudart64_100.dll‘

    2024-03-25 20:50:04       100 阅读
  3. 在Django里面运行非项目文件

    2024-03-25 20:50:04       82 阅读
  4. Python语言-面向对象

    2024-03-25 20:50:04       91 阅读

热门阅读

  1. webpack原理之-打包流程&热更新HMR

    2024-03-25 20:50:04       42 阅读
  2. Linux学习笔记:重定向与缓冲区

    2024-03-25 20:50:04       42 阅读
  3. 2024.03.10 校招 实习 内推 面经

    2024-03-25 20:50:04       43 阅读
  4. 【Node.js】流

    2024-03-25 20:50:04       42 阅读
  5. 【如何解决Go包中循环依赖】

    2024-03-25 20:50:04       40 阅读