返回
齐家1739.hk
装修找齐家上市大平台
打开APP

面对大量的数据要怎么存储,有哪些流行大数据框架,以及哪些解决思路?

2 回答199  浏览 07-02 12:49

共2条回答

这样的社会为什么老提什么大数据?大数据能让人不失业不下岗吗?大数据能给饭吃吗?人多了事就多自然的数目就多了……请别再拿大数据说事了,被大数据害了多少中国人呀?盲目的学国外的大数据请问你懂什么叫大数据吗……展开
04-24
面对大量数据的存储,可以考虑以下几种流行的大数据框架和解决思路:

1. **Hadoop**:这是一个开源的大数据框架,支持分布式存储和处理海量数据。它提供了HDFS(Hadoop Distributed File System)用于存储数据,和MapReduce用于数据处理。

2. **Spark**:Apache Spark是一个更快的大数据处理框架,适合进行实时数据处理。它也支持多种数据存储方式,连接到HDFS、Cassandra等不同存储源。

3. **Cassandra**:对于OLTP类型的应用需求,Cassandra是一种分布式数据库管理系统,适合存储大量结构化数据并支持高可用性。

4. **HBase**:这是基于Hadoop的分布式数据库,特别适合随机读取和写入大量稀疏数据。

5. **MongoDB**:作为一种NoSQL数据库,MongoDB非常适合文档型数据存储,具有良好的水平扩展性。

6. **Elasticsearch**:这是一个强大的搜索引擎,可以通过分布式方式存储和检索大量数据,尤其适合日志存储和搜索需求。

在解决思路方面,可以考虑以下几点:

- 明确数据的类型和结构,选择适合的数据存储方式和框架。
- 实现数据的分区和分片,以提高存储和查询的效率。
- 考虑数据冗余和备份方案,确保数据的安全性。
- 如果有实时性需求,考虑流处理框架如Apache Kafka和Flink。展开
01-01

齐家已经为192504位业主找到有用的答案

10秒估算报价结果

装修总价

定制的淋浴房安全吗?定制的淋浴房安全安 全吗?

0/1000

提交