大数据方向三篇经典论文读后感Bigtable
Google Bigtable:Bigtable 是一个分布式的结构化数据存储系统,它被设计用来处理海量数据:通常是分布在数千台普通服务器上的 PB 级的数据。Bigtable和数据库很类似,使用了很多数据库的实现策略,Bigtable不支持完整的关系数据模型;与之相反,Bigtable为客户提供了简单的数据模型,Bigtable将存储数据都视为字符串,但是它本身不去解析这些字符串,客户程序会在把
·
Google Bigtable:
Bigtable 是一个分布式的结构化数据存储系统,它被设计用来处理海量数据:通常是分布在数千台普通服
务器上的 PB 级的数据。Bigtable和数据库很类似,使用了很多数据库的实现策略,Bigtable不支持完整的关系数据模型;与之相反,Bigtable为客户提供了简单的数据模型,Bigtable将存储数据都视为字符串,但是它本身不去解析这些字符串,客户程序会在把各种结构化或者半结构化的数据串行到这些字符串中。可以通过BigTable的模式参数来控制数据是存放在内存中、还是硬盘上。
数据模型:Bigtable 是一个稀疏的、分布式的、持久化存储的多维度排序 Map。Map 的索引是行关键字、列关键字以及时间戳;Map 中的每个 value 都是一个未经解析的 byte 数组。在应用中,我们把存储海量的网页和相关信息的特殊的表为Webtable,使用URL作为行关键字,使用网页的某些属性作为列名。
更多推荐


所有评论(0)