,它会持续发挥它的作用,吸引更多人的入局。”
“通俗的话来讲,要钓鱼就得先打窝,不打窝鱼怎么肯来,要让鱼相信这些饵料是钓鱼人专门来喂养它们的。”
戴维斯敏锐的意识到,这个东西比什么改编电影要有价值的多,他追问道:“你详细说说。”
“要说这个就不得不提到大数据概念。”秦少言站起身来拿起笔在白板上写下了“big data”几个英文字母。
今天我们常说的大数据技术,其实起源于 google在 2004年前后发表的三篇论文。
分别是分布式文件系统 gfs、大数据分布式计算框架mapredubsp;nosql数据库系统 bigtable。
2004年那会儿,整个互联网还处于懵懂时代,google发布的论文实在是让业界为之一振,大家恍然大悟,原来还可以这么玩。
因为那个时间段,大多数公司的关注点其实还是聚焦在单机上,在思考如何提升单机的性能,寻找更贵更好的服务器。
而 google的思路是部署一个大规模的服务器集群,通过分布式的方式将海量数据存储在这个集群上,然后利用集群上的所有机器进行数据计算。这样,google其实不需要买很多很贵的服务器,它只要把这些普通的机器组织到一起,就非常厉害了。
2006年,doug cutting将这些大数据相关的功能从 nutch中分离了出来,然后启动了一个独立的项目专门开发维护大数据技术。
这就是后来赫赫有名的 hadoop,主要包括 hadoop分布式文件系统 hdfs和大数据计算引擎 mapreduce。
hadoop发布之后,yahoo很快就用了起来。大概又过了一年到了 2007年,百度和阿里巴巴也开始使用 hadoop进行大数据存储与计算。
2008年8月由维克托·迈尔·舍恩伯
本网站为网友提供小说上传储存空间平台,为网友提供在线阅读交流、txt下载,平台上的所有文学作品均来源于网友的上传
用户上传的文学作品均由网站程序自动分割展现,无人工干预,本站自身不编辑或修改网友上传的内容(请上传有合法版权的作品)
如发现本站有侵犯权利人版权内容的,请向本站投诉,一经核实,本站将立即删除相关作品并对上传人ID账号作封号处理