炼数成金 大数据
订阅

大数据

深入 Cloud Foundry(一)构架
深入 Cloud Foundry(一)构架
引子 今年4月份,VMware突然发布了业内第一个开源的PaaS——CloudFoundry。几个关键字:开源、PaaS、VMware,如果你对云计算感兴趣,就冲着它的ApacheV2协议,如果不去GitHub拿它的代码好好研读一下,真有点对不起 ...
分类:   
超级计算机通过以太网连接400PB存储系统
超级计算机通过以太网连接400PB存储系统
美国国家超级计算应用中心(National Center for Supercomputing Applications)正计划推出一个包含380PB磁带存储容量和由17000个SATA驱动器组成的25PB在线磁盘存储的存储基础设施。 这个大规模存储基础设施将用于支持 ...
分类:   
新版CloudFoundry揭秘
新版CloudFoundry揭秘
CloudFoundry距离发布已经一年多了。在这一年里CloudFoundry不论是社区还是代码日臻成熟,拥有了众多合作伙伴。现在他迈开了更大的脚步,新的CloudFoundry已经逐渐浮出水面。
分类:   
Apache Hadoop 2.0 Alpha 发布
Apache Hadoop 2.0 Alpha 发布
Apache Hadoop 2.0 今天发布了首个 alpha 版本,该版本还不能用于生产环节,还有一些很重要的开发没完成。该版本包含很多新的很重要的功能:除了新功能以外还有一些重要的改进,例如 HDFS Snapshots 和 auto-failove ...
分类:   
OpenStack架构是构建IaaS云的最佳选择?
OpenStack架构是构建IaaS云的最佳选择?
OpenStack已引起了业内众多眼球的关注,这是一个承诺为建设公共云计算和私有云计算建立通用基础的开源项目。如果实现了OpenStack的大规模实施,其架构就可以进一步促进混合云计算的实施、有助于云计算联盟的建立以及 ...
分类:   
Redis运行流程源码解析
Redis运行流程源码解析
Redis通过定义一个 struct redisServer 类型的全局变量server 来保存服务器的相关信息(比如:配置信息,统计信息,服务器状态等等)。启动时通过读取配置文件里边的信息对server进行初始化(如果没有指定配置文件, ...
分类:   
盘点大数据分析的十二大杀手锏
盘点大数据分析的十二大杀手锏
全球各行各业的组织机构已经意识到,最准确的商务决策来自于事实,而不是凭空臆想。这也就意味着,他们需要在内部交易系统的历史信息之外,采用基于数据分析的决策模型和技术支持。互联网点击数据、传感数据、日志文 ...
分类:   
Hdoop/Hbase文件配置方法详解
Hdoop/Hbase文件配置方法详解
Hdoop/Hbase大家应该有所了解,这里就向大家介绍一下Hdoop/Hase文件配置方面的知识,希望通过本文的介绍大家能够掌握Hdoop/Hase文件配置方法,欢迎大家一起来学习。
分类:   
2012年云计算五大发展趋势走向
2012年云计算五大发展趋势走向
从应用程序交付到安全和监测,似乎一切都转移到了云环境,IT面临着一个前所未有的混乱且难以驾驭的世界。好消息是市面上有很多工具可供选择,坏消息是你不能像过去一样选择单个供应商就能帮你解决所有问题。
分类:   
OpenStack闹剧和云的未来
OpenStack闹剧和云的未来
有段时间,我对OpenStack很着迷,这是一个令人振奋的开源项目,目前已逐渐演变成了适用于数据中心的“云操作系统”。然而就在上周,它却遭遇了来自Citrix的沉重打击,作为OpenStack阵营的一名特许成员,Citrix突然宣 ...
分类:   
CIO如何保障数据仓库的数据安全和可用
CIO如何保障数据仓库的数据安全和可用
大多数人都理解企业数据破坏造成的负面效果。在解决数据仓库的安全性方面,有两个特别重要的问题。第一是,数据仓库必须能够控制数据访问权限(数据权利)。第二是,提供业务持续性和灾难恢复(数据可用性)。   在数 ...
分类:   
Facebook数据仓库揭秘:RCFile高效存储结构
Facebook数据仓库揭秘:RCFile高效存储结构
本文介绍了Facebook公司数据分析系统中的RCFile存储结构,该结构集行存储和列存储的优点于一身,在MapReduce环境下的大规模数据分析中扮演重要角色。 Facebook曾在2010 ICDE(IEEE International Conference on Data ...
分类:   
IDC称“大数据”正引领中国互联网行业新浪潮
IDC称“大数据”正引领中国互联网行业新浪潮
  2012年5月24日,市场研究机构IDC发布研究报告指出,“大数据”概念正在引领中国互联网行业新一轮的技术浪潮,截至2011年底,中国互联网行业持有的数据总量已达到1.9EB(1EB艾字节相当于10亿GB)。
分类:   
RavenDB正式开放云数据库服务RavenHQ
RavenDB正式开放云数据库服务RavenHQ
从RavenDB官网上,你可以在很明显的位置看到他们的slogan,RavenDB被视为第二代的开源文档型数据库(2nd Generation Document DB)。虽然有些标题党的嫌疑,但是RavenDB确实是为数不多的针对.Net/Windows平台的NoSQL数 ...
分类:   
node.js学习日志—— Mongodb
node.js学习日志—— Mongodb
介绍:在了解Mongodb之前一直以为Mongodb是芒果数据库,其实芒果的英文是:Mango,两者好像没有关系。 Mongodb是nosql家族中的重要一员,它是文档型数据库,说白了就是mysql的行 = Mongodb的文档。不同于mysql行的字 ...
分类:   
关系型数据库MySQL和文档型数据库MongoDB设计实例对比
关系型数据库MySQL和文档型数据库MongoDB设计实例对比
MySQL需要多个表,多次查询才能搞定的问题,MongoDB只需要一个表,一次查询就能搞定,对比完成,相对MySQL而言,MongoDB显得更胜一筹,至少本例如此。MySQL是关系型数据库中的明星,MongoDB是文档型数据库中的翘楚。 ...
分类:   
PHP搭建百万级网站架构技术揭秘:Poppen.de德国社交
PHP搭建百万级网站架构技术揭秘:Poppen.de德国社交
在了解过世界最大的PHP 站点,Facebook的后台技术后,今天我们来了解一个百万级PHP站点的网站架构:Poppen.de。Poppen.de是德国的一个社交网站,相对Facebook、Flickr来说是一个很小的网站,但它有一个很好的架构,融 ...
分类:   
NO “NO SQL”
NO “NO SQL”
但凡一个关注当前技术趋势的人,都应该知道NO-SQL。NO-SQL现在很火,每天都有无数的blog在阐述它,在热议它,在实践它。包括我自己,在这篇文章里,我尝试站在NO-SQL的对立面来看待这个问题,或者说,我希望能够批判 ...
分类:   
管理Hadoop集群的5大工具
管理Hadoop集群的5大工具
当你利用Hadoop进行大数据分析和处理时,首先你需要确保配置、部署和管理集群。这个即不容易也没有什么乐趣,但却受到了开发者们的钟爱。本文提供了5款工具帮助你实现。
分类:   
从PHP客户端看MongoDB通信协议
从PHP客户端看MongoDB通信协议
MongoDB 的 PHP 客户端有一个 MongoCursor 类,它是用于获取一次查询结果集的句柄(或者叫游标),这个简单的取数据操作,内部实现其实不是那么简单。本文就通过对 MongoCursor 类一些操作进行分析,向大家揭开 Mong ...
分类:   
变革运作方式:大数据来袭 SaaS靠边站
变革运作方式:大数据来袭 SaaS靠边站
随着大量的信息涌入互联网,互联网公司正在想方设法去熟悉并利用大数据来推动他们的业务。正如SaaS和云技术一样完全变革了企业的运作方式一样,大数据应用(BDA)也同样可以。
分类:   
redis五大数据结果的测试
redis五大数据结果的测试
事实上只是对四大类型进行了测试,因为确实不知道引入hash来存储对象的好处,用string确实也可以存储对象,测试五个数据结构:基础数据,测试string类型(存储简单字符,也可以存储被序列化了的对象)
分类:   
关于Hadoop中reducer端combiner的一些思考
关于Hadoop中reducer端combiner的一些思考
简单的说,combiner是一个在mapper之后运行的function,非常类似reducer的功能,所以在《Hadoop In Action》又叫作“local reduce”。它的好处是减少网络的数据传输,从而提高性能。但因为是一个优化功能,所以Hadoo ...
分类:   
基于Cloud Foundry的PaaS开发与部署
基于Cloud Foundry的PaaS开发与部署
由于CF是PAAS平台,这里面先介绍个人对paas的粗略理解。Paas, Platform as a Service, 其主要目的是提供一个应用运行的平台,有了这个平台,开发者无需搭建应用运行环境和服务(Mysql/mongodb/Rabbitmq等),包括硬件和 ...
分类:   
规划措施:实施绿色数据中心
规划措施:实施绿色数据中心
现有数据中心的电力消耗可以通过各种低成本方法加以降低,但主要还是通过迁移到更节能的计算平台这一手段。对于新的数据中心,在 IT 架构和 DCPI 架构方面还可有其他选择,从而获得更大的节约效果。
分类:   
以公司实际应用讲解OpenStack到底是什么
以公司实际应用讲解OpenStack到底是什么
就目前而言,OpenStack在国外慢慢的流行开来,不少企业和个人也在对它进行二次开发。从我个人理解,OpenStack作为一种免费的开源软件,可以用在中小企业内部,可以给公司内部的开发测试部门使用,也可以跑一些应用服 ...
分类:   
MongoDB、Java及ORM
MongoDB、Java及ORM
目前有很多互相竞争的NoSQL产品,它们使用的方式不尽相同,但都能很好地解决大数据问题。MongoDB就是其中一款非常不错的产品。MongoDB是面向文档、无Schema的存储解决方案,它用JSON风格的文档展现、查询、修改数据。 ...
分类:   
Vmware vFabric Suite开始支持自动化部署与PostgreSQL
Vmware vFabric Suite开始支持自动化部署与PostgreSQL
近日,Vmware宣布了VMware vFabric Suite 5.1,增加了自动化部署、企业级开源支持,同时还增加了对PostgreSQL的支持以及SQLFire内存数据库的一个扩展。 vFabric旨在通过标准的开源组件来简化常见的企业级部署,它包 ...
分类:   
案例分析:基于消息的分布式架构
案例分析:基于消息的分布式架构
美国计算机科学家,LaTex的作者Leslie Lamport说:“分布式系统就是这样一个系统,系统中一个你甚至都不知道的计算机出了故障,却可能导致你自己的计算机不可用。”一语道破了开发分布式系统的玄机,那就是它的复杂与 ...
分类:   
国产NoSQL YunTable简介
国产NoSQL YunTable简介
YunTable是国内人云科技团队开发的一款NoSQL产品。主要特点是快速大批量的导入数据,并且能够在海量数据基础上进行快速的查询统计与分析工作。下面是其简单介绍。
分类:   

热门频道

  • 大数据
  • 商业智能
  • 量化投资
  • 科学探索
  • 创业

即将开课

 

GMT+8, 2019-1-21 04:50 , Processed in 0.148091 second(s), 19 queries .