炼数成金 大数据
订阅

大数据

IDC:Hadoop生态圈2016年市场份额将达到8.13亿美元
IDC:Hadoop生态圈2016年市场份额将达到8.13亿美元
据IDC报告显示,Hadoop MapReduce的2011年市场份额为7700万美元,而到2016年市场份额将会有60.2%的增长达到8.13亿美元,现今企业数据仓库和关系型数据库擅长处理结构化数据,并且可以存储大量的数据。但成本上有些昂 ...
分类:   
深度剖析CloudFoundry的架构设计
深度剖析CloudFoundry的架构设计
本文会分为两个部份:第一部份主要介绍CloudFoundry的架构设计,从它所包含的模块介绍起,到各部份的消息流向,各模块如何协调合作;第二部份会在第一部份的基础上,以如何在你的数据中心里面用CloudFoundry部署一个 ...
分类:   
Bump的Redis应用经验
Bump的Redis应用经验
这里说的Bump就是那个手机碰一碰就能交换信息的app,本文来自Bump的开发者博客,他们描述了自己使用Redis的几种方法,以及在使用过程中的一些经验,包括与MongoDB同机部署的一些问题,NoSQLFan转译如下,详细描述可移 ...
分类:   
安全性对于NoSQL是否是亡羊补牢?
安全性对于NoSQL是否是亡羊补牢?
NoSQL厂商正在全力投入到NoSQL数据库产品的研发中,但是NoSQL数据库的安全性对于已经达到你的要求了呢?   在安全领域,NoSQL数据库的安全性一直存在争议。尽管没有人否认NoSQL在过去几年里得到了迅猛发展,但是有人 ...
分类:   
谷歌发力云服务市场 挑战亚马逊霸主地位
谷歌发力云服务市场 挑战亚马逊霸主地位
北京时间5月10日晚间消息,谷歌正在加大云服务的投资力度,以获得更多市场份额,从而向亚马逊的主导地位发起挑战。分析人士称,谷歌将成为亚马逊的最大挑战者。最终,谷歌和亚马逊将成为该市场的两大赢家。毫无疑问, ...
分类:   
戴尔发布桌面即服务(DaaS)云平台
戴尔发布桌面即服务(DaaS)云平台
在本周于旧金山召开的思杰系统Synergy用户群组会议上,戴尔将讨论其在与VMware和思杰系统合作提供虚拟桌面的能力。戴尔与VMware和思杰系统合作并不奇怪,奇怪的是戴尔还将与一家创建时间不长规模不大的公司Desktone展 ...
分类:   
云计算不是晕计算 将推动产业大变革
云计算不是晕计算 将推动产业大变革
微软副总裁张亚勤在2012博鳌亚洲论坛“云计算、移动、社交媒体:改变商业的创新力量 ”主题会议上回答嘉宾提问时表示,网络信息存储在大公司更安全,因为大公司为信誉付出的责任更多。
分类:   
海量数据处理技术必火
海量数据处理技术必火
大数据处理技术正在改变目前计算机的运行模式。我们已经从中获得了大量收益,因为正是大数据处理技术给我们带来了搜索引擎Google。然而故事才刚刚开始,基于以下几个原因,我们说大数据处理技术正在改变着这个世界:
分类:   
利用Hadoop 根据IP地址进行地域统计
利用Hadoop 根据IP地址进行地域统计
新建一个hadoop项目,将ip解析的3个类放到一个包下面 .QQwry的测试使用:项目中需要拿到ip的国家和省,然后追加到原始日志作为2个新字段,但是测试发现返回的数据不能直接拿来处理,所有就需要进一步的格式化处理。
分类:   
分析:数据化生存,数据驱动未来的今天
分析:数据化生存,数据驱动未来的今天
“大数据”似乎是个企业才会感兴趣的词汇,类似商业智能和情报分析的翻新说法,自从2008年世界进入”黑天鹅“时代,数据分析和预测未来的能力正成为企业生存和发展的核心竞争力。改革三十年我们经历的企业价值观也许 ...
分类:   
挑战关系型遇阻:NoSQL扩展的隐性成本
挑战关系型遇阻:NoSQL扩展的隐性成本
当今的应用庞大,成千上万的用户上传数据,在短期内数据存储量就会大幅增加。因此对于数据架构师而言,可扩展性成为重点关注的问题也就不足为奇了。对于Google和Facebook等全球互联网公司,NoSQL这种高度可扩展的非关 ...
分类:   
IDC:Hadoop、MapReduce相关收入预计将暴涨
IDC:Hadoop、MapReduce相关收入预计将暴涨
根据IDC周一发布的最新报告,用于大数据分析的Hadoop和MapReduce编程框架相关的软件市场将会从2011年的7700万美元暴涨至2016年的8.128亿美元,年复合增长率为60.2%。
分类:   
完善八大事项 构建完美云平台
完善八大事项 构建完美云平台
科技博客Gigaom日前撰文称,现在很多人都承认云是一个强大的管理工具,但问题也在这,我们认为云仅仅是一种工具。事实上,云管理平台不只是一个漂亮的包装,不是一个自动生成或缩放功能的几个脚本,而是一个平台,使 ...
分类:   
Replica Sets系列文章之:同步
Replica Sets系列文章之:同步
MongoDB核心开发工程师 Kristina Chodorow(@kchodorow) 最近在她的博客上表示,她会发表一系列关于MongoDB Replica Sets 相关的文章,向大家详细的进行一次 Replica Sets 的知识培训。
分类:   
美国橡树岭国家实验室超级计算机今秋升级到大开普勒
美国橡树岭国家实验室超级计算机今秋升级到大开普勒
美国橡树岭国家实验室今天表示,旗下的OLCF超级计算设施已完成第一阶段的捷豹系统升级,带来超过20 petaflops理论峰值计算性能,升级之后的混合计算架构Cray XK6系统代号泰坦(Titan)。
分类:   
审查“大数据”时代的PaaS状态
审查“大数据”时代的PaaS状态
诸如Amazon公司、Google公司、Heroku、IBM公司以及微软公司等主要的PaaS厂商将今年定为云计算的“大数据”之年一事已得到了大肆宣传。但是,实际上在公共云计算中又是哪一家供应商提供了最为完整的Apache Hadoop实施 ...
分类:   
谷歌将推出升级版BigQuery云分析服务
谷歌将推出升级版BigQuery云分析服务
你有几亿行的数据需要存储吗?如果是这样,谷歌希望你们发送给他们对于新的BigQuery云分析服务的方向,其现在已经完成测试,准备上市,向用户销售产品。谷歌在2011年11月推出这个服务。正如公布预发布消息的博客中所写 ...
分类:   
扎克伯格定律----再谈大数据时代
扎克伯格定律----再谈大数据时代
不到一年前,Facebook创始人扎克伯格在Web2.0峰会上宣布,根据Facebook统计数据,社交分享信息量以倍数增长,今天分享信息总量比两年前增加了两倍,从现在开始后的一年,用户所产生的信息分享总量将会翻番。扎克伯格 ...
分类:   
大数据时代 百度对外分享海量数据处理技术
大数据时代 百度对外分享海量数据处理技术
在互联网的世界,每个人的行为不再是“人似秋鸿有来信,事如春梦了无痕”,任何行为都有前兆,任何行为也都将对后续产生影响。对于互联网大数据的分析,某种程度上将让人类拥有预知并影响未来的能力。而这也正是大数 ...
分类:   
大数据存储服务选择最佳做法
大数据存储服务选择最佳做法
磁盘存储就像是衣橱,永远不够用,在大数据时代,这一点尤为突出。“大数据”意味着需要比传统存储平台处理更多的数据。那么这对于CIO意味着什么呢?意味着他们将需要做出更多的努力,而可供参考的信息却很少。
分类:   
大数据应用时代来袭 SaaS走向没落?
大数据应用时代来袭 SaaS走向没落?
随着大量的信息涌入互联网——90%的互联网是过去两年建立起来的——互联网公司正在想方设法去熟悉并利用大数据来推动他们的业务。正如SaaS和云技术一样完全变革了企业的运作方式一样,大数据应用(BDA)也同样可以。 ...
分类:   
咨询顾问:要给大数据泼泼冷水
咨询顾问:要给大数据泼泼冷水
在近期举行的Enterprise Data World大会上,参会者纷纷对“大数据”这一话题发表了自己的看法。来自InfoAdvisors的首席咨询师Karen Lopez作为其中一员,认为大数据并不像看上去那么靠谱。
分类:   
.Net环境下的NoSQL数据库DeNSo DB
.Net环境下的NoSQL数据库DeNSo DB
大数据的背景之下,NoSQL数据库的应用越来越广泛,用百家争鸣百花齐放来形容一点都不为过。再资深的专家也不敢说自己了解所有的NoSQL数据库,况且还不断有新的产品推出来。DeNSo DB就是在这样的背景之下诞生的,它是 ...
分类:   
Hadoop 0.23.x从原理详解到安装体验
Hadoop 0.23.x从原理详解到安装体验
从0.23.0开始,Hadoop开始支持分布式NameNode,通过NameNode federation的形式实现。这样实现了NameNode的横向扩展,使得Hadoop集群的规模可以达到上万台。同时在NameNode HA机制方面,trunk中的代码也开始merge进ha ...
分类:   
Nutch 0.8笔记--Google式的搜索引擎实现
Nutch 0.8笔记--Google式的搜索引擎实现
Nutch是一个基于Lucene,类似Google的完整网络搜索引擎解决方案,基于Hadoop的分布式处理模型保证了系统的性能,类似Eclipse的插件机制保证了系统的可客户化,而且很容易集成到自己的应用之中。 Nutch 0.8 完全使用 ...
分类:   
云计算国家规划将出台 产值将达2000亿
云计算国家规划将出台 产值将达2000亿
记者日前从科技部获悉,颇受关注的“中国云”产业发展国家级规划已获国务院批准,近期将发布。规划包括“十二五”期间“中国云”产业的发展思路、重点任务、技术路线、支持体系等内容。权威机构预测,云计算有望成为 ...
分类:   
Hadoop分布式文件系统:架构和设计要点
Hadoop分布式文件系统:架构和设计要点
一、前提和设计目标1、硬件错误是常态,而非异常情况,HDFS可能是有成百上千的server组成,任何一个组件都有可能一直失效,因此错误检测和快速、自动的恢复是HDFS的核心架构目标。3、HDFS以支持大数据集合为目标,一 ...
分类:   
你准备好迎接“大数据”时代了吗?
你准备好迎接“大数据”时代了吗?
麦肯锡全球研究院水平和视角是相当不错的。这篇文章以设问的方式提出五个问题,值得关注:1.在一个信息触手可及的高度透明化的世界里发生了什么? 2.如果你可以测试所有决策的话,你将怎样改变竞争方式? 3.如果你将海 ...
分类:   
大数据量,海量数据处理方法总结
大数据量,海量数据处理方法总结
下面的方法是我对海量数据的处理方法进行了一个一般性的总结,当然这些方法可能并不能完全覆盖所有的问题,但是这样的一些方法也基本可以处理绝大多数遇到的问题。下面的一些问题基本直接来源于公司的面试笔试题目, ...
分类:   
大数据为ComScore带来新客户
大数据为ComScore带来新客户
本文介绍了大数据分析的一个案例,为了增强竞争力,ComScore开始向客户提供定制数据库和分析软件来加快海量数据的分析,从而提升分析服务的质量和速度。
分类:   

热门频道

  • 大数据
  • 商业智能
  • 量化投资
  • 科学探索
  • 创业

即将开课

 

GMT+8, 2018-12-17 17:52 , Processed in 0.106587 second(s), 19 queries .