炼数成金 大数据
订阅

大数据

如何学习一门新的编程语言?
如何学习一门新的编程语言?
答案是:在学习区刻意练习,每天500行。什么是学习区,就是那种,你刚刚够得着,但是还是需要付出一点努力的。
分类:   
IBM研究存储设备取得大突破:有望更小巧轻便
IBM研究存储设备取得大突破:有望更小巧轻便
IBM公司纳米技术研究人员表示,已经发型了一种新方法,能够将1个比特(Bit,信息量单位)的内容存储在12个磁原子上。这项新发现有望使大容量存储器变得更小巧轻便。
分类:   
Hadoop Streaming框架使用
Hadoop Streaming框架使用
Streaming简介 Streaming框架允许任何程序语言实现的程序在Hadoop MapReduce中使用,方便已有程序向Hadoop平台移植。因此可以说对于hadoop的扩展性意义重大,今天简单说一下。 Streaming的原理是用Java实现一个包装 ...
分类:   
Hadoop学习笔记之二:部署与应用实例
Hadoop学习笔记之二:部署与应用实例
本文主要是以安装和使用hadoop-0.12.0为例,指出在部署Hadoop的时候容易遇到的问题以及如何解决。   硬件环境   共有3台机器,均使用的FC5系统,Java使用的是jdk1.6.0。IP配置如下:   dbrg-1:202.197.18.72 ...
分类:   
云计算的利刃:快速部署Hadoop集群
云计算的利刃:快速部署Hadoop集群
近来云计算越来越热门了,云计算已经被看作IT业的新趋势。云计算可以粗略地定义为使用自己环境之外的某一服务提供的可伸缩计算资源,并按使用量付费。可以通过 Internet 访问“云”中的任何资源,而不需要担心计算能 ...
分类:   
Hadoop超级安装手册
Hadoop超级安装手册
安装Hadoop并不困难,官方文档也给的还算详细。最近同事练习安装还是会遇到一些问题,最后我们整理出来傻瓜版安装手册,帮助你0基础成功。 北京数据平台荣誉出品 特别感谢靳伟,暮霜同学帮忙整理出来这么傻瓜版的had ...
分类:   
一图解说Hadoop的发展历程
一图解说Hadoop的发展历程
1. 这一切是如何开始的—Web上庞大的数据!   2. 使用Nutch抓取Web数据   3. 要保存Web上庞大的数据——HDFS应运而生   4. 如何使用这些庞大的数据?   5. 采用Java或任何的流/管道语言构建MapReduce框架用于编 ...
分类:   
Hadoop入门
Hadoop入门
一、概论 作为Hadoop程序员,他要做的事情就是: 1、定义Mapper,处理输入的Key-Value对,输出中间结果。2、定义Reducer,可选,对中间结果进行规约,输出最终结果。3、定义InputFormat 和OutputFormat,可选,Input ...
分类:   
新调查结果表明:NoSQL采用呈上升趋势
新调查结果表明:NoSQL采用呈上升趋势
Couchbase新调查结果显示,企业采用NoSQL解决方案正在上升。这是否验证了一些人说的,今年是NoSQL年,它将成为企业的主要前进力量?
分类:   
Sybase获多项年度大奖 创新大数据分析
Sybase获多项年度大奖 创新大数据分析
随着大数据时代的来临,企业和机构的数据分析和优化决策的制定面临着巨大的挑战。着眼于企业不断增长的多样化的分析需求, Sybase 不断致力于大数据分析领域的产品创新与客户的方案解决,Sybase IQ、Sybase ESP 等明 ...
分类:   
阿里云ODPS:大规模离线数据分析处理
阿里云ODPS:大规模离线数据分析处理
为什么我们使用搜索引擎时,不同的用户搜索同样的关键词看到的广告却不同?为什么我们到电子商务网站购物时,每次浏览同样的商品时都可以得到不同的商品推荐?作为网站服务的开发者,你有没有想过,你所拥有的数据蕴含 ...
分类:   
hadoop入门语录
hadoop入门语录
使用场景:个人觉得最适合的就是海量数据的分析,其实Google最早提出MapReduce也就是为了海量数据分析。同时HDFS最早是为了搜索引擎实现而开发的,后来才被用于分布式计算框架中。 How to Use Hadoop Tips 7台机器的 ...
分类:   
讨论:Hadoop社区与中国云计算开源展望
讨论:Hadoop社区与中国云计算开源展望
日前,由中科院计算所主办的“Hadoop 中国2010云计算大会 - Hadoop in China 2010”于9月4日在京落下帷幕【图文专题】,共有600多名来自企业、高校、科研院所的Hadoop技术爱好者参加了此次盛会。   在所有演讲结束 ...
分类:   
电话行销中的数据清洗
电话行销中的数据清洗
懂行都知道,电话销售这行里,名单为王。准确地说,就是针对性强,而准确性高(如果你外购数据的话,准确率要达到85%以上为佳)。名单不好,技巧再强也没用。而名单很好,技巧再不专业也能出不错的业绩。
分类:   
如何规划数据仓库中的数据清洗
如何规划数据仓库中的数据清洗
可以将数据仓库的数据清洗比做政客们募集资金的过程。几乎不存在任何一方独立存在的可能性。数据清洗往往是数据仓库项目中时间最密集的,最有争议的进程。
分类:   
解密微软、苹果和Google三巨头的收入构成
解密微软、苹果和Google三巨头的收入构成
微软、苹果和Google的成就足以被称为当今互联网三巨头,三家之争分别从传统的互联网开始向移动互联网转变,同时还有掀起“电视革命”的势头,未来形成三足鼎立之势并非没有可能。
分类:   
研究人员让CPU和GPU密切协作共同提升性能
研究人员让CPU和GPU密切协作共同提升性能
多核处理器中有一类混合架构处理器,即同一块芯片上集成了中央处理单元和图形处理单元,如英特尔的Sandy Bridge和AMD的Llano系列处理器。
分类:   
Hadoop On Demand管理指南
Hadoop On Demand管理指南
Hadoop On Demand (HOD)是一个能在一个共享集群上供应和管理相互独立的Hadoop Map/Reduce和Hadoop分布式文件系统(HDFS)实例的系统。它能让管理员和用户轻松地快速搭建和使用hadoop。HOD对Hadoop的开发人员和测试人 ...
分类:   
IBM将在Hadoop上建立全新存储架构设计
IBM将在Hadoop上建立全新存储架构设计
IBM科学家宣称,该设计在将万亿字节的数据变成可用的信息方面,速度比当前技术可以提高两倍。因此,该设计非常适用于云计算和数据密集型的工作负载应用场合,比如数字媒体、数据挖掘、金融分析等。   这种新的架构 ...
分类:   
全球数据中心市场格局生变
全球数据中心市场格局生变
目前,全球数据中心市场发展速度开始减缓,但金砖国家的这一市场仍然保持快速增长,数据中心的建设工作刚进入活跃期。与此同时,美国、加拿大等发达国家被迫减少数据中心建设项目,并考虑如何提高数据中心效率。进入 ...
分类:   
大数据技术市场调查报告:“BigData浪潮”迫使企业做出抉择
大数据技术市场调查报告:“BigData浪潮”迫使企业做出抉择
2020年全球电子设备存储的数据将暴增30倍,达到35ZB(相当于10亿块1TB的硬盘的容量)。大数据浪潮的到来也为企业带来了新一轮的挑战。对于有准备的企业来说这无疑是一座信息金矿,能够合理的将大数据转换为有价值信息 ...
分类:   
超越MySQL:三个流行MySQL分支的对比
超越MySQL:三个流行MySQL分支的对比
尽管MySQL是最受欢迎的程序之一,但是许多开发人员认为有必要将其拆分成其他项目,并且每个分支项目都有自己的专长。该需求以及Oracle对核心产品增长缓慢的担忧,导致出现了许多开发人员感兴趣的子项目和分支。本文将 ...
分类:   
甲骨文正式发布大数据机 进军大数据
甲骨文正式发布大数据机 进军大数据
甲骨文今天正式发布了最新的Oracle大数据机(Big Data Appliance),其中合作伙伴公司Cloudera将提供大数据机中的Hadoop功能,二者将携手进军大数据领域。但现在的问题是,集成设备对于大数据来说是否真正适合?
分类:   
谁是王者?七款主流图形数据库功能对比
谁是王者?七款主流图形数据库功能对比
谁是王者?七款主流图形数据库功能对比
分类:   
程学旗:Hadoop平台存在三个方面的挑战
程学旗:Hadoop平台存在三个方面的挑战
由中科院计算所主办“第四届Hadoop in china 2010中国云计算大会”9月4日在京召开。本次大会将有千余名Hadoop云计算技术精英与会交流,十余家知名互联网企业倾情出场,以及多位行业领袖的深度演讲。IT168将为您带来实 ...
分类:   
大数据下的数据分析-Hadoop架构解析
大数据下的数据分析-Hadoop架构解析
随着互联网、移动互联网和物联网的发展,谁也无法否认,我们已经切实地迎来了一个海量数据的时代,数据调查公司IDC预计2011年的数据总量将达到1.8万亿GB,对这些海量数据的分析已经成为一个非常重要且紧迫的需求。   ...
分类:   
Hadoop中的集群配置和使用技巧
Hadoop中的集群配置和使用技巧
其实参看Hadoop官方文档已经能够很容易配置分布式框架运行环境了,不过这里既然写了就再多写一点,同时有一些细节需要注意的也说明一下,其实也就是这些细节会让人摸索半天。Hadoop可以单机跑,也可以配置集群跑,单 ...
分类:   
Hadoop集群搭建
Hadoop集群搭建
本文描述了如何安装、配置和管理有实际意义的Hadoop集群,其规模可从几个节点的小集群到几千个节点的超大集群。 如果你希望在单机上安装Hadoop玩玩,从这里能找到相关细节。 先决条件确保在你集群中的每个节点上都安 ...
分类:   
SQL向NoSQL转变 关系型数据库的局限性
SQL向NoSQL转变 关系型数据库的局限性
NoSQL系统一般都会宣传一个特性,那就是性能好,然后为什么呢?关系型数据库发展了这么多年,各种优化工作已经做得很深了,NoSQL系统一般都是吸收关系型数据库的技术,然后,到底是什么因素束缚了关系型数据库的性能呢 ...
分类:   
XFS:大数据环境下Linux文件系统的未来
XFS:大数据环境下Linux文件系统的未来
Linux有好多种件系统,但往往最受关注的是其中两种:ext4和btrfs。XFS开发者Dave Chinner近日声称,他认为更多的用户应当考虑XFS。他谈到了为了解决XFS中最严重的可扩展性问题所做的工作,还谈到了他认为将来的发展走 ...
分类:   

热门频道

  • 大数据
  • 商业智能
  • 量化投资
  • 科学探索
  • 创业

即将开课

 

GMT+8, 2018-11-20 08:43 , Processed in 0.231753 second(s), 19 queries .