炼数成金 大数据
订阅

大数据

如何规划数据仓库中的数据清洗
如何规划数据仓库中的数据清洗
可以将数据仓库的数据清洗比做政客们募集资金的过程。几乎不存在任何一方独立存在的可能性。数据清洗往往是数据仓库项目中时间最密集的,最有争议的进程。
分类:   
解密微软、苹果和Google三巨头的收入构成
解密微软、苹果和Google三巨头的收入构成
微软、苹果和Google的成就足以被称为当今互联网三巨头,三家之争分别从传统的互联网开始向移动互联网转变,同时还有掀起“电视革命”的势头,未来形成三足鼎立之势并非没有可能。
分类:   
研究人员让CPU和GPU密切协作共同提升性能
研究人员让CPU和GPU密切协作共同提升性能
多核处理器中有一类混合架构处理器,即同一块芯片上集成了中央处理单元和图形处理单元,如英特尔的Sandy Bridge和AMD的Llano系列处理器。
分类:   
Hadoop On Demand管理指南
Hadoop On Demand管理指南
Hadoop On Demand (HOD)是一个能在一个共享集群上供应和管理相互独立的Hadoop Map/Reduce和Hadoop分布式文件系统(HDFS)实例的系统。它能让管理员和用户轻松地快速搭建和使用hadoop。HOD对Hadoop的开发人员和测试人 ...
分类:   
IBM将在Hadoop上建立全新存储架构设计
IBM将在Hadoop上建立全新存储架构设计
IBM科学家宣称,该设计在将万亿字节的数据变成可用的信息方面,速度比当前技术可以提高两倍。因此,该设计非常适用于云计算和数据密集型的工作负载应用场合,比如数字媒体、数据挖掘、金融分析等。   这种新的架构 ...
分类:   
全球数据中心市场格局生变
全球数据中心市场格局生变
目前,全球数据中心市场发展速度开始减缓,但金砖国家的这一市场仍然保持快速增长,数据中心的建设工作刚进入活跃期。与此同时,美国、加拿大等发达国家被迫减少数据中心建设项目,并考虑如何提高数据中心效率。进入 ...
分类:   
大数据技术市场调查报告:“BigData浪潮”迫使企业做出抉择
大数据技术市场调查报告:“BigData浪潮”迫使企业做出抉择
2020年全球电子设备存储的数据将暴增30倍,达到35ZB(相当于10亿块1TB的硬盘的容量)。大数据浪潮的到来也为企业带来了新一轮的挑战。对于有准备的企业来说这无疑是一座信息金矿,能够合理的将大数据转换为有价值信息 ...
分类:   
超越MySQL:三个流行MySQL分支的对比
超越MySQL:三个流行MySQL分支的对比
尽管MySQL是最受欢迎的程序之一,但是许多开发人员认为有必要将其拆分成其他项目,并且每个分支项目都有自己的专长。该需求以及Oracle对核心产品增长缓慢的担忧,导致出现了许多开发人员感兴趣的子项目和分支。本文将 ...
分类:   
甲骨文正式发布大数据机 进军大数据
甲骨文正式发布大数据机 进军大数据
甲骨文今天正式发布了最新的Oracle大数据机(Big Data Appliance),其中合作伙伴公司Cloudera将提供大数据机中的Hadoop功能,二者将携手进军大数据领域。但现在的问题是,集成设备对于大数据来说是否真正适合?
分类:   
谁是王者?七款主流图形数据库功能对比
谁是王者?七款主流图形数据库功能对比
谁是王者?七款主流图形数据库功能对比
分类:   
程学旗:Hadoop平台存在三个方面的挑战
程学旗:Hadoop平台存在三个方面的挑战
由中科院计算所主办“第四届Hadoop in china 2010中国云计算大会”9月4日在京召开。本次大会将有千余名Hadoop云计算技术精英与会交流,十余家知名互联网企业倾情出场,以及多位行业领袖的深度演讲。IT168将为您带来实 ...
分类:   
大数据下的数据分析-Hadoop架构解析
大数据下的数据分析-Hadoop架构解析
随着互联网、移动互联网和物联网的发展,谁也无法否认,我们已经切实地迎来了一个海量数据的时代,数据调查公司IDC预计2011年的数据总量将达到1.8万亿GB,对这些海量数据的分析已经成为一个非常重要且紧迫的需求。   ...
分类:   
Hadoop中的集群配置和使用技巧
Hadoop中的集群配置和使用技巧
其实参看Hadoop官方文档已经能够很容易配置分布式框架运行环境了,不过这里既然写了就再多写一点,同时有一些细节需要注意的也说明一下,其实也就是这些细节会让人摸索半天。Hadoop可以单机跑,也可以配置集群跑,单 ...
分类:   
Hadoop集群搭建
Hadoop集群搭建
本文描述了如何安装、配置和管理有实际意义的Hadoop集群,其规模可从几个节点的小集群到几千个节点的超大集群。 如果你希望在单机上安装Hadoop玩玩,从这里能找到相关细节。 先决条件确保在你集群中的每个节点上都安 ...
分类:   
SQL向NoSQL转变 关系型数据库的局限性
SQL向NoSQL转变 关系型数据库的局限性
NoSQL系统一般都会宣传一个特性,那就是性能好,然后为什么呢?关系型数据库发展了这么多年,各种优化工作已经做得很深了,NoSQL系统一般都是吸收关系型数据库的技术,然后,到底是什么因素束缚了关系型数据库的性能呢 ...
分类:   
XFS:大数据环境下Linux文件系统的未来
XFS:大数据环境下Linux文件系统的未来
Linux有好多种件系统,但往往最受关注的是其中两种:ext4和btrfs。XFS开发者Dave Chinner近日声称,他认为更多的用户应当考虑XFS。他谈到了为了解决XFS中最严重的可扩展性问题所做的工作,还谈到了他认为将来的发展走 ...
分类:   
云归档实现电子发现和法规遵从:五要点
云归档实现电子发现和法规遵从:五要点
基于云的归档正在逐步增长,而数据存储的管理者对其抱有巨大期望:有更多选择来将公司的底层基础架构进行外包,以及有更大的潜力来搭建一个无缝的用户体验,并具有几乎无限的扩展容量。
分类:   
十亿亿次 重庆拟建全球最快超算中心
十亿亿次 重庆拟建全球最快超算中心
日前,重庆市召开重庆超级计算中心建设方案论证会,通过了建设重庆超级计算中心的方案。方案指出重庆市在城市管理、基因研究、三峡库区建设方面,以及周边地区在核模拟、航空航天、计算化学等领域研究方面均迫切需要 ...
分类:   
快速搭建 Hadoop 环境
快速搭建 Hadoop 环境
对于Hadoop来说,最主要的是两个方面,一个是分布式文件系统HDFS,另一个是MapReduce计算模型
分类:   
Hadoop学习笔记之:Hadoop的两个部分
Hadoop学习笔记之:Hadoop的两个部分
本文大部分内容都是从官网Hadoop上来的。其中有一篇介绍HDFS的pdf文档,里面对Hadoop介绍的比较全面了。我的这一个系列的Hadoop学习笔记也是从这里一步一步进行下来的,同时又参考了网上的很多文章,对学习Hadoop中遇 ...
分类:   
未来十年:MoreSQL的黄金时代
未来十年:MoreSQL的黄金时代
MoreSQL(之前的NewSQL)旨在将SQL和NoSQL的优势结合起来。通过技术整合,MoreSQL完全可以在SQL(Structured Query Language)的基础上吸收NoSQL的灵活性、可扩展性等优点,迎来关系型数据库的黄金时代。
分类:   
MapR CEO: Hadoop将增强SQL 而不是取代
MapR CEO: Hadoop将增强SQL 而不是取代
Hadoop几乎成了非关系型数据模型的代名词,而SQL似乎被渐渐打入冷宫。知名商业Hadoop供应商MapR的CEO John Schroeder则认为,Hadoop将增强SQL,而不是取代之。
分类:   
分布式文件系统测试方法与测试工具
分布式文件系统测试方法与测试工具
如何对分布式文件系统进行测试评估并选择最适合数据应用的产品系统呢?这里从功能测试和非功能测试两个方面,简要地介绍分布式文件系统的测试方法,并对主要测试工具进行简要说明,为产品选型或产品研发提供依据。
分类:   
初窥SAS云计算
初窥SAS云计算
SAS的云计算由来已早,古称分布式计算,只是很多人不是这一卦的,所以大家都不知道。在SAS 8和更早版本中就提供了SAS/Connect,利用远端服务器上CPU、内存和I/O的强大处理能力,加快计算过程。
分类:   
Oracle推出自己版本的R——Oracle Advanced Analytics
Oracle推出自己版本的R——Oracle Advanced Analytics
Oracle宣布了11g数据库的一个新特性选项Oracle Advanced Analytics,用于在Oracle Data Mining组件中捆绑Oracle R Enterprise。Oracle R Enterprise能给主流的开源统计软件R的用户带来企业级别的性能,这主要获益于O ...
分类:   
Hadoop Map/Reduce教程
Hadoop Map/Reduce教程
这篇教程从用户的角度出发,全面地介绍了Hadoop Map/Reduce框架的各个方面。 先决条件请先确认Hadoop被正确安装、配置和正常运行中。更多信息见: Hadoop快速入门对初次使用者。 Hadoop集群搭建对大规模分布式集群。 ...
分类:   
Forrester分析师解读Hadoop与数据仓库概念
Forrester分析师解读Hadoop与数据仓库概念
企业如何从快速变化的海量数据中获取有价值的洞察力。如何将现有数据仓库架构的功能发挥到最大,Hadoop的优势与劣势,以及大数据时代中每一个数据仓库厂商的发展等。
分类:   
5款备受关注的开源 NoSQL 数据库介绍
5款备受关注的开源 NoSQL 数据库介绍
随着社会化网站的兴起,传统的关系数据库在应付这类网站,特别是超大规模和高并发的SNS类型的web2.0纯动态网站已经显得力不从心,暴露了很多难以克服的问题,而非关系型的数据库则由于其本身的特点得到了非常迅速的发 ...
分类:   
2012年的高科技亮点:云计算快速蚕食传统模式
2012年的高科技亮点:云计算快速蚕食传统模式
2012年全球IT支出额将出现较大幅度增加,移动设备、应用及新兴市场将成为主要增长点。与此同时,诸如云计算、存储、数据管理及通信等方面的服务可能会为未来全球企业技术的发展带来显著且至关重要的影响和变化。
分类:   
云计算新动向:IT从业者被引向数据挖掘
云计算新动向:IT从业者被引向数据挖掘
云计算已经为世界各地的组织机构提供了数据访问、存储和应用程序,大大提高了灵活性并节省了成本。一项新的研究预言,由于云计算的出现,IT从业者不久将引向数据挖掘,这意味着公司有更大的灵活性和更低的成本——但 ...
分类:   

热门频道

  • 大数据
  • 商业智能
  • 量化投资
  • 科学探索
  • 创业

即将开课

 

GMT+8, 2018-12-17 01:11 , Processed in 0.111975 second(s), 19 queries .