炼数成金 大数据
订阅

大数据

CIO如何利用Hadoop降低大数据分析成本
CIO如何利用Hadoop降低大数据分析成本
大数据将成为代替云计算的新一代热门话题。这是必然的结果:随着时间的推移,企业产生的数据量已经越来越大了,这些数据包括客户购买偏好趋势、网站访问和习惯、客户审查数据等等;那怎样才能把这么大的数据集整理成综 ...
分类:   
大数据时代对证券行业意义非凡
大数据时代对证券行业意义非凡
如今,大数据不再仅仅局限在媒体与厂商之中的讨论,它犹如一场数据旋风开始席卷全球,从各行各业的IT主管到政府部门都开始重视大数据及其价值。国内证券公司也进行了一些探索。
分类:   
云计算落地迷局:纷杂的终端阻碍企业云落地?
云计算落地迷局:纷杂的终端阻碍企业云落地?
云计算发展至今,其模式已经开始逐渐成熟,然而,不论云端上如何处理数据,最终,需要让终端用户能够体验到云所带来的便捷与优势,相比于云端有着较为统一的标准和方案,在终端层面,则是乱象纷呈,究竟是什么情况造 ...
分类:   
MySQL与MongoDB复制群集分片设计及原理
MySQL与MongoDB复制群集分片设计及原理
分布式数据库计算涉及到分布式事务、数据分布、数据收敛计算等等要求。   分布式数据库能实现高安全、高性能、高可用等特征,当然也带来了高成本(固定成本及运营成本),我们通过MongoDB及MySQL Cluster从实现上来分 ...
分类:   
Hadoop掀起大数据革命 三巨头齐发力
Hadoop掀起大数据革命 三巨头齐发力
开源的数据处理平台凭借其低成本、高扩展性和灵活性的优势已经赢得了多数网络巨头的认可。现在Hadoop将进入更多企业。IBM将在明年推出内置NoSQL技术的DB2旗舰级数据库管理系统。上个月Oracle和Microsoft也分别透露了 ...
分类:   
大数据开源时代 Hadoop能淘到金吗
大数据开源时代 Hadoop能淘到金吗
IDC的大数据市场预测,大数据将会迎来大时代。分析公司表示截止到2015年大数据产值将达169亿美元。不过我们尚不明确,这个市场有多新,或者除了大数据新兴企业是否真正会刮起一个淘金热。   这是开源的炒作吗?按大 ...
分类:   
云计算数据中心的变革:绿色节能已成为必备条件
云计算数据中心的变革:绿色节能已成为必备条件
虚拟化技术提升了传统物理机的使用效率,并通过云计算形成资源池,数据散列分布于资源池的不同物理机上。大数据挖掘工具在其中起到指针的作用,根据对信息内容的需求指向信息存储的空间,形成数据仓库。   “用 ...
分类:   
大数据里的小利器
大数据里的小利器
如今,90%的数据分析师都在谈大数据,在大数据的背景之下,数据分析师收集数据的边界在哪里?又该如何运用数据呢?作者在美国参加Strata 2012大会期间,跟很多数据中人交流,其中前LinkedIn首席科学家DJ Patil给他的 ...
分类:   
三方面提高Oracle数据库的安全性
三方面提高Oracle数据库的安全性
要提高ORACLE数据库的安全性, 必须从数据库系统自身安全,数据库用户安全以及数据库数据安全多方面入手,杜绝可能出现的数据泄露情况。 随着计算机技术的提高和网络应川的发展,数据库应用越来越多的进入各行各业 ...
分类:   
大数据里的小利器——Strata 2012大会见闻
大数据里的小利器——Strata 2012大会见闻
天再一次塌下来了。这一次是“大数据”让IT部门如临大敌。正如街谈巷议的传闻一样,不管你走到哪里,关于“大数据”的讨论无处不在。在Google搜索这个词组,搜索结果超过13亿条。它甚至在维基百科拥有专门的条目。数 ...
分类:   
如何利用SAS进行随机抽样?
如何利用SAS进行随机抽样?
利用SAS进行随机抽样 在构建数据挖掘模型过程中,有时我们无法对所有的整体进行全面研究,有时我们希望将整体划分为训练集、验证集、测试集三份用于不同目的的数据集,甚至在K-折交叉验证中,我们需要把样本随机的划 ...
分类:   
云计算更适合小公司么?八大原因解析
云计算更适合小公司么?八大原因解析
一方面,云计算带来的经济效益在原本预算就不多的小公司显然体现不出优势,另一方面,大型公司云计算方面的安全性、集成度等常见问题在小公司也并不严重。但仍然可以总结八条原因,证明小公司更加适合采用云计算。
分类:   
解析DynamoDB:一个共享型数据库云服务
解析DynamoDB:一个共享型数据库云服务
DynamoDB是Amazon最新发布的NoSQL产品。本文在介绍DynamoDB特性的基础上,将其与SimpleDB、Cassandra和MongoDB进行了分析和比较。
分类:   
大数据时代的三大发展趋势
大数据时代的三大发展趋势
1993年《纽约客》刊登了一副漫画:标题是:“互联网上,没有人知道你是一条狗”。据说作者彼得·施泰纳因为此漫画的重印而赚取了超过5万美元。彼时关注互联网社会学的一些专家,甚至担忧“计算机异性扮装”而引发的社 ...
分类:   
在线视频王者YouTube的技术哲学
在线视频王者YouTube的技术哲学
许多团队都使得他们的基础架构越来越复杂,YouTube团队却尽量保持简单的风格。正是凭借简单的技术哲学,才成就了YouTube在线视频王者的盛名。如果你想构建一个可以承载日访问量40亿次的网站,YouTube有许多值得借鉴的 ...
分类:   
MongoDB 文档阅读笔记—优雅的NoSQL
MongoDB 文档阅读笔记—优雅的NoSQL
NoSQL 数据库在上年炒得很热,于是我也萌生了使用 NoSQL 数据库写一个应用的想法。首先来认识一下 NoSQL。NoSQL 是一个缩写,含义从最初的 No-SQL 到现在已经成为了 Not-Only-SQL。确实后面一种解释比较符合 NoSQL 的 ...
分类:   
八天学会MongoDB:第八天 驱动实践
八天学会MongoDB:第八天 驱动实践
作为系列的最后一篇,得要说说C#驱动对mongodb的操作,目前驱动有两种:官方驱动和samus驱动,不过我个人还是喜欢后者,因为提供了丰富的linq操作,相当方便。官方驱动:https://github.com/mongodb/mongo-csharp-dr ...
分类:   
零零散散学算法之详解几种数据存储结构
零零散散学算法之详解几种数据存储结构
所谓数据存储结构,就是数据的元素与元素之间在计算机中的一种表示,它的目的是为了解决空间规模问题,或者是通过空间规模问题从而间接地解决时间规模问题。我们知道,随着输入的数据量越来越大,在有限的内存里,不 ...
分类:   
【MongoDB for Java】Java操作MongoDB
【MongoDB for Java】Java操作MongoDB
现在我们就用Java来操作MongoDB的数据。 开发环境: System:Windows ,IDE:eclipse、MyEclipse 8 ,Database:mongoDB,开发依赖库: JavaEE5、mongo-2.5.3.jar、junit-4.8.2.jar
分类:   
IDC预测:未来十年全球大数据将增加50倍
IDC预测:未来十年全球大数据将增加50倍
2011年,1.8ZB(也就是1.8万亿GB)的大数据创建产生,这相当于每位美国人每分钟写3条Tweet,而且还是不停地写2.6976万年。据IDC报告预测,未来十年全球大数据将增加50倍,管理数据仓库的服务器的数量也将相应增加10倍以 ...
分类:   
八天学会MongoDB:第七天 运维技术
八天学会MongoDB:第七天 运维技术
这一篇我们以管理员的视角来看MongoDB,作为一名管理员,我们经常接触到的主要有4个方面:1. 安装部署,2. 状态监控,3. 安全认证,4. 备份和恢复,下面我们就一点一点的讲解。
分类:   
FreeBSD下安装配置Hadoop集群(性能调优)
FreeBSD下安装配置Hadoop集群(性能调优)
hadoop的性能调优是个比较艰难的事情,由于这个系统的整个环境比较复杂,对于接触时间不长的人来说,配置都很难,更别说找出性能优化的点了。性能优化涉及的方面很广,操作系统,网络配置,配置文件,调度器等等,抓 ...
分类:   
分析MySQL与NoSQL的使用场景
分析MySQL与NoSQL的使用场景
NoSQL 现如今是一个非常热门的话题,我也很高兴能看到越来越多的公司开始转向NoSQL数据库。不管别人怎么想,我们把它看做一个幸运的改变。是时候改变单一数据存储的局面了,根据不同的工作,我们需要选择使用最适合的 ...
分类:   
mongoDB 入门指南、示例
mongoDB 入门指南、示例
将下载下来的mongoDB-xxx.zip打开,找到bin目录,运行mongod.exe就可以启动服务,默认端口27017,db保存的路径是系统C硬盘目录的根目录的/data/db目录。也就是说,如果你的mongoDB-xxx.zip在E盘,那么你需要在C盘下建 ...
分类:   
BigTable类NoSQL数据库的选型与设计
BigTable类NoSQL数据库的选型与设计
 BigTable类数据库系统(HBase,Cassandra等)是为了解决海量数据规模的存储需要设计的。这里说的海量数据规模指的是单个表存储的数据量是在TB或者PB规模,单个表是由千亿行*千亿列这样的规模组成的。提到这个数据规模 ...
分类:   
Sqoop成为Apache顶级项目
Sqoop成为Apache顶级项目
Sqoop是一个Hadoop的周边工具,它的主要作用是在结构化数据存储与Hadoop之间进行数据交换,通过Sqoop,你可以批量将你关系型数据库中的数据导入到Hadoop中,也可以将Hadoop中的数据导出到其它结构化存储中。
分类:   
Oracle Exalytics:大数据分析的加速引擎
Oracle Exalytics:大数据分析的加速引擎
本文介绍了甲骨文最新发布的Oracle Exalytics商务智能云服务器在大数据分析方面的特性,Exalytics是一款高速集成系统,实现了内存商务智能(BI)软件和硬件的集成。
分类:   
八天学会MongoDB:第六天 分片技术
八天学会MongoDB:第六天 分片技术
在MongoDB里面存在另一种集群,就是分片技术,跟sql server的表分区类似,我们知道当数据量达到T级别的时候,我们的磁盘,内存就吃不消了,针对这样的场景我们该如何应对。
分类:   
IBM设计最强计算机:吞吐数据相当全球互联网2倍
IBM设计最强计算机:吞吐数据相当全球互联网2倍
据国外媒体报道,美国IBM公司正在设计史上最强的计算机,每天的数据吞吐数量相当于整个互联网,可用于对来自太空的无线电波进行分析,探索宇宙起源的奥秘。这台计算机将与占地1900平方英里(约合4920平方公里)的望远镜 ...
分类:   
NCR Teradata银行业数据仓库解决方案
NCR Teradata银行业数据仓库解决方案
NCR Teradata银行业数据仓库解决方案 -------------------------------------------------------------------------------- 随着金融自由化、资本市场国际化的步伐加快,国内金融企业面临着前所未有的竞争压力。除市 ...
分类:   

热门频道

  • 大数据
  • 商业智能
  • 量化投资
  • 科学探索
  • 创业

即将开课

 

GMT+8, 2018-8-17 15:19 , Processed in 0.187979 second(s), 19 queries .