炼数成金 门户 大数据
订阅

大数据

存储130亿张图片的新平台:Flickr的Tripod架构详解
存储130亿张图片的新平台:Flickr的Tripod架构详解
Flickr 的传统架构用现在的眼光看起来可能有些老旧,但在社交网络出来之前可是学习互联网架构的经典,高可用小编当年也是拿着其架构图参阅领会,更多传统的 Flickr 架构可以参阅 。然而到了社交网络时代,已经很长时 ...
分类:   
如何看待阿里云加入 Linux 基金会金牌会员?
如何看待阿里云加入 Linux 基金会金牌会员?
回馈开源社区。在开源文化的影响已经深入到世界的各个角落的今天,很多企业的发展都极大地得益于开源文化、开源生态和开源技术的帮助,因此,就如阿里云资深总监李津说的,“参与 Linux 基金会……是对 Linux 带来的 ...
分类:   
腾讯HTTPS性能优化实践
腾讯HTTPS性能优化实践
HTTPS很安全,很古老也很成熟,为什么一直到今天我们还有66%的网站不支持HTTPS呢?原因有两点:慢,HTTPS未经任何优化的情况下要比HTTP慢几百毫秒以上,特别在移动端可能要慢500毫秒以上,关于HTTPS慢和如何优化已经 ...
分类:   
Google的大规模集群管理系统Borg(上篇)
Google的大规模集群管理系统Borg(上篇)
Google的Borg系统是一个运行着成千上万项作业的集群管理器,它同时管理着很多个应用集群,每个集群都有成千上万台机器,这些集群之上运行着Google的很多不同的应用。Borg通过准入控制,高效的任务打包,超额的资源分 ...
分类:   
Python 标准库系列之模块介绍
Python 标准库系列之模块介绍
Python的模块其实就是封装了一个或者多个功能的代码集合,以便于重用,模块可以是一个文件也可以是一个目录,目录的形式称作包。内置模块可以理解成当你安装好python环境之后,直接可以使用import导入的就是内置模块 ...
分类:   
为Apache Spark准备的深度学习
为Apache Spark准备的深度学习
一旦有了一个平台和团队可以让你部署机器学习的模型,很自然地你会开始探索深度学习。正如我在最近的数据秀的一集里指出的,企业正在开始应用深度学习技术到时间序列数据、事件数据、文本和图像数据上。其中的大部分 ...
分类:   
“魔镜杯”互联网金融数据训练营报名启动!仅100个名额!
“魔镜杯”互联网金融数据训练营报名启动!仅100个名额!
报名学习全免费,15000元奖学金等你来拿,还可加入拍拍贷,与中国优秀的互联网金融人才一起工作!
分类:   
Spanner, 真时和CAP理论
Spanner, 真时和CAP理论
Spanner是Google的高可用全球规模分布式数据库。Spanner为所有事务提供强一致性保证。基于CAP理论,同时实现全球规模的可用性和一致性组合通常被认为是不可能的。本文将展示Spanner是如何实现这一组合以及如何与CAP ...
分类:   
给你看另一个Google:用计算机形式来描述Google的帝国版图
给你看另一个Google:用计算机形式来描述Google的帝国版图
我们知道,Google是一家庞大的科技公司,其创新能力也可以算是世界最强的。它不仅涉及搜索、系统、应用的互联网产品,还有Chromebook pixel、Google Glass、Nexus4/7/10等一系列硬件,更有甚者,它还触及Google Fibe ...
分类:   
Go 1.8 正式发布,编译速度比 Go 1.7 提高约 15%
Go 1.8 正式发布,编译速度比 Go 1.7 提高约 15%
Go 1.7中为64位x86引入的编译器后端现在用于所有体系结构,这些体系结构将会有显著的性能改进。例如,我们的基准程序所需的CPU时间在32位ARM系统上减少了20-30%。在此版本中,64位x86系统还有一些性能改进,编译器 ...
分类:   
HBase 1.3 发布,性能大幅提升
HBase 1.3 发布,性能大幅提升
在一些像OpenTSDB的项目中,HBase通常被直接用作时序应用或者通过项目本身用作时序应用。在时序应用中,数据常常按照抵达时间的先后顺序队列写入存储单元,查询数据经常发生在一个有限的时间回溯窗口内,这导致最新 ...
分类:   
Nvidia、Google、Intel......同样是做AI芯片,走的路又有什么不同?
Nvidia、Google、Intel......同样是做AI芯片,走的路又有什么不同?
芯片行业的整体发展始自上世纪60年代,一开始是指数型发展,所以有了每18个月集成度翻一番的摩尔定律,可以说当时的发展是非常快的。摩尔定律背后的逻辑是说,随着工艺制程的进化,同一款芯片的制造成本会更低,单位 ...
分类:   
赶集网三年DBA总结
赶集网三年DBA总结
数据库不局限于 MySQL, Oracle, 如果分的不细,还会有 Redis, MongoDB 等一系列 NoSQL。工作内容都一样,首先是高可用稳定性,不能今天抖动明天宕机,涉及工作很多。第二个是数据安全,比如备份及恢复,14年赶集审计 ...
分类:   
最易懂的ARM芯片开发科普,建议收藏!
最易懂的ARM芯片开发科普,建议收藏!
经常有人说,现在做手机芯片就像搭积木,买点IP,连一下,后端外包。等芯片回来,上电,起OS,大功告成。这么简单,要不我们也来动手攒一颗吧。首先,我们跑去ARM,问它有没有现成的系统。ARM说有啊,A73/G71/视频/ ...
分类:   
大胆猜测某类数据创业公司的数据产品架构
大胆猜测某类数据创业公司的数据产品架构
这两年互联网行业出现了一批创业公司,专注于互联网风控业务,或者可以称之为云风控业务,致力于通过大数据,帮助第三方企业实现风险的联防联控,解决欺诈、信贷等行业的风控问题。先看看这些公司的服务模式:客户在 ...
分类:   
孙正义:数字资产会成为人类最大的资产
孙正义:数字资产会成为人类最大的资产
“向世界挑战”,这是我对我们公司的期望,今日聚集在此的诸位都就职于在世界市场活跃的企业,也都是很有抱负的人。最近,在安倍经济政策的影响下,日本的经济再次显现出了迎来成长期的态势,在刺激经济发展这个意义 ...
分类:   
使用开源工具构建分布式跟踪体系:Pinterest架构解密
使用开源工具构建分布式跟踪体系:Pinterest架构解密
Pinterest,是一个网络与手机的应用程序,可以让用户利用其平台作为个人创意及项目工作所需的视觉探索工具,同时也有人把它视为一个图片分享类的社交网站,用户可以按主题分类添加和管理自己的图片收藏,并与好友分 ...
分类:   
"天河三号"开始研制 中国HPC步入加速期
"天河三号"开始研制 中国HPC步入加速期
近日,又有最新爆料,天河三号要来了!2010年,中国首台千万亿次超级计算机“天河一号”落户天津,且以每秒4700万亿次的峰值性能获得世界超级计算机排名第一的殊荣。2013年6月公布的全球超级计算机500强排行榜中 ...
分类:   
Yahoo开源TensorFlowOnSpark
Yahoo开源TensorFlowOnSpark
Yahoo开源的TensorFlowOnSpark使Google发起的TensorFlow深度学习开源框架与Apache Spark集群中的数据集兼容,一些组织为了处理大量不同类型的数据而进行维护,对他们来说无疑是个好消息。Yahoo开源TensorFlowOnSpark ...
分类:   
编程语言 2 月排行榜:Java第一,Scratch进入Top 20
编程语言 2 月排行榜:Java第一,Scratch进入Top 20
TIOBE 最近公布了2017年2月编程语言指数排行榜,排名前三的还是 Java、C、C++, C# 和 Python 排第四和第五,教育类编程语言 Scratch 进入了 Top 20。Scratch是麻省理工媒体实验室(MIT Media Lab)终身幼稚园组开发 ...
分类:   
大数据江湖的七十二骗(上)
大数据江湖的七十二骗(上)
前两年,Peter Thiel(以下简称彼得)来了一趟中国卖书——如你所知,就是那本《从0到1》,和《失控》一样,目前基本上成为了互联网行业骗子人手一册的玩意儿,类似《麻衣神相》《水镜全编》,或者干脆叫《如来神掌 ...
分类:   
选型云ERP中五个不能忽视的问题
选型云ERP中五个不能忽视的问题
企业在购买整合系统时要面对一系列的挑战性,除了要理解公司行为方式和原因以外,还需要有考虑到其他因素。如果忽略了某个流程或要求,那么在这个步骤没有发生问题时系统可以顺利运行,一旦出现问题就会产生负面影响 ...
分类:   
数据库不适合Docker及容器化的7大原因
数据库不适合Docker及容器化的7大原因
如果我们观察 2017 年技术行业,容器和 Docker 依然将是最热门的流行语。我们开始在每个领域的 Docker 容器中打包开发的软件。从小型初创公司到巨大的微服务平台都在使用容器技术。从 CI 平台到 Raspberry Pi 。从数 ...
分类:   
英特尔大举回撤美国本土,全球半导体行业大变局扑朔迷离
英特尔大举回撤美国本土,全球半导体行业大变局扑朔迷离
众所周知,在移动处理器制造方面,英特尔(Intel)落后于三星和台积电是显而易见的。但之前就有预测指出,美国政府换届很可能会给英特尔带来了一个千载难逢的新机遇。如今,这一切似乎变成了现实。2017年2月8日,美 ...
分类:   
终结光纤线缆时代,红外激光“隔空传输”数据引发革命!
终结光纤线缆时代,红外激光“隔空传输”数据引发革命!
在一个数据中心机房内,成百上千的光纤电缆将服务器机架“重重包围”。为何不把这些电缆都丢掉,然后给每个服务器机架顶部装上红外激光器?但是,我们还可以给更多机架装上感光接收器,以接收激光器发送的数据,再放 ...
分类:   
2017 年最值得期待的 5 个新 Linux 发行版
2017 年最值得期待的 5 个新 Linux 发行版
一些非常具有潜力,但是还未被评审的 Linux 系统发行版也是值得大家去关注的。但是注意,由于 Distrowatch 网站暂时没时间或人力去评审这些新的发行版,因此它们可能永远无法进入网站首页排名。因此,我们将会跟大家 ...
分类:   
每秒百万查询:MySQL与PG在苛刻负载下的和平之战
每秒百万查询:MySQL与PG在苛刻负载下的和平之战
开源数据库能应付每秒数百万次的查询吗?许多开源倡导者会回答“是的”,但是,断言是不够有理有据的证明。这就是为什么在这篇文章中,我们将分享Alexander Korotkov(CEO,Postgres专家)和Sveta Smirnova(首席技 ...
分类:   
富士通将AI与OpenStack结合
富士通将AI与OpenStack结合
想象一下,在你旁边开着车却在执行多个任务(吃、检查文本、阅读)的人比时刻盯着路的你付更多保险,是不是理所当然。这是富士通正在集中使用人工智能(AI)以及签名分析即服务、3D图像建模研究成果的领域之一。未来 ...
分类:   
企业应用快速跨向容器时代的正确姿势
企业应用快速跨向容器时代的正确姿势
云计算解决了基础资源层的弹性伸缩,却没有解决 PaaS层应用随基础资源层弹性伸缩而带来的批量、快速部署问题。于是容器应运而生。容器是 Container,Container另一个意思是集装箱,其实容器的思想就是要变成软件交付 ...
分类:   
论运营商当下的大数据变现服务模式
论运营商当下的大数据变现服务模式
任何企业的大数据变现都需要充分利用自己的优势,去创造适合自己的商业模式,基于运营商的现状,其大数据变现要获得突破,前期必然是以资源驱动为核心的,这里笔者就谈谈当前关于运营商大数据合作变现服务模式的看法 ...
分类:   

热门频道

  • 大数据
  • 商业智能
  • 量化投资
  • 科学探索
  • 创业

即将开课

 

GMT+8, 2017-2-22 09:37 , Processed in 0.927923 second(s), 22 queries .