炼数成金 大数据
订阅

大数据

有关容器的六大误区和八大正确场景
有关容器的六大误区和八大正确场景
做容器的研究和容器化几年了,从最初对于容器的初步认识,到积攒了大量的容器迁移经验,并和客户解释了容器技术之后,发现原来对于容器的理解有大量的误解,而且容器并非虚拟机的替代,而是有十分具体的应用场景的。 ...
分类:   
对象存储从理论到实践
对象存储从理论到实践
随着PC、平板电脑、智能手机等电子设备的普及,互联网极大的提升了人们的生活水平。网络在丰富人们生活的同时,也产生了庞大的数据量。据IDC预测,全球数据总量预计2020年达到44个ZB,我国数据量将达到8060个EB,占 ...
分类:   
鲜为人知的 Python 语法
鲜为人知的 Python 语法
所有人(好吧,不是所有人)都知道 python 是一门用途广泛、易读、而且容易入门的编程语言。但同时 python 语法也允许我们做一些很奇怪的事情。使用 lambda 表达式重写多行函数,众所周知 python 的 lambda 表达式不 ...
分类:   
RocketMQ 4.3正式发布,支持分布式事务
RocketMQ 4.3正式发布,支持分布式事务
在微服务架构中,随着服务的逐步拆分,数据库私有已经成为共识,这也导致所面临的分布式事务问题成为微服务落地过程中一个非常难以逾越的障碍,但是目前尚没有一个完整通用的解决方案。其实不仅仅是在微服务架构中, ...
分类:   
如何用 Python实时监控文件?
如何用 Python实时监控文件?
在业务稳定性要求比较高的情况下,运维为能及时发现问题,有时需要对应用程序的日志进行实时分析,当符合某个条件时就立刻报警,而不是被动等待出问题后去解决,比如要监控nginx的$request_time和$upstream_response ...
分类:   
在树莓派上实现人脸识别
在树莓派上实现人脸识别
预计在不久后的将来,人脸识别和身份认证技术将在我们的日常生活中扮演一个非常重要的角色。这项技术为我们开辟了一个全新的世界,它几乎适用于我们生活的方方面面。面部识别/身份认证的使用案例包括安全系统、认证 ...
分类:   
Kubernetes核心组件解析
Kubernetes核心组件解析
众所周知,Kubernetes是目前最为火热的容器编排工具之一,其背后有如此多的追随者必然是有原因的。首先Kubernetes非常轻量,通常Kubernetes都是以容器作为载体,而容器本来就具有轻量级秒级部署的特点;再者Kubernet ...
分类:   
AWS彻底抛弃Oracle数据库:计划2020年初完成
AWS彻底抛弃Oracle数据库:计划2020年初完成
北京时间8月2日上午消息,亚马逊在数据中心技术提供商这条路上的发展日渐将不少自己长期以来的供应商变为了难以共融的竞争对手,甲骨文(Oracle)即其中之一。  最近,亚马逊正在考虑对甲骨文的新一轮打击。据知情 ...
分类:   
Python 彻底甩掉 Java,位居 48 种编程语言之首!
Python 彻底甩掉 Java,位居 48 种编程语言之首!
昨日,IEEE Spectrum 杂志发布了一年一度的编程语言排行榜,这个排行榜已经连续发布了五年。对于每位开发者而言,想要衡量编程语言流行度则需要依赖相对流行的网站统计数据。IEEE Spectrum 编程语言排行榜的排序综合 ...
分类:   
谷歌开源Go Cloud,Go语言正式开启云端之路
谷歌开源Go Cloud,Go语言正式开启云端之路
近日,谷歌开源了 Go Cloud 项目,旨在让 Go 语言(Golang)成为开发云应用程序的首选语言。该项目提供了一个库和用于构建可在多个云平台之间移植的应用程序的工具。 Go Cloud 目前还处于早期测试版阶段,还不适合用 ...
分类:   
一文读懂 DevOps与SRE 的来龙去脉
一文读懂 DevOps与SRE 的来龙去脉
若是把运维当作一门学科来看,是有难度的.不仅因为如何很好的运行系统这种普遍问题未得到解决外,现存的最佳实战也因高度依赖环境,而未得到广泛使用;另外一个未解决的问题就是如何更好的管理运维团队。详细分析这 ...
分类:   
使用 TiKV 构建分布式类 Redis 服务
使用 TiKV 构建分布式类 Redis 服务
Redis 是一个开源的,高性能的,支持多种数据结构的内存数据库,已经被广泛用于数据库,缓存,消息队列等领域。它有着丰富的数据结构支持,譬如 String,Hash,Set 和 Sorted Set,用户通过它们能构建自己的高性能应 ...
分类:   
Java第一,C第二、Python第三:Apache 2018 年度报
Java第一,C第二、Python第三:Apache 2018 年度报
Apache 2018 年度报告显示,该生态系统今年生态系统活跃增长,甚至会有盈余。Apache 基金会拥有 300 多个项目和超过 6,700 个代码贡献者,现在是世界上最大的开源基金会。 项目领域涵盖从大数据到云计算再到内容管理 ...
分类:   
中小团队基于Docker的DevOps实践
中小团队基于Docker的DevOps实践
工程师本地开发,开发完成后提交代码到代码仓库,触发jenkins进行持续集成与部署,部署完成会收到结果邮件。项目运行过程中可通过日志系统查看程序日志,有异常会触发监控系统发送报警。从编码到上线后结果反馈都可 ...
分类:   
ReactOS 0.4.9 发布,离最终替代 Windows 更近一步
ReactOS 0.4.9 发布,离最终替代 Windows 更近一步
ReactOS 0.4.9 发布了,ReactOS 是一个基于 Windows NT 架构设计原则的开源操作系统。由于所有的代码都经过重新编写,ReactOS 并不是一个基于 Linux 的操作系统,而且不包含任何 UNIX 架构。ReactOS 项目的主要目标 ...
分类:   
Python 之父透露退位隐情,与核心开发团队产生隔阂
Python 之父透露退位隐情,与核心开发团队产生隔阂
Python 创始人 Guido van Rossum 前段时间宣布脱离 Python 决策层,辞去所谓的 BDFL (终生仁慈的独裁者) 身份曾引发热议,当时他以 PEP 572 改进提案的争吵事件为例,表明其退出缘由。近日 Guido van Rossum 在接受 ...
分类:   
E级超算“天河三号”原型机通过验收,百亿亿次计算即将来临!
E级超算“天河三号”原型机通过验收,百亿亿次计算即将来临!
近日从位于天津滨海新区旗下开发区的国家超级计算天津中心传来消息,我国自主研发的新一代百亿亿次超级计算机——“天河三号”E级原型机完成研制部署,并于22日顺利通过项目课题验收,将逐步进入开放应用阶段。该原 ...
分类:   
GraphQL 在微服务架构中的实践
GraphQL 在微服务架构中的实践
简单对象访问协议(SOAP)从今天来看已经是一门非常古老的 Web 服务技术了,虽然很多服务仍然在使用遵循 SOAP 的接口,但是到今天 REST 风格的面向资源的 API 接口已经非常深入人心,也非常的成熟;但是这篇文章要介 ...
分类:   
来自谷歌团队的容器运维最佳实践
来自谷歌团队的容器运维最佳实践
作为应用程序管理的一部分,日志中包含宝贵的信息,可让人了解应用程序中发生的事件。Docker 和 Kubernetes 致力于简化日志管理。在传统服务器上,你可能需要将日志写入特定文件并处理日志轮换以避免填满磁盘。如果 ...
分类:   
Spark比拼Flink:下一代大数据计算引擎之争,谁主沉浮?
Spark比拼Flink:下一代大数据计算引擎之争,谁主沉浮?
自从数据处理需求超过了传统数据库能有效处理的数据量之后,Hadoop 等各种基于 MapReduce 的海量数据处理系统应运而生。从 2004 年 Google 发表 MapReduce 论文开始,经过近 10 年的发展,基于 Hadoop 开源生态或者 ...
分类:   
2018年,20大Python数据科学库都做了哪些更新?
2018年,20大Python数据科学库都做了哪些更新?
一般我们会将科学领域的库作为清单打头,NumPy 是该领域的主要软件库之一。它旨在处理大型的多维数组和矩阵,并提供了很多高级的数学函数和方法,因此可以用它来执行各种操作。在过去一年,开发团队对该库进行了大量 ...
分类:   
我们从爬取1000亿个网页中学到了什么?
我们从爬取1000亿个网页中学到了什么?
与标准的爬虫应用程序不同,大规模爬取电子商务产品数据需要面临一系列独特的挑战,这些挑战让爬取网页变得更加困难。因为时间通常是一个限制性的约束条件,所以在进行大规模爬取时要求爬虫以非常快的速度进行爬取, ...
分类:   
2000 个量子比特模拟成功!D-Wave 量子计算机已可用于解决问题
2000 个量子比特模拟成功!D-Wave 量子计算机已可用于解决问题
D-Wave 的量子计算机可以被看成是由许多块可转向的磁铁组成,虽然这与 IBM 和 Intel 开发的量子设备中所使用的量子比特组件不同,但 D-Wave 的量子设备确实是以粒子的量子行为为基础来进行运算的。在只有一块磁铁的 ...
分类:   
微服务那么好,这家公司为何要退回单体架构?
微服务那么好,这家公司为何要退回单体架构?
在微服务和单体架构之间做选择时,要注意它们各自都有自己需要考虑的因素。我们的架构中有些部分是微服务表现更出色,但服务端的目标迁移到微服务后的一系列麻烦是一个很好的教训,证明这一流行趋势在某些情况下能对 ...
分类:   
为什么说JSON不适合做配置语言?
为什么说JSON不适合做配置语言?
很多项目使用 JSON 作为配置文件,最明显的例子就是 npm 和 yarn 使用的 package.json 文件。当然,还有很多其他文件,例如 CloudFormation(最初只有 JSON,但现在也支持 YAML)和 composer(PHP)。但是,JSON 实 ...
分类:   
GitHub6月最受关注发布
GitHub6月最受关注发布
PocketMine-MP 是用 PHP 编写的 Minecraft Pocket Edition 服务器。使用它你可以通过运行多个世界,插件和其他自定义设置来管理自己的 Minecraft 世界。最新版本添加了新的依赖项,能提高性能,并修复了许多游戏设置 ...
分类:   
Facebook「配置大规模服务器」的兵刃:位置感知分发(LAD)
Facebook「配置大规模服务器」的兵刃:位置感知分发(LAD)
Facebook的基础设施包括许多地域分散的数据中心,它们托管运行数百万台服务器。这些服务器运行众多系统,从前端Web服务器、新闻源(News Feed)聚合系统到消息传递和实时视频应用,不一而足。除了常规的代码推送外, ...
分类:   
普通程序员怎么理解日志系统
普通程序员怎么理解日志系统
当我们在做系统开发时,日志系统是绕不开的话题。作为日志系统的最终使用者,我们会接触不同的日志系统,比如 log4j、 logback 和 slf4j 等等,还会接触到日志系统的各种概念,比如 Formatter、Appender 和 Priority ...
分类:   
手把手教你学习 etcd
手把手教你学习 etcd
etcd 是一个分布式的、一致性的键值存储系统,主要用于配置共享和服务发现,etcd 基于 Go 语言实现;Google 的容器集群管理系统 Kubernetes、开源 PaaS 平台 Cloud Foundry 和 CoreOS 的 Fleet 都广泛使用了 etcd。 ...
分类:   
Ceph 原理、架构等知识梳理总结
Ceph 原理、架构等知识梳理总结
Ceph是一个统一的分布式存储系统,设计初衷是提供较好的性能、可靠性和可扩展性。Ceph项目最早起源于Sage就读博士期间的工作(最早的成果于2004年发表),并随后贡献给开源社区。在经过了数年的发展之后,目前已得到 ...
分类:   

热门频道

  • 大数据
  • 商业智能
  • 量化投资
  • 科学探索
  • 创业

即将开课

 

GMT+8, 2018-10-23 22:10 , Processed in 0.155583 second(s), 19 queries .