炼数成金 大数据
订阅

大数据

Nginx 高可用集群解决方案 Nginx + Keepalived
Nginx 高可用集群解决方案 Nginx + Keepalived
Keepalived软件起初是专为LVS负载均衡软件设计的,用来管理并监控LVS集群系统中各个服务节点的状态,后来又加入了可以实现高可用的VRRP功能。因此,keepalived除了能够管理LVS软件外,还可以作为其他服务的高可用解 ...
分类:   
特朗普政府力挺甲骨文对抗谷歌,Java版权案再增变数
特朗普政府力挺甲骨文对抗谷歌,Java版权案再增变数
甲骨文和谷歌的Java版权案在美国最高法院开庭之前,甲骨文提交了一份回应摘要,回顾了这场耗时长达10年之久的诉讼案。甲骨文声称谷歌复制了超过11000行Java代码用于Android系统,而谷歌方面认为是合理使用,且复制的 ...
分类:   
9种分布式ID生成方式
9种分布式ID生成方式
在说分布式ID的具体实现之前,我们来简单分析一下为什么用分布式ID?分布式ID应该满足哪些特征?什么是分布式ID?拿MySQL数据库举个例子:在我们业务数据量不大的时候,单库单表完全可以支撑现有业务,数据再大一点 ...
分类:   
AT&T的百年沉浮
AT&T的百年沉浮
1876年,亚历山大·贝尔在美国成功申请了电话的专利,成为举世闻名的“电话之父”。次年,他就注册成立了自己的公司,并以自己的名字命名,叫做贝尔电话公司。凭借专利垄断优势,公司的业务发展非常迅速,登门造访的 ...
分类:   
我们为什么需要图数据库?
我们为什么需要图数据库?
当前,互联网数据呈指数级增长,但是以更快速度增加的是数据之间的关系。企业的 CIO 和 CTO 不仅要管理大量数据,还要从现有的数据中挖掘商业价值,在这种情况下处理数据之间的关系比处理单个数据更为重要。传统的关 ...
分类:   
Nature 重磅:潘建伟团队实现数十公里远程量子储存器纠缠
Nature 重磅:潘建伟团队实现数十公里远程量子储存器纠缠
北京时间 2 月 13 日凌晨,最新一期 Nature 发表了中国科学技术大学潘建伟团队的最新重磅成果:两个量子存储器通过光纤跨越数十公里实现远程纠缠。在这项最新研究中,潘建伟、包小辉及其同事利用一种名为腔增强的量 ...
分类:   
实操:从Oracle到GaussDB的数据迁移
实操:从Oracle到GaussDB的数据迁移
最近某省运营商O域核心业务系统的数据库计划从Oracle迁移至GaussDB,数据库服务器也从SUN小型机转到华为TaishanARM服务器。本人有幸参与其中,主要负责Oracle到GaussDB的数据迁移环节。数据迁移前期使用Datasync工具 ...
分类:   
5000 字带你快速入门 Apache Kylin
5000 字带你快速入门 Apache Kylin
Apche Kylin 是 Hadoop 大数据平台上的一个开源 OLAP 引擎。它采用多维立方体(Cube)预计算技术,可以将某些场景下的大数据 SQL 查询速度提升到亚秒级别。相对于之前的分钟乃至小时级别的查询速度。Apache Kylin 也 ...
分类:   
Kafka的生产者优秀架构设计
Kafka的生产者优秀架构设计
Kafka 是一个高吞吐量的分布式的发布订阅消息系统,在全世界都很流行,在大数据项目里面使用尤其频繁。笔者看过多个大数据开源产品的源码,感觉 Kafka 的源码是其中质量比较上乘的一个,这得益于作者高超的编码水平 ...
分类:   
跟Oracle说拜拜!独家揭秘东南亚电商平台 Prestomall 去 Oracle 的全过程
跟Oracle说拜拜!独家揭秘东南亚电商平台 Prestomall 去 Oracle 的全过程
很多人都说:“现在的东南亚就像是坐着时光机,回到了 90 年代的中国市场。”的确,在互联网领域,我们经常能在东南亚看到中国互联网发展历程的影子。本文我们将详细介绍一下东南亚企业的去 Oracle 经历,揭秘中国经 ...
分类:   
面对业务增长,Uber是如何扩展HDFS文件系统的
面对业务增长,Uber是如何扩展HDFS文件系统的
3年前,Uber采用了Hadoop作为大数据分析的存储(HDFS)和计算(YARN)基础设施。借助于这套系统,Uber的服务能力得到了增强,用户体验也得到了提升。Uber将基于Hadoop的批量和流式分析应用在了广泛的场景中,例如反 ...
分类:   
微服务架构何去何从?
微服务架构何去何从?
微服务架构模式经过5年多的发展,在各行各业如火如荼地应用和实践。如何在企业中优雅地设计微服务架构?是企业面对的一个重要问题。本文将讲述微服务架构1.0设计与实践以及面临问题和破局,最后讲述微服务架构2.0设 ...
分类:   
IBM换CEO了,Arvind Krishna接任,Red Hat CEO James Whitehurst担任总裁
IBM换CEO了,Arvind Krishna接任,Red Hat CEO James Whitehurst担任总裁
美国时间1月30日,IBM(纽约证券交易所:IBM)董事会选举Arvind Krishna担任公司首席执行官兼董事会成员,任命将于2020年4月6日起生效。Krishna目前是IBM全球云和认知软件高级副总裁,也是公司收购Red Hat的总设计师 ...
分类:   
手把手教你用 Gitlab 和 Jenkins 构建持续集成环境
手把手教你用 Gitlab 和 Jenkins 构建持续集成环境
最近用到持续集成顺便总结在这里,都是用的最新版。搭建过程中还有一个demo,提交代码到 gitlab 自动触发 jenkins 任务,自动编译代码和 docker 镜像并上传。gitlab 国内安装很麻烦,用官方的源装不了,因为在国外, ...
分类:   
性能提升25倍:Rust有望取代C和C++,成为机器学习首选的Python后端
性能提升25倍:Rust有望取代C和C++,成为机器学习首选的Python后端
我们可以花很多时间讨论机器学习开发中使用的各种工作流,但如果说我们通常是以一种 探索性 的方式来训练模型,这通常是没有争议的。你有一组数据,然后把它们切成许多片段从而更好地理解它们,接着尝试各种方法来解 ...
分类:   
最新消息!Cloudera 全球发行版正式集成 Apache Flink
最新消息!Cloudera 全球发行版正式集成 Apache Flink
由 Apache Flink 支持的 Cloudera Streaming Analytics 是 Cloudera DataFlow(CDF)平台内的一项新产品,可提供 IoT 级数据流和复杂事件的实时状态处理。Cloudera DataFlow(如下图所示)是一个全面的边缘计算到云 ...
分类:   
中台,我信了你的邪
中台,我信了你的邪
中台不是万能药,大象吃这个药,强身健体;蚂蚁吃这个药,一击毙命。“中台”概念火了一年多后,露出它狰狞的一面。多位行业人士对36氪说,由于盲目上中台,深圳一家女装企业的CIO 被开除;在华南一个有几十人的CIO ...
分类:   
迷信中台是一种病,得治
迷信中台是一种病,得治
企业中台就是,将企业的核心能力随着业务不断发展以数字化形式沉淀到平台,形成以服务为中心,由业务中台和数据中台构建起数据闭环运转的运营体系,供企业更高效的进行业务探索和创新,实现以数字化资产的形态构建企 ...
分类:   
Python 3.8来了!一分钟了解 6 大重要新特性
Python 3.8来了!一分钟了解 6 大重要新特性
北京时间2019年10月15日,Python 官方发布了 3.8 版本,新的 Python 3.8 版本有哪些必须知道的新特性?一个有活力的编程语言,总是动态变化以适应技术的发展。2020年1月1日起,Python 2 将不再得到官方支持,这也基 ...
分类:   
GraphQL vs REST API 架构,谁更胜一筹?
GraphQL vs REST API 架构,谁更胜一筹?
2015年,Facebook开源GraphQL。此后,它在前端Web中大受欢迎。传统的REST API有何不足?GraphQL优势何在?在本文中,我们将深入探讨GraphQL的设计原则,比较 GraphQL 与 REST 的异同,并讨论GraphQL 相对其他架构的 ...
分类:   
GitHub 星标 4.6k,Python 可视化库 Altair 入门
GitHub 星标 4.6k,Python 可视化库 Altair 入门
数据转化成更直观的图片,对于理解数据背后的真相很有帮助。如果你有这方面的需求,而且还在使用Python,那么强烈推荐你试一试Altair。Altair是一个专为Python编写的可视化软件包,它能让数据科学家更多地关注数据本 ...
分类:   
循序渐进,一文详解微服务架构!
循序渐进,一文详解微服务架构!
要理解微服务,首先要先理解不是微服务的那些。通常跟微服务相对的是单体应用,即将所有功能都打包成在一个独立单元的应用程序。从单体应用到微服务并不是一蹴而就的,这是一个逐渐演变的过程。本文将以一个网上超市 ...
分类:   
阿里巴巴大规模应用Flink的踩坑经验:如何大幅降低 HDFS 压力?
阿里巴巴大规模应用Flink的踩坑经验:如何大幅降低 HDFS 压力?
众所周知,Flink 是当前最为广泛使用的计算引擎之一,它使用 checkpoint 机制进行容错处理 ,checkpoint 会将状态快照备份到分布式存储系统,供后续恢复使用。在 Alibaba 内部,我们使用的存储主要是 HDFS,当同一个 ...
分类:   
1000+倍!超强Python『向量化』数据处理提速攻略
1000+倍!超强Python『向量化』数据处理提速攻略
1000倍的速度听起来很夸张。Python并不以速度著称。这是真的吗?当然有可能 ,关键在于你如何操作!如果在数据上使用for循环,则完成所需的时间将与数据的大小成比例。但是还有另一种方法可以在很短的时间内得到相同 ...
分类:   
大容量与高性能SSD硬盘的比较
大容量与高性能SSD硬盘的比较
人们需要了解企业级硬盘的最新发展趋势、高性能存储设备的应用方式,以及底层NAND闪存技术进步的影响。固态硬盘(SSD)如今已大部分取代了用于企业应用程序工作负载的机械硬盘(HDD),并且对大容量数据存储而言,已成为 ...
分类:   
Oracle 复制 AWS 的 API:这侵犯了版权吗 ?
Oracle 复制 AWS 的 API:这侵犯了版权吗 ?
今年初,美国最高法院将审理一起重要案子,该案子将根据版权法确定应用编程接口(API)的法律地位。如果最高法院在Oracle对谷歌的Android平台提起的数十亿美元诉讼中判Oracle胜诉,可能会遏制竞争,并巩固主导性技术 ...
分类:   
2020年网络安全行业趋势预测
2020年网络安全行业趋势预测
2019年网络安全形势已然更加复杂,网络攻击手段更为多样,数据泄露、勒索软件、APT攻击等安全事件频发。此外,网络安全市场也在急剧膨胀,快速发展,安全产品更新快,种类多,数量激增。在2020年,网络威胁随着云技 ...
分类:   
一次非常有意思的 SQL 优化经历
一次非常有意思的 SQL 优化经历
正常情况下是先join再进行where过滤,但是我们这里的情况,如果先join,将会有70w条数据发送join,因此先执行where过滤是明智方案,现在为了排除mysql的查询优化,我自己写一条优化后的sql。
分类:   
10 个 Jenkins 实战经验,助你轻松上手持续集成
10 个 Jenkins 实战经验,助你轻松上手持续集成
众所周知,持续构建与发布是我们日常工作中要面对的的一个重要环节,目前很多公司都采用 Jenkins 来搭建符合需求的 CI/CD 流程,作为一个持续集成的开源工具,它以安装启动方便,配置简单,上手容易的特点,深受广大 ...
分类:   
什么是用户故事和验收标准?
什么是用户故事和验收标准?
在软件开发行业中,“需求”一词决定了我们的目标是什么,客户真正的需求是什么,以及是什么可以使公司业务快速增长。无论是作为开发软件产品的产品型公司还是以提供各种领域服务为主的服务型公司,最基本的、最主要 ...
分类:   

热门频道

  • 大数据
  • 商业智能
  • 量化投资
  • 科学探索
  • 创业

即将开课

 

GMT+8, 2020-2-26 00:05 , Processed in 0.108328 second(s), 19 queries .