炼数成金 大数据
订阅

大数据

99美元AI计算机来了!一文看尽英伟达昨夜大批硬核新品
99美元AI计算机来了!一文看尽英伟达昨夜大批硬核新品
计算图形:推出端到端平台CUDA-X AI,宣布图灵RTX将于4月4日登陆Unity,发布全新协作平台NVIDIA OMNIVERSE,发布拥有40个图灵GPU的8U RTX服务器和RTX POD。I和HPC:使用Omni-Sci数据库快速将原生数据转换为可视化数 ...
分类:   
Python爬虫库-BeautifulSoup的使用
Python爬虫库-BeautifulSoup的使用
Beautiful Soup是一个可以从HTML或XML文件中提取数据的Python库,简单来说,它能将HTML的标签文件解析成树形结构,然后方便地获取到指定标签的对应属性。通过Beautiful Soup库,我们可以将指定的class或id值作为参数 ...
分类:   
你可能不太会用的10个Git命令
你可能不太会用的10个Git命令
本文讨论的是开发人员、数据科学家或产品经理应该了解的各种 Git 命令。我们将了解该如何用 Git 进行检查、删除和整理操作。我们还将介绍如何用 Bash 别名和 Git 编辑器配置来逃避 Vim 以节省时间。如果你不熟悉基本 ...
分类:   
MySQL自动化部署的设计方案
MySQL自动化部署的设计方案
有的同学会觉得安装部署应该是很容易的一件事情,其实应该是这样的,但是在实际工作中会发现有很多的因素导致安装部署成为了一种耗时的工作。主要的原因在于数据库本身的安装部署是技术可控的,在这些因素之外,其实 ...
分类:   
解读NoSQL最新现状和趋势:云NoSQL数据库将成重要增长引擎
解读NoSQL最新现状和趋势:云NoSQL数据库将成重要增长引擎
NoSQL最早起源于1998年,但从2009年开始,NoSQL真正开始逐渐兴起和发展。回望历史应该说NoSQL数据库的兴起,完全是十年来伴随互联网技术,大数据数据的兴起和发展,NoSQL在面临大数据场景下相对于关系型数据库运用, ...
分类:   
5G 将是一个彻底的失败通信技术
5G 将是一个彻底的失败通信技术
无线通信产业已经发展了四代,目前正处于5G产业化前夕,是当下到一个最热的话题,5G如何发展,前景如何,是各个方面包括学术界、产业界、投资界以及政府都非常关心的。另外,中国已经启动6G研究的消息也见诸报端,未 ...
分类:   
一致性哈希算法的理解与实践
一致性哈希算法的理解与实践
一致哈希是一种特殊的哈希算法。在使用一致哈希算法后,哈希表槽位数(大小)的改变平均只需要对 K/n个关键字重新映射,其中K是关键字的数量, n是槽位数量。然而在传统的哈希表中,添加或删除一个槽位的几乎需要对 ...
分类:   
闪存存储器指南
闪存存储器指南
在2019年,关于固态硬盘(SSD)与机械硬盘(HDD)的争论基本已经结束:尽管HDD硬盘仍然占据了大多数数据中心媒体的80%,而且磁带仍然处于领先地位,但闪存和SSD硬盘的部署正在以惊人的速度增长。随着企业存储市场的增长 ...
分类:   
2019年关于存储技术的六大预测
2019年关于存储技术的六大预测
走过的2018年可以说是存储行业变数最多的一年,而迎来的2019年则是距离十年变革终点最近的一年,我们一直在说存储技术领域正在发生颠覆性变化。但其实大多数颠覆性变化没能经不起时间的检验。但据分析机构MSys Techn ...
分类:   
《Gartner2019年BI及分析平台魔力象限》的深入解读
《Gartner2019年BI及分析平台魔力象限》的深入解读
魔力象限是Gartner用于分析行业中厂商的一个工具,包含领导者、挑战值、有远见者和特定领域者四个象限,依据Gartner预先定义的一些标准来划分。所谓“执行力”,包含产品与服务的整体可行性、销售执行力与定价、市场 ...
分类:   
第一次有人把5G讲得这么简单明了!
第一次有人把5G讲得这么简单明了!
简单说,5G就是第五代通信技术,主要特点是波长为毫米级,超宽带,超高速度,超低延时。1G实现了模拟语音通信,大哥大没有屏幕只能打电话;2G实现了语音通信数字化,功能机有了小屏幕可以发短信了;3G实现了语音以外 ...
分类:   
架构演进这件事儿,和吃火锅是一样儿的
架构演进这件事儿,和吃火锅是一样儿的
对于搞架构的技术人来说,一起吃个火锅,喝个酒,聊个天,技术上的很多解决思路就出来了,一家5口人围着一张大桌子吃饭,这叫单体架构。不想在家吃饭,去河底捞下馆子,这叫需求多样性。厨房里多人分工洗菜和做菜, ...
分类:   
被质疑“滥用许可和特权”,AWS 和 Oracle 被 MariaDB 点名吐槽
被质疑“滥用许可和特权”,AWS 和 Oracle 被 MariaDB 点名吐槽
据 ZDNet 报道,在近日曼哈顿金融区举行的 MariaDB用户与开发者大会上,MariaDB CEO Michael Howard 毫不留情地抨击云厂商在开源社区滥用许可和特权,不回馈开源社区。Howard 吐槽大型私有云公司就是在「露天开采开 ...
分类:   
5000量子位支持量子编程!D-Wave争议中推出下一代量子计算平台
5000量子位支持量子编程!D-Wave争议中推出下一代量子计算平台
近日,全球量子商用化重要参与者 D-Wave 公司又有大动作:推出其 5000 量子比特量子计算的发展蓝图。D-Wave 下一代量子计算平台的各个组成部分将计划在 2020 年中进入市场。其中包括了研发中的量子处理器(Quantum C ...
分类:   
5G商用前夜,芯片厂、运营商、设备方共下一盘大棋
5G商用前夜,芯片厂、运营商、设备方共下一盘大棋
5G蓄势待发,利益链条和玩家版图越发清晰。「就是这里,对,再深入一些。」在巴萨罗那的世界移动通信大会的会议中心讲台上,来自西班牙的医生,胃肠外科主任Antonio de Lacy在屏幕上指划出肠道神经所在的位置。屏幕 ...
分类:   
浅析Redis分布式集群倾斜问题
浅析Redis分布式集群倾斜问题
对于分布式系统而言,整个集群处理请求的效率和存储容量,往往取决于集群中响应最慢或存储增长最快的节点。所以在系统设计和容量规划时,我们尽量保障集群中各节点的“数据和请求分布均衡“。但在实际生产系统中,出 ...
分类:   
RESTful 架构基础
RESTful 架构基础
REST(Representational State Transfer)架构风格是一种世界观,把信息提升为架构中的一等公民。通过 REST 可以实现系统的高性能、可伸缩、通用性、简单性、可修改性和可扩展等特性。这篇文章解释了主要的 HTTP 操 ...
分类:   
利用“爬虫”非法获取数据案评析:不完美法律制度下的解决方案
利用“爬虫”非法获取数据案评析:不完美法律制度下的解决方案
2018年9月,北京市海淀区人民法院对全国首例利用“爬虫技术”侵入计算机系统抓取数据案作出判决。本案爬虫软件在数据抓取的过程中,使用了伪造device_id绕过服务器的身份校验,伪造UA及IP绕过服务器的访问频率限制等 ...
分类:   
定义为“AI计算公司”,业绩大幅下滑的英伟达新变量在哪?
定义为“AI计算公司”,业绩大幅下滑的英伟达新变量在哪?
1999年,英伟达发明了 GPU,20年后今天,GPU让英伟达攀至行业顶峰。然而,急速膨胀后潜藏的危机,也增加了这家明星公司的焦虑感。今年2月15日,英伟达公布了 2019 财年第四季度及全年财报,收入达 22.1 亿美元,较去 ...
分类:   
HBase Rowkey 设计指南
HBase Rowkey 设计指南
我们常说看一张 HBase 表设计的好不好,就看它的 RowKey 设计的好不好。可见 RowKey 在 HBase 中的地位。那么 RowKey 到底是什么?RowKey 的特点如下:类似于 MySQL、Oracle中的主键,用于标示唯一的行;完全是由用 ...
分类:   
列式存储和行式存储它们真正的区别是什么
列式存储和行式存储它们真正的区别是什么
分析类查询往往只查询一个表里面很少的几个字段,Column-Store只需要从磁盘读取用户查询的Column,而Row-Store读取每一条记录的时候你会把所有Column的数据读出来,在IO上Column-Store比Row-Store效率高很多,因此性 ...
分类:   
分布式快照算法: Chandy-Lamport 算法
分布式快照算法: Chandy-Lamport 算法
Spark 的 Structured Streaming 的 Continuous Processing Mode 的容错处理使用了分布式快照(Distributed Snapshot)算法 Chandy-Lamport 算法,那么分布式快照算法可以用来解决什么问题呢?简单来说就是用来在缺乏 ...
分类:   
HBase 协处理器入门及实战
HBase 协处理器入门及实战
HBase 和 MapReduce 有很高的集成,我们可以使用 MR 对存储在 HBase 中的数据进行分布式计算。但是在很多情况下,例如简单的加法计算或者聚合操作(求和、计数等),如果能够将这些计算推送到 RegionServer,这将大 ...
分类:   
5 个面向新手的 Linux 发行版
5 个面向新手的 Linux 发行版
从最初的 Linux 到现在,Linux 已经发展了很长一段路。但是,无论你曾经多少次听说过现在使用 Linux 有多容易,仍然会有表示怀疑的人。而要真的承担得其这份声明,桌面必须足够简单,以便不熟悉 Linux 的人也能够使 ...
分类:   
Kubernetes实战——谈谈微博应对春晚等突发峰值流量的经验
Kubernetes实战——谈谈微博应对春晚等突发峰值流量的经验
2016年微博平台实现基于混合云的弹性平台DCP,提升了Feed、手机微博、广告、搜索、话题、视频、直播等多个核心业务热点应对能力。2017年微博平台率先探索基于Kubernetes的PAAS层弹性混合部署解决方案,并且积极的和 ...
分类:   
是否值得付费?Oracle,Open JDK等四大JVM性能全面对比
是否值得付费?Oracle,Open JDK等四大JVM性能全面对比
市面上可供选择的JVM发行版还是有不少的。选择合适的JVM需要考虑不同的因素。性能是其中一个重要的因素。靠谱的性能研究是很困难的。在本文中,我创建了一个测试,在不同的JVM上执行对比测试。测试程序包括Spring Bo ...
分类:   
历时三年,美图全面容器化踩过的坑
历时三年,美图全面容器化踩过的坑
单体容器如集装箱,它统一的标准方便了调度运输。Kubernetes提供了对集装进行集中调度的码头和轮渡,让一切井然有序并且易于实施。容器基础平台则好比基于容器和kubernetes之上的完整的运输系统,它需要集装箱,码头 ...
分类:   
MySQL性能突发事件问题排查技巧
MySQL性能突发事件问题排查技巧
作为DBA在面对性能上突发问题的时候,是否出现过束手无策,无从下手的经历。 其实性能无非问题点在于存储、操作系统, 应用程序,数据库 等方面。性能分析问题 并没有想象的那么难,当了解到一些常用的Linux 系统命 ...
分类:   
TiDB 在摩拜单车的深度实践及应用
TiDB 在摩拜单车的深度实践及应用
摩拜单车 2017 年开始将 TiDB 尝试应用到实际业务当中,根据业务的不断发展,TiDB 版本快速迭代,我们将 TiDB 在摩拜单车的使用场景逐渐分为了三个等级:P0 级核心业务:线上核心业务,必须单业务单集群,不允许多个 ...
分类:   
2018年阿里巴巴关于Java重要开源项目汇总
2018年阿里巴巴关于Java重要开源项目汇总
Spring Cloud Alibaba 致力于提供分布式应用服务开发的一站式解决方案。此项目包含开发分布式应用服务的必需组件,方便开发者通过 Spring Cloud 编程模型轻松使用这些组件来开发分布式应用服务。依托 Spring Cloud A ...
分类:   

热门频道

  • 大数据
  • 商业智能
  • 量化投资
  • 科学探索
  • 创业

即将开课

 

GMT+8, 2019-8-20 06:28 , Processed in 0.138177 second(s), 19 queries .