炼数成金 大数据
订阅

大数据

想伪装成资深程序员?知道这三个数据结构就够了
想伪装成资深程序员?知道这三个数据结构就够了
程序员面试展示什么最重要?当时是你渊博的计算机学识,以及聪明的小脑瓜。如果你学富五车,上知深度学习, 下知财务会计,那短短数小时也绝不够你表演。所以,你一定得知晓面试官的套路,随口丢出几个应景的“冷知 ...
分类:   
关于 Redis 的一些新特性、使用建议和最佳实践
关于 Redis 的一些新特性、使用建议和最佳实践
redis从2009年诞生到现在已经走过将近10年,从最开始大家在讨论nosql和传统关系数据库孰优孰劣,到现在大家谈起分布式锁,缓存纷纷将Redis作为其第一选择,服务端面试中Redis也作为一项必备能力,而如今Redis 5.0已 ...
分类:   
Oracle大举裁减工程师团队,或涉及上万人
Oracle大举裁减工程师团队,或涉及上万人
本周Oracle效仿IBM的做法,实行未对外宣布的裁员,期望通过重组并向云计算转型来优化公司,对裁员一事几乎没有承认。昨天Oracle挥起了裁员利斧。这家公司并没有透露确切的裁员人数和具体岗位,不过裁员规模显然很大 ...
分类:   
唯品会实时计算平台的演进之路
唯品会实时计算平台的演进之路
先介绍一下我们整个平台的现状,按计算的话,分为Storm、Spark、Flink三个主要的计算引擎,Flink相应的应用数量目前少一些,不过按照整个计算引擎的发展方式,后续我们还是希望以Flink为主做相应的业务推进。实时推 ...
分类:   
x86 和 ARM 的 Python 爬虫速度对比
x86 和 ARM 的 Python 爬虫速度对比
之所以现在网络爬虫的影响力如此巨大,就是因为网络爬虫可以被用于追踪客户的情绪和趋向、搜寻空缺的职位、监控房地产的交易,甚至是获取 UFC 的比赛结果。除此以外,还有很多意想不到的用途。对于有这方面爱好的人 ...
分类:   
EQT从Micro Focus手中买下了SUSE,SUSE将何去何从?
EQT从Micro Focus手中买下了SUSE,SUSE将何去何从?
EQT Partners已经完成从Micro Focus收购SUSE。该交易于2018年7月首次公布,EQT向该Linux和开源提供商支付了25亿美元。在Micro Focus的手中,SUSE开始迷失方向,特别是在Micro Focus与HPE达成了交易之后。而现在SUSE ...
分类:   
SAP HANA的下半场来了?
SAP HANA的下半场来了?
SAP HANA是一款能够同时处理各种类型的事务和分析数据,并提供内置的高级分析引擎和多模式数据处理引擎的业务数据平台,用于开发打造智慧企业所需的下一代应用。众所周知,传统分析型数据库软件的基础是数据仓库,而 ...
分类:   
中台,都他妈被你们说糊涂了,文内才是正宗解释,别摸石头过河了,石头早就有了
中台,都他妈被你们说糊涂了,文内才是正宗解释,别摸石头过河了,石头早就有了
中台这个词最初来源于阿里。阿里为啥要中台。没办法啊。京东提出过一个概念叫:无界零售。也就是说,消费者流量在哪里,哪里就有京东的商品购买插入。所以京东有个平台叫:京东商品开放平台,你可以调用Open API在你 ...
分类:   
超越Java,Python正式登顶世界第一编程语言
超越Java,Python正式登顶世界第一编程语言
编程语言流行指数(PYPL)排行榜近日公布了2019年2月份榜单。在最新一期榜单上,Python的份额高达26.42%,稳居第一,并且猛增5.2%,同时成为增长势头最好的语言。而被挤到第二的Java,目前份额为21.2%,同比下跌1.3 ...
分类:   
99美元AI计算机来了!一文看尽英伟达昨夜大批硬核新品
99美元AI计算机来了!一文看尽英伟达昨夜大批硬核新品
计算图形:推出端到端平台CUDA-X AI,宣布图灵RTX将于4月4日登陆Unity,发布全新协作平台NVIDIA OMNIVERSE,发布拥有40个图灵GPU的8U RTX服务器和RTX POD。I和HPC:使用Omni-Sci数据库快速将原生数据转换为可视化数 ...
分类:   
Python爬虫库-BeautifulSoup的使用
Python爬虫库-BeautifulSoup的使用
Beautiful Soup是一个可以从HTML或XML文件中提取数据的Python库,简单来说,它能将HTML的标签文件解析成树形结构,然后方便地获取到指定标签的对应属性。通过Beautiful Soup库,我们可以将指定的class或id值作为参数 ...
分类:   
你可能不太会用的10个Git命令
你可能不太会用的10个Git命令
本文讨论的是开发人员、数据科学家或产品经理应该了解的各种 Git 命令。我们将了解该如何用 Git 进行检查、删除和整理操作。我们还将介绍如何用 Bash 别名和 Git 编辑器配置来逃避 Vim 以节省时间。如果你不熟悉基本 ...
分类:   
MySQL自动化部署的设计方案
MySQL自动化部署的设计方案
有的同学会觉得安装部署应该是很容易的一件事情,其实应该是这样的,但是在实际工作中会发现有很多的因素导致安装部署成为了一种耗时的工作。主要的原因在于数据库本身的安装部署是技术可控的,在这些因素之外,其实 ...
分类:   
解读NoSQL最新现状和趋势:云NoSQL数据库将成重要增长引擎
解读NoSQL最新现状和趋势:云NoSQL数据库将成重要增长引擎
NoSQL最早起源于1998年,但从2009年开始,NoSQL真正开始逐渐兴起和发展。回望历史应该说NoSQL数据库的兴起,完全是十年来伴随互联网技术,大数据数据的兴起和发展,NoSQL在面临大数据场景下相对于关系型数据库运用, ...
分类:   
5G 将是一个彻底的失败通信技术
5G 将是一个彻底的失败通信技术
无线通信产业已经发展了四代,目前正处于5G产业化前夕,是当下到一个最热的话题,5G如何发展,前景如何,是各个方面包括学术界、产业界、投资界以及政府都非常关心的。另外,中国已经启动6G研究的消息也见诸报端,未 ...
分类:   
一致性哈希算法的理解与实践
一致性哈希算法的理解与实践
一致哈希是一种特殊的哈希算法。在使用一致哈希算法后,哈希表槽位数(大小)的改变平均只需要对 K/n个关键字重新映射,其中K是关键字的数量, n是槽位数量。然而在传统的哈希表中,添加或删除一个槽位的几乎需要对 ...
分类:   
闪存存储器指南
闪存存储器指南
在2019年,关于固态硬盘(SSD)与机械硬盘(HDD)的争论基本已经结束:尽管HDD硬盘仍然占据了大多数数据中心媒体的80%,而且磁带仍然处于领先地位,但闪存和SSD硬盘的部署正在以惊人的速度增长。随着企业存储市场的增长 ...
分类:   
2019年关于存储技术的六大预测
2019年关于存储技术的六大预测
走过的2018年可以说是存储行业变数最多的一年,而迎来的2019年则是距离十年变革终点最近的一年,我们一直在说存储技术领域正在发生颠覆性变化。但其实大多数颠覆性变化没能经不起时间的检验。但据分析机构MSys Techn ...
分类:   
《Gartner2019年BI及分析平台魔力象限》的深入解读
《Gartner2019年BI及分析平台魔力象限》的深入解读
魔力象限是Gartner用于分析行业中厂商的一个工具,包含领导者、挑战值、有远见者和特定领域者四个象限,依据Gartner预先定义的一些标准来划分。所谓“执行力”,包含产品与服务的整体可行性、销售执行力与定价、市场 ...
分类:   
第一次有人把5G讲得这么简单明了!
第一次有人把5G讲得这么简单明了!
简单说,5G就是第五代通信技术,主要特点是波长为毫米级,超宽带,超高速度,超低延时。1G实现了模拟语音通信,大哥大没有屏幕只能打电话;2G实现了语音通信数字化,功能机有了小屏幕可以发短信了;3G实现了语音以外 ...
分类:   
架构演进这件事儿,和吃火锅是一样儿的
架构演进这件事儿,和吃火锅是一样儿的
对于搞架构的技术人来说,一起吃个火锅,喝个酒,聊个天,技术上的很多解决思路就出来了,一家5口人围着一张大桌子吃饭,这叫单体架构。不想在家吃饭,去河底捞下馆子,这叫需求多样性。厨房里多人分工洗菜和做菜, ...
分类:   
被质疑“滥用许可和特权”,AWS 和 Oracle 被 MariaDB 点名吐槽
被质疑“滥用许可和特权”,AWS 和 Oracle 被 MariaDB 点名吐槽
据 ZDNet 报道,在近日曼哈顿金融区举行的 MariaDB用户与开发者大会上,MariaDB CEO Michael Howard 毫不留情地抨击云厂商在开源社区滥用许可和特权,不回馈开源社区。Howard 吐槽大型私有云公司就是在「露天开采开 ...
分类:   
5000量子位支持量子编程!D-Wave争议中推出下一代量子计算平台
5000量子位支持量子编程!D-Wave争议中推出下一代量子计算平台
近日,全球量子商用化重要参与者 D-Wave 公司又有大动作:推出其 5000 量子比特量子计算的发展蓝图。D-Wave 下一代量子计算平台的各个组成部分将计划在 2020 年中进入市场。其中包括了研发中的量子处理器(Quantum C ...
分类:   
5G商用前夜,芯片厂、运营商、设备方共下一盘大棋
5G商用前夜,芯片厂、运营商、设备方共下一盘大棋
5G蓄势待发,利益链条和玩家版图越发清晰。「就是这里,对,再深入一些。」在巴萨罗那的世界移动通信大会的会议中心讲台上,来自西班牙的医生,胃肠外科主任Antonio de Lacy在屏幕上指划出肠道神经所在的位置。屏幕 ...
分类:   
浅析Redis分布式集群倾斜问题
浅析Redis分布式集群倾斜问题
对于分布式系统而言,整个集群处理请求的效率和存储容量,往往取决于集群中响应最慢或存储增长最快的节点。所以在系统设计和容量规划时,我们尽量保障集群中各节点的“数据和请求分布均衡“。但在实际生产系统中,出 ...
分类:   
RESTful 架构基础
RESTful 架构基础
REST(Representational State Transfer)架构风格是一种世界观,把信息提升为架构中的一等公民。通过 REST 可以实现系统的高性能、可伸缩、通用性、简单性、可修改性和可扩展等特性。这篇文章解释了主要的 HTTP 操 ...
分类:   
利用“爬虫”非法获取数据案评析:不完美法律制度下的解决方案
利用“爬虫”非法获取数据案评析:不完美法律制度下的解决方案
2018年9月,北京市海淀区人民法院对全国首例利用“爬虫技术”侵入计算机系统抓取数据案作出判决。本案爬虫软件在数据抓取的过程中,使用了伪造device_id绕过服务器的身份校验,伪造UA及IP绕过服务器的访问频率限制等 ...
分类:   
定义为“AI计算公司”,业绩大幅下滑的英伟达新变量在哪?
定义为“AI计算公司”,业绩大幅下滑的英伟达新变量在哪?
1999年,英伟达发明了 GPU,20年后今天,GPU让英伟达攀至行业顶峰。然而,急速膨胀后潜藏的危机,也增加了这家明星公司的焦虑感。今年2月15日,英伟达公布了 2019 财年第四季度及全年财报,收入达 22.1 亿美元,较去 ...
分类:   
HBase Rowkey 设计指南
HBase Rowkey 设计指南
我们常说看一张 HBase 表设计的好不好,就看它的 RowKey 设计的好不好。可见 RowKey 在 HBase 中的地位。那么 RowKey 到底是什么?RowKey 的特点如下:类似于 MySQL、Oracle中的主键,用于标示唯一的行;完全是由用 ...
分类:   
列式存储和行式存储它们真正的区别是什么
列式存储和行式存储它们真正的区别是什么
分析类查询往往只查询一个表里面很少的几个字段,Column-Store只需要从磁盘读取用户查询的Column,而Row-Store读取每一条记录的时候你会把所有Column的数据读出来,在IO上Column-Store比Row-Store效率高很多,因此性 ...
分类:   

热门频道

  • 大数据
  • 商业智能
  • 量化投资
  • 科学探索
  • 创业

即将开课

 

GMT+8, 2019-10-19 18:08 , Processed in 0.136546 second(s), 19 queries .