炼数成金 大数据
订阅

大数据

Java 8中Stream API集合操作的奇技淫巧!
Java 8中Stream API集合操作的奇技淫巧!
Java 8引入了全新的Stream API。这里的Stream和I/O流不同,它更像具有Iterable的集合类,但行为和集合类又有所不同。stream是对集合对象功能的增强,它专注于对集合对象进行各种非常便利、高效的聚合操作,或者大批 ...
分类:   
为什么说流处理即未来?
为什么说流处理即未来?
最广为人知的 Flink 使用场景是流分析、连续处理(或者说渐进式处理),这些场景中 Flink 实时或者近实时的处理数据,或者采集之前提到的历史数据并且连续的对这些事件进行计算。晓伟在之前的演讲中提到一个非常好的 ...
分类:   
Spark比拼Flink:下一代大数据计算引擎之争,谁主沉浮?
Spark比拼Flink:下一代大数据计算引擎之争,谁主沉浮?
自从数据处理需求超过了传统数据库能有效处理的数据量之后,Hadoop 等各种基于 MapReduce 的海量数据处理系统应运而生。从 2004 年 Google 发表 MapReduce 论文开始,经过近 10 年的发展,基于 Hadoop 开源生态或者 ...
分类:   
Flink 原理与实现:架构和拓扑概览
Flink 原理与实现:架构和拓扑概览
当 Flink 集群启动后,首先会启动一个 JobManger 和一个或多个的 TaskManager。由 Client 提交任务给 JobManager,JobManager 再调度任务到各个 TaskManager 去执行,然后 TaskManager 将心跳和统计信息汇报给 JobMa ...
分类:   
让女友情绪可视化的Python大招
让女友情绪可视化的Python大招
好不容易有了女朋友,可相处起来总是磕磕碰碰。有时候,你很想关心她,但是你太忙了,以至于她一直抱怨,觉得你不够关心她。你暗自下决心,下次一定要准时发消息给她,哪怕是几句话,可是你又忘记了。你觉得自己很委 ...
分类:   
世界上最好的编辑器Vim:1700多页数学笔记是如何实时完成的
世界上最好的编辑器Vim:1700多页数学笔记是如何实时完成的
一般你是用手写还是 MarkDown 做数学笔记?在这篇文章中,作者介绍了如何用 LaTex 和 Vim 实时做数学笔记,通过一系列炫酷的技巧,不论是表达式板书还是图像绘制,我们都能实时跟得上。在机器学习的学习过程中,很多 ...
分类:   
JavaScript 力压 Java 成最受欢迎编程语言,TypeScript 大涨!
JavaScript 力压 Java 成最受欢迎编程语言,TypeScript 大涨!
在多种趋势榜单中,Java、C、Python 已成编程语言界的新任“铁三角”。而在开发者日常使用以及讨论中,编程语言又有什么样的现状?近日,一年仅发布两次编程语言榜单的美国知名软件开发者行业分析公司 RedMonk 正式 ...
分类:   
GitHub 近 100,000 程序员“起义”:向“996”开炮!
GitHub 近 100,000 程序员“起义”:向“996”开炮!
有人注册了一个996.icu的域名,诉控互联网公司996工作制。截至发稿,已获得80000多个Star。什么是“996”工作制?每天9点到岗,一直工作到晚上9点。每周工作6天。周工作时间为最低60个小时。网站还点名58、有赞、京 ...
分类:   
简历大数据公司全员被抓,HR要注意什么?
简历大数据公司全员被抓,HR要注意什么?
日前,简历大数据公司巧达科技被警方一锅端,高管和员工全部被带走。到底发生了什么?“3月14日团队被警方带走,有HR等非核心成员回家,但核心高管依然失联中。”3月25日,一位巧达科技前员工告诉燃财经。在天眼查中 ...
分类:   
无论你准备上云还是已经上云,最好先看看这五大技术趋势!
无论你准备上云还是已经上云,最好先看看这五大技术趋势!
云计算实际上已经成为了推动数字化转型和现代化IT组合的平台。越来越多的企业正通过租用亚马逊网络服务(AWS)、微软和谷歌等厂商提供的软件,享受由此带来的业务敏捷性或成本节约等优势。事实上,大多数企业会从两 ...
分类:   
想伪装成资深程序员?知道这三个数据结构就够了
想伪装成资深程序员?知道这三个数据结构就够了
程序员面试展示什么最重要?当时是你渊博的计算机学识,以及聪明的小脑瓜。如果你学富五车,上知深度学习, 下知财务会计,那短短数小时也绝不够你表演。所以,你一定得知晓面试官的套路,随口丢出几个应景的“冷知 ...
分类:   
关于 Redis 的一些新特性、使用建议和最佳实践
关于 Redis 的一些新特性、使用建议和最佳实践
redis从2009年诞生到现在已经走过将近10年,从最开始大家在讨论nosql和传统关系数据库孰优孰劣,到现在大家谈起分布式锁,缓存纷纷将Redis作为其第一选择,服务端面试中Redis也作为一项必备能力,而如今Redis 5.0已 ...
分类:   
Oracle大举裁减工程师团队,或涉及上万人
Oracle大举裁减工程师团队,或涉及上万人
本周Oracle效仿IBM的做法,实行未对外宣布的裁员,期望通过重组并向云计算转型来优化公司,对裁员一事几乎没有承认。昨天Oracle挥起了裁员利斧。这家公司并没有透露确切的裁员人数和具体岗位,不过裁员规模显然很大 ...
分类:   
唯品会实时计算平台的演进之路
唯品会实时计算平台的演进之路
先介绍一下我们整个平台的现状,按计算的话,分为Storm、Spark、Flink三个主要的计算引擎,Flink相应的应用数量目前少一些,不过按照整个计算引擎的发展方式,后续我们还是希望以Flink为主做相应的业务推进。实时推 ...
分类:   
x86 和 ARM 的 Python 爬虫速度对比
x86 和 ARM 的 Python 爬虫速度对比
之所以现在网络爬虫的影响力如此巨大,就是因为网络爬虫可以被用于追踪客户的情绪和趋向、搜寻空缺的职位、监控房地产的交易,甚至是获取 UFC 的比赛结果。除此以外,还有很多意想不到的用途。对于有这方面爱好的人 ...
分类:   
EQT从Micro Focus手中买下了SUSE,SUSE将何去何从?
EQT从Micro Focus手中买下了SUSE,SUSE将何去何从?
EQT Partners已经完成从Micro Focus收购SUSE。该交易于2018年7月首次公布,EQT向该Linux和开源提供商支付了25亿美元。在Micro Focus的手中,SUSE开始迷失方向,特别是在Micro Focus与HPE达成了交易之后。而现在SUSE ...
分类:   
SAP HANA的下半场来了?
SAP HANA的下半场来了?
SAP HANA是一款能够同时处理各种类型的事务和分析数据,并提供内置的高级分析引擎和多模式数据处理引擎的业务数据平台,用于开发打造智慧企业所需的下一代应用。众所周知,传统分析型数据库软件的基础是数据仓库,而 ...
分类:   
中台,都他妈被你们说糊涂了,文内才是正宗解释,别摸石头过河了,石头早就有了
中台,都他妈被你们说糊涂了,文内才是正宗解释,别摸石头过河了,石头早就有了
中台这个词最初来源于阿里。阿里为啥要中台。没办法啊。京东提出过一个概念叫:无界零售。也就是说,消费者流量在哪里,哪里就有京东的商品购买插入。所以京东有个平台叫:京东商品开放平台,你可以调用Open API在你 ...
分类:   
超越Java,Python正式登顶世界第一编程语言
超越Java,Python正式登顶世界第一编程语言
编程语言流行指数(PYPL)排行榜近日公布了2019年2月份榜单。在最新一期榜单上,Python的份额高达26.42%,稳居第一,并且猛增5.2%,同时成为增长势头最好的语言。而被挤到第二的Java,目前份额为21.2%,同比下跌1.3 ...
分类:   
99美元AI计算机来了!一文看尽英伟达昨夜大批硬核新品
99美元AI计算机来了!一文看尽英伟达昨夜大批硬核新品
计算图形:推出端到端平台CUDA-X AI,宣布图灵RTX将于4月4日登陆Unity,发布全新协作平台NVIDIA OMNIVERSE,发布拥有40个图灵GPU的8U RTX服务器和RTX POD。I和HPC:使用Omni-Sci数据库快速将原生数据转换为可视化数 ...
分类:   
Python爬虫库-BeautifulSoup的使用
Python爬虫库-BeautifulSoup的使用
Beautiful Soup是一个可以从HTML或XML文件中提取数据的Python库,简单来说,它能将HTML的标签文件解析成树形结构,然后方便地获取到指定标签的对应属性。通过Beautiful Soup库,我们可以将指定的class或id值作为参数 ...
分类:   
你可能不太会用的10个Git命令
你可能不太会用的10个Git命令
本文讨论的是开发人员、数据科学家或产品经理应该了解的各种 Git 命令。我们将了解该如何用 Git 进行检查、删除和整理操作。我们还将介绍如何用 Bash 别名和 Git 编辑器配置来逃避 Vim 以节省时间。如果你不熟悉基本 ...
分类:   
MySQL自动化部署的设计方案
MySQL自动化部署的设计方案
有的同学会觉得安装部署应该是很容易的一件事情,其实应该是这样的,但是在实际工作中会发现有很多的因素导致安装部署成为了一种耗时的工作。主要的原因在于数据库本身的安装部署是技术可控的,在这些因素之外,其实 ...
分类:   
解读NoSQL最新现状和趋势:云NoSQL数据库将成重要增长引擎
解读NoSQL最新现状和趋势:云NoSQL数据库将成重要增长引擎
NoSQL最早起源于1998年,但从2009年开始,NoSQL真正开始逐渐兴起和发展。回望历史应该说NoSQL数据库的兴起,完全是十年来伴随互联网技术,大数据数据的兴起和发展,NoSQL在面临大数据场景下相对于关系型数据库运用, ...
分类:   
5G 将是一个彻底的失败通信技术
5G 将是一个彻底的失败通信技术
无线通信产业已经发展了四代,目前正处于5G产业化前夕,是当下到一个最热的话题,5G如何发展,前景如何,是各个方面包括学术界、产业界、投资界以及政府都非常关心的。另外,中国已经启动6G研究的消息也见诸报端,未 ...
分类:   
一致性哈希算法的理解与实践
一致性哈希算法的理解与实践
一致哈希是一种特殊的哈希算法。在使用一致哈希算法后,哈希表槽位数(大小)的改变平均只需要对 K/n个关键字重新映射,其中K是关键字的数量, n是槽位数量。然而在传统的哈希表中,添加或删除一个槽位的几乎需要对 ...
分类:   
闪存存储器指南
闪存存储器指南
在2019年,关于固态硬盘(SSD)与机械硬盘(HDD)的争论基本已经结束:尽管HDD硬盘仍然占据了大多数数据中心媒体的80%,而且磁带仍然处于领先地位,但闪存和SSD硬盘的部署正在以惊人的速度增长。随着企业存储市场的增长 ...
分类:   
2019年关于存储技术的六大预测
2019年关于存储技术的六大预测
走过的2018年可以说是存储行业变数最多的一年,而迎来的2019年则是距离十年变革终点最近的一年,我们一直在说存储技术领域正在发生颠覆性变化。但其实大多数颠覆性变化没能经不起时间的检验。但据分析机构MSys Techn ...
分类:   
《Gartner2019年BI及分析平台魔力象限》的深入解读
《Gartner2019年BI及分析平台魔力象限》的深入解读
魔力象限是Gartner用于分析行业中厂商的一个工具,包含领导者、挑战值、有远见者和特定领域者四个象限,依据Gartner预先定义的一些标准来划分。所谓“执行力”,包含产品与服务的整体可行性、销售执行力与定价、市场 ...
分类:   
第一次有人把5G讲得这么简单明了!
第一次有人把5G讲得这么简单明了!
简单说,5G就是第五代通信技术,主要特点是波长为毫米级,超宽带,超高速度,超低延时。1G实现了模拟语音通信,大哥大没有屏幕只能打电话;2G实现了语音通信数字化,功能机有了小屏幕可以发短信了;3G实现了语音以外 ...
分类:   

热门频道

  • 大数据
  • 商业智能
  • 量化投资
  • 科学探索
  • 创业

即将开课

 

GMT+8, 2019-12-15 00:06 , Processed in 0.128184 second(s), 19 queries .