炼数成金 大数据
订阅

大数据

python是如何登上编程语言排行榜榜首的
python是如何登上编程语言排行榜榜首的
在过去的两年间,Python一路高歌猛进,成功窜上“最火编程语言”的宝座。主流的深度学习框架比如TensorFlow、Theano、Keras等都是基于python开发的。Python到底是用了什么招数怼翻其他编程语言的?python为什么受到 ...
分类:   
2018年最受欢迎的3种编程语言以及他们的年薪
2018年最受欢迎的3种编程语言以及他们的年薪
JavaScript是一种动态编程语言,主要用于在网站上添加交互性。它通常被描绘为“初学者友好的”,这促进了它在开发人员社区中的使用。调查显示JavaScript是2018年的首选编程语言,占69.8%,这已经是JavaScript连续第 ...
分类:   
一篇文章搞懂 PySpark MLlib
一篇文章搞懂 PySpark MLlib
我们的目标,是要设计这么一个系统,当把一张拥有很多字段的表给系统,系统自动抽取出特征,这些特征可以给机器学习算法如SVM,贝叶斯之类的,也可以适配深度学习的要求。初看起来显得野心太大,但也不是不可能,我们 ...
分类:   
用Python语言写Spark
用Python语言写Spark
Spark 是目前大数据处理的事实标准。PySpark能让你使用Python语言来写Spark程序。我们先做一个最简单的字符数统计程序。这样我们就知道一个PySpark程序是什么样子,以及如何运转起来。在很多情况下,单机模式足够我 ...
分类:   
如何衔接Spark 和Tensorflow?
如何衔接Spark 和Tensorflow?
我们知道,Spark 目前是大数据处理组件的王者,实现了让大数据处理更轻松的远景。Tensorflow则是深度学习当之无愧最热的框架。而在现实当中,Spark 和Tensorflow的衔接往往是脱节的。我们希望保留Spark/TF各自的优势 ...
分类:   
分布式锁?架构师的这篇文章带你玩转!
分布式锁?架构师的这篇文章带你玩转!
大多数互联网系统都是分布式部署的,分布式部署确实能带来性能和效率上的提升,但为此,我们就需要多解决一个分布式环境下,数据一致性的问题。当某个资源在多系统之间,具有共享性的时候,为了保证大家访问这个资源 ...
分类:   
Oracle将于本月发布全新的Java垃圾收集器 ZGC
Oracle将于本月发布全新的Java垃圾收集器 ZGC
Java 11 的特性集合已经确定,其中包含了一些非常棒的特性。新版本提供了一个全新的垃圾回收器 ZGC,它由甲骨文开发,承诺在 TB 级别的堆上实现非常低的停顿时间。在本文中,我们将介绍甲骨文开发 ZGC 的动机、ZGC ...
分类:   
MariaDB和MySQL全面对比:选择数据库需要考虑这几点
MariaDB和MySQL全面对比:选择数据库需要考虑这几点
MySQL 和 MariaDB 都发布了各自的用户名单。使用 MySQL 的有 Facebook、Github、YouTube、Twitter、PayPal、诺基亚、Spotify、Netflix 等。使用 MariaDB 的有 Redhat、DBS、Suse、Ubuntu、1&1、Ingenico 等。有一些 ...
分类:   
一文读懂什么是Java中的自动拆装箱
一文读懂什么是Java中的自动拆装箱
基本类型,或者叫做内置类型,是Java中不同于类(Class)的特殊类型。它们是我们编程中使用最频繁的类型。Java是一种强类型语言,第一次申明变量必须说明数据类型,第一次变量赋值称为变量的初始化。
分类:   
9 月全球数据库排名:MongoDB 分数连续增长 11 个月
9 月全球数据库排名:MongoDB 分数连续增长 11 个月
DB-Engines 发布了 2018 年 9 月份的全球数据库排名,排名前六的一如既往还是 Oracle、MySQL、Microsoft SQL Server、PostgreSQL、MongoDB 和 DB2。而排名第五的 MongoDB 无疑是本月排行榜中最耀眼的一个。因为稳定 ...
分类:   
JavaScript 反调试技巧
JavaScript 反调试技巧
对于JavaScript来说,你只需要花一点时间进行调试和分析,你就能够了解到JavaScript代码段的功能逻辑。而我们所要讨论的内容,可以给那些想要分析你JavaScript代码的人增加一定的难度。不过我们的技术跟代码混淆无关 ...
分类:   
盘点: 2018上半年国内外互联网十大数据库泄露事件
盘点: 2018上半年国内外互联网十大数据库泄露事件
2018年已经过了一大半,在过去的8个月里,“数据泄露”的字眼总是活跃在我们眼前,全球各地深受数据泄露事件的困扰,已造成数以万计的损失。据《2018数据泄露损失研究》评估显示,大型数据泄露代价高昂,百万条记录 ...
分类:   
用Python分析了数千个微信昵称,我们发现90后和00后是这样的人
用Python分析了数千个微信昵称,我们发现90后和00后是这样的人
访问 英文取名 的用户基本信接口,获取 英文取名 用户微信名(NickName)、访问次数(Count)、总数据集(ResponseData),并将微信名存入文件。微信昵称为全中文的占比最多,占有42.66%,其次为其他昵称(中英文混合 ...
分类:   
Kafka实践:到底该不该把不同类型的消息放在同一个主题中?
Kafka实践:到底该不该把不同类型的消息放在同一个主题中?
如果你使用了像 Kafka 这样的流式处理平台,就要搞清楚一件事情:你需要用到哪些主题?特别是如果你要将一堆不同的事件作为消息发布到 Kafka,是将它们放在同一个主题中,还是将它们拆分到不同的主题中?Kafka 主题 ...
分类:   
深度解析什么是二维码?用Python 5行代码生成个性二维码
深度解析什么是二维码?用Python 5行代码生成个性二维码
二维码满天飞,随便扫一扫就能扫到不一样的内容。有没有好奇什么是二维码?又是怎么生成的呢?今天我们就用python 5行代码 生成一个二维码,并且是个性的二维码,想你所想的,先看效果图,准备好微信扫一扫,看看扫 ...
分类:   
原创翻译 | 物联网:互联互通如何改变我们的世界
原创翻译 | 物联网:互联互通如何改变我们的世界
自1990年代互联网首次普及以来,我们世界的互联性不断增强。现在,不仅仅是人们在通过互联网联系,我们的设备也是如此。物联网(通常缩写为IoT)描述了一个由人和对象组成的复杂的网络,它们通过无线通信、传感器和嵌 ...
分类:   
2018 Q2 SaaS 市场份额排名:微软、Salesforce、Adobe
2018 Q2 SaaS 市场份额排名:微软、Salesforce、Adobe
软件即服务(SaaS)继续迅猛增长,微软公司在这个重要的云计算市场扩大领先优势。这来自Synergy研究集团周二公布的最新研究结果。SaaS是一种软件许可和交付模式,软件的许可证采用订阅模式来购买,软件集中托管在云 ...
分类:   
Redis杀死许可证,闭源的有:RediSearch、Redis Graph等
Redis杀死许可证,闭源的有:RediSearch、Redis Graph等
原因是云巨头们使用开源工具,却不给予任何回报。数据库开发商Redis Labs本周将该公司开发的Redis模块由AGPL改成了Apache v2.0和Commons Clause(共用条款)相结合的许可证,因而对销售许可证涵盖的软件作了限制。许 ...
分类:   
盘点 Python 的目标受众
盘点 Python 的目标受众
几年前,我在 python-dev 邮件列表中,以及在活跃的 CPython 核心开发人员和认为参与这一过程不是有效利用个人时间和精力的人中强调说,“CPython 的发展太快了也太慢了” 是很多冲突的原因之一。我一直认为事实确实 ...
分类:   
JavaScript 的 API 设计原则
JavaScript 的 API 设计原则
相关的接口保持一致的风格,一整套 API 如果传递一种熟悉和舒适的感觉,会大大减轻开发者对新工具的适应性。 命名这点事:既要短,又要自描述,最重要的是保持一致性 “在计算机科学界只有两件头疼的事:缓存失效和 ...
分类:   
数据库的这些性能优化,你做了吗?
数据库的这些性能优化,你做了吗?
由于互联网业务场景,大多数是读多写少,因此进行数据库的读写分离是一件非常简单且有效率的方案。读写分离简单点来说就是把对数据的读操作和写操作进行分开来,让这两种操作去访问不同的数据库,这样的话,就可以减 ...
分类:   
为什么我会舍弃 Python 依靠 Go?
为什么我会舍弃 Python 依靠 Go?
近日,Python 被纳入全国计算机等级考试科目、编入了小学教材、获得了 2018 年顶级编程语言荣誉,可以说,Python 要多火就有多火。而本文并非为此火上添油,而是适时地为 Python 浇了一盆凉水,稳步发展才是一门编程 ...
分类:   
Python 爬取北京二手房数据,分析北漂族买得起房吗?
Python 爬取北京二手房数据,分析北漂族买得起房吗?
房价高是北漂们一直关心的话题,本文就对北京的二手房数据进行了分析。本文主要分为两部分:Python爬取赶集网北京二手房数据,R对爬取的二手房房价做线性回归分析,适合刚刚接触PythonR的同学们学习参考。Python爬取 ...
分类:   
最新编程语言排行榜出炉:Swift和Kotlin好像开始凉了
最新编程语言排行榜出炉:Swift和Kotlin好像开始凉了
苹果的Swift和安卓开发者喜欢的Kotlin,是近年来增长最快的两种编程语言。据分析公司RedMonk统计,2014年诞生的Swift,跻身热度榜单Top 15,是所有语言中用时最短的。最好成绩是第10名。而2016年发布的Kotlin,转年1 ...
分类:   
关于编程语言 Julia,开发团队有这些想告诉你
关于编程语言 Julia,开发团队有这些想告诉你
编程语言排行榜每月都有,排名前 10 常见 Java,JavaScript,Python,PHP 和 C#等,大家已不足为奇。但是在 RedMonk 的语言排行榜中,开源编程语言 Julia 成功引起了大家的注意,连续四个季度增长(52,40,39,36), ...
分类:   
Spark Streaming VS Flink
Spark Streaming VS Flink
Spark Streaming 是微批处理,运行的时候需要指定批处理的时间,每次运行 job 时处理一个批次的数据。Flink 是基于事件驱动的,事件可以理解为消息。事件驱动的应用程序是一种状态应用程序,它会从一个或者多个流中 ...
分类:   
弃用 Oracle!
弃用 Oracle!
近日,DB-Engines 最新发布了 2018 年 8 月数据库排名榜,Oracle 稳居第一,同时是本月涨幅最大的数据库技术,涨幅高达 34.24,狠甩第二名 MySQL。然而万万没想到的是,使用率位居第一的 Oracle 在国内外科技巨头的 ...
分类:   
用图表和实例解释 Await 和 Async
用图表和实例解释 Await 和 Async
JavaScript ES7 中的 async / await 让多个异步 promise 协同工作起来更容易。如果要按一定顺序从多个数据库或者 API 异步获取数据,你可能会以一堆乱七八糟的 promise 和回调函数而告终。而 async / await 结构让我 ...
分类:   
留给传统 DBA 的时间不多了?看饿了么如何构建数据库平台自动化
留给传统 DBA 的时间不多了?看饿了么如何构建数据库平台自动化
从时间轴上看我们每年会有一个比较大的前进,我们从人肉->工具化->平台化->自助化只用了两年半时间完成全部迭代,其中平台化&自助化+数据库多活改造我们一口气用了8个月的时间完成全部开发及改造工作。在完 ...
分类:   
如何在 Git 中重置、恢复,返回到以前的状态
如何在 Git 中重置、恢复,返回到以前的状态
使用 Git 工作时其中一个鲜为人知(和没有意识到)的方面就是,如何轻松地返回到你以前的位置 —— 也就是说,在仓库中如何很容易地去撤销那怕是重大的变更。在本文中,我们将带你了解如何去重置、恢复和完全回到以 ...
分类:   

热门频道

  • 大数据
  • 商业智能
  • 量化投资
  • 科学探索
  • 创业

即将开课

 

GMT+8, 2019-4-21 16:04 , Processed in 0.139793 second(s), 19 queries .