炼数成金 大数据
订阅

大数据

使用 Python 分析《我不是药神》豆瓣电影短评
使用 Python 分析《我不是药神》豆瓣电影短评
小爬怡情,中爬伤身,强爬灰灰。爬虫有风险,使用请谨慎,可能是这两天爬豆瓣电影爬多了,今天早上登录的时候提示号被封了(我用自己帐号爬的,是找死呢还是在找死呢 ...),好在后面发完短信后又解封了。之前的文章 ...
分类:   
Python3 vs. Python2 大作战,谁将是性能之王?
Python3 vs. Python2 大作战,谁将是性能之王?
哪个版本的 Python 最快?Python 3 真的比 Python 2 慢吗?Python 3 最快的版本是哪个?当然,这些问题由多种因素决定,其中的主要的因素是什么呢?我们又如何为自己的应用寻找最快的 Python 版本呢?带着这些问题, ...
分类:   
Python自动生成表情包,Python在手,从此斗图无敌手!
Python自动生成表情包,Python在手,从此斗图无敌手!
之前一直以为图像的自动处理,要靠JavaScript脚本控制PS或者AI;后来发现Python其实也可以做一些简单的图像处理,虽然可能比不上 MATLAB 强大。于是对于图像处理,复杂的部分依然在PS或者AI中人工完成,简单的处理就 ...
分类:   
服务器虚拟化的未来在哪里?
服务器虚拟化的未来在哪里?
服务器虚拟化能够帮助对抗服务器消耗过多资源、更好地利用计算机能力、控制能源费用、以及提供数据中心敏捷性和灵活性。有这样一些技术,一方面它们在概念上是十分简单的,但另一方面却对企业数据中心的影响十分深远 ...
分类:   
GitHub如何将自己卖出了75亿美元的高价?
GitHub如何将自己卖出了75亿美元的高价?
GitHub发现了世界上数百万开发者都在努力解决的一个重大问题即如何在代码上进行协作,针对此,他们设计出了符合市场需求的优质解决方案,从而取得了极大的业务增长和成功。通过在Git(一个开源项目)周围构建SaaS服务 ...
分类:   
Java 程序员最爱 Kotlin?
Java 程序员最爱 Kotlin?
Kotlin是Google为Java虚拟机创造的编程语言,由Google提供支持,JetBrains负责开发。这种语言非常高效,而且为Android开发者面临的各种问题提供多种解决方案。Kotlin是一种静态类型的开源编程语言,非常适合服务器端 ...
分类:   
2018年已过半,Kubernetes和云原生的巨浪要把云计算带向何处
2018年已过半,Kubernetes和云原生的巨浪要把云计算带向何处
Kubernetes,云原生,service mesh,这些惊人的全球增长趋势,令人欣喜之余迫不及待想要看看云原生在未来究竟会发展出怎样一派繁荣的景象。Kubernetes 作为 CNCF 的核心项目,也是第一个顺利进入商用 Ready 的项目, ...
分类:   
让Python之父愤然退位的PEP572究竟是什么?
让Python之父愤然退位的PEP572究竟是什么?
Python之父Guido van Rossum表示,他累了。Guido van Rossum—他在1989年创建了Python编程语言,被戏称为“仁慈的生活独裁者”(benevolent dictator for life),并将Python语言推广到全球,现在已经宣布卸任,并且明 ...
分类:   
软件定义存储(SDS)2017市场格局分析
软件定义存储(SDS)2017市场格局分析
iSDS的目的就是代替传统的存储(如VMware vSAN、华为的FusionStorage等等),而mSDS只是一种带外的存储虚拟化软件而已(如EMC的ViPR,华为的OceanStor DJ)和带内的异构虚拟化软件(如VPLEX软件部分,SVC软件部分等 ...
分类:   
Flume+Kafka+Storm+Redis构建大数据实时处理系统
Flume+Kafka+Storm+Redis构建大数据实时处理系统
从构建实时处理系统的角度出发,我们需要做的是让数据在各个不同的集群系统之间打通(从上面的图示中也能很好地说明这一点),即需要做各个系统之前的整合,包括Flume与Kafka的整合,Kafka与Storm的整合。当然,各个 ...
分类:   
观察 Stack Overflow 趋势的新姿势: 看标签的综合浏览量
观察 Stack Overflow 趋势的新姿势: 看标签的综合浏览量
根据 Stack Overflow 的趋势统计工具,网站中打上 tensorflow 标签的问题现在比 git 的更受欢迎。那这个数据是否有什么意义?虽然 tensorflow 获得了更多的关注,但 git 是开发者中最流行的开发工具之一 —— 无论是 ...
分类:   
可能是目前最详细的Redis内存模型及应用解读
可能是目前最详细的Redis内存模型及应用解读
Redis是目前最火爆的内存数据库之一,通过在内存中读写数据,大大提高了读写速度,可以说Redis是实现网站高并发不可或缺的一部分。我们使用Redis时,会接触Redis的5种对象类型:字符串、哈希、列表、集合、有序集合 ...
分类:   
让 TensorFlow 估算器的推断提速百倍,我是怎么做到的?
让 TensorFlow 估算器的推断提速百倍,我是怎么做到的?
TensorFlow 估算器提供了一套中阶 API 用于编写、训练与使用机器学习模型,尤其是深度学习模型。在这篇博文中,我们描述了如何通过使用异步执行来避免每次调用预测方法时都需重载模型,从而让 TF 估算器的推断提速超 ...
分类:   
为什么 Python 开发人员应该使用 Pipenv
为什么 Python 开发人员应该使用 Pipenv
Pipenv 是由 Kenneth Reitz 在一年多前创建的“面向开发者而生的 Python 开发工作流”,它已经成为管理软件包依赖关系的 Python 官方推荐资源。但是对于它解决了什么问题,以及它如何比使用 pip 和 requirements.txt ...
分类:   
Python 字节码介绍
Python 字节码介绍
Python 经常被介绍为它是一个解释型语言 —— 其中一个原因是在程序运行时,你的源代码被转换成 CPU 的原生指令 —— 但这样的看法只是部分正确。Python 与大多数解释型语言一样,确实是将源代码编译为一组虚拟机指 ...
分类:   
说说大数据智能
说说大数据智能
大数据智能,简单讲,就是行业大数据和人工智能技术的融合。各行各业正在加速变革,以适应大数据智能技术带来的挑战。基于大数据深度学习的阿尔法狗(AlphaGo),不仅仅在围棋领域战胜了人类顶尖高手,向医疗健康领 ...
分类:   
数据堂倒卖百亿用户信息被连锅端
数据堂倒卖百亿用户信息被连锅端
你的信息又双叒叕又被卖了!数据堂倒卖百亿用户信息被连锅端,这次卖给了微软英特尔谷歌非死不可!数据堂在8个月时间内,日均传输公民个人信息1.3亿余条,累计传输数据压缩后约为4000GB左右。随后,数据堂将这些非法 ...
分类:   
TIOBE 7月编程语言排行榜:C#被VB.NET反超,Objective-C回前十
TIOBE 7月编程语言排行榜:C#被VB.NET反超,Objective-C回前十
所谓铁打的 Java、C、C++,流水的编程语言,应该指的就是 TIOBE 编程语言排行榜了。当然近期大火的 Python 依然站稳了脚跟,位居第四名。不过,C# 竟被 Visual Basic .NET 反超,取代了其第五名的位置。同属微软开发 ...
分类:   
腾讯的蓝鲸平台是怎么做持续集成和部署的?
腾讯的蓝鲸平台是怎么做持续集成和部署的?
蓝鲸是腾讯游戏沉淀多年的技术运营支撑体系,承担着数百款业务线上运营的使命。如图所示,蓝鲸的服务支撑覆盖到娱乐、文学、游戏、影视等不同领域的业务。这些业务来自于腾讯自研或者代理的,研发团队间的技术栈以及 ...
分类:   
如何Docker化任意一个应用?你需要参照这10步
如何Docker化任意一个应用?你需要参照这10步
这是一篇关于如何 Docker 化任何应用程序的十步清单。网上有很多关于如何将应用 Docker 化的教程,为什么我还要再写一个呢?我见过的大部分教程都是限定在某种特定技术(例如 Java 或者 Python),可能无法满足读者 ...
分类:   
监控系统的前世今生
监控系统的前世今生
随着互联网的发展,监控系统也得到了发展。从最早期的网络监控、系统监控,发展到现在的业务监控、日志监控、性能监控、代码监控、全链路监控等,并在监控数据的基础上,逐步发展出了APM(应用性能管理)、AIOps(智 ...
分类:   
聊聊Netflix技术那些大胆的创新
聊聊Netflix技术那些大胆的创新
微服务很多公司(eBay, Amazon, BAT)都有,甚至比Netflix做得更早,但Netflix大概是大规模生产级微服务做得最杰出的。100s范围的微服务,1000s范围的每日生产变更,10,000s范围的实例,1,000,000s范围的活跃客户数,1 ...
分类:   
知乎十万级容器规模的分布式镜像仓库实践
知乎十万级容器规模的分布式镜像仓库实践
容器的核心理念在于通过镜像将运行环境打包,实现“一次构建,处处运行”,从而避免了运行环境不一致导致的各种异常。在容器镜像的发布流程中,镜像仓库扮演了镜像的存储和分发角色,并且通过 tag 支持镜像的版本管 ...
分类:   
高效学习开源项目的五大步骤!
高效学习开源项目的五大步骤!
得益于开源运动的蓬勃发展,众多技术顶尖的公司、团队或者个人通过开源的方式向技术社区贡献了许多优秀的开源项目,一方面大大促进了整体技术的发展,另一方面大大减轻了中小公司和团队在技术方面的投入压力,让团队 ...
分类:   
软件开发中开源协议详解
软件开发中开源协议详解
License是软件的授权许可,里面详尽表述了你获得代码后拥有的权利,可以对别人的作品进行何种操作,何种操作又是被禁止的。对于商业协议,或者叫法律声明、许可协议,每个软件会有自己的一套行文,由软件作者或专门 ...
分类:   
物联网系统框架介绍
物联网系统框架介绍
只有设备接入到网络里面,才能算是物联网设备。这里涉及到2个关键点:接入方式以及网络通信方式。直接接入:物联网终端设备本身具备联网能力直接接入网络,比如在设备端加入NB-IOT通信模组,2G通信模组。网关接入: ...
分类:   
Java性能优化指南及唯品会的实战
Java性能优化指南及唯品会的实战
这个Topic讲过好几次,因为GIAC全球互联网架构师大会的规格高,所以又战战兢兢的修改添补了一遍内容,是自己最满意的一个版本。 趁着VJTools开源,终于可以 “show me the code”了,顺势把围着它说的PPT也放出来了 ...
分类:   
AWS的人工智能版图
AWS的人工智能版图
AI应用层 ,Amazon Rekognition—基于深度学习的图像和视频分析,它能实现对象与场景检测、人脸分析、面部比较、人脸识别、名人识别、图片调节等功能。Amazon Polly—使用深度学习将文本转换为逼真的语音,能转换多 ...
分类:   
究竟哪个版本的Python是最快的?
究竟哪个版本的Python是最快的?
Python 3 比 Python 2 慢吗?哪个版本的 Python 3 速度最快?还有哪些措施可以提高速度?究竟哪个版本的 Python 是最快的?当然,“这取决于”多种因素,但它具体取决于什么,我们应当如何为自己的应用程序找到最快 ...
分类:   
中国手机往事
中国手机往事
加州和纽约,一直是两个不同的世界。2018年6月24日下午,一脸标志性微笑的贾跃亭出现在Faraday Future位于美国加州洛杉矶的总部,他告知全体员工FF完成20亿美元融资、并且自己将出任公司CEO的“好消息”。就在同一天 ...
分类:   

热门频道

  • 大数据
  • 商业智能
  • 量化投资
  • 科学探索
  • 创业

即将开课

 

GMT+8, 2018-8-18 02:38 , Processed in 0.141380 second(s), 19 queries .