炼数成金 大数据
订阅

大数据

无人化运维离我们有多远?阿里智能化运帷平台深度揭秘
无人化运维离我们有多远?阿里智能化运帷平台深度揭秘
运维是很大的一个概念,里面有很多专业,这5个能力层次每一层就有很多产品组成。从云效2.0-智能化运维平台(以下简称:StarOps)产品的角度来看, 我们可以划分为两个平台,基础运维平台和应用运维平台。基础运维平 ...
分类:   
如何根据数据冷热程度分层存储,让HDFS更高效?
如何根据数据冷热程度分层存储,让HDFS更高效?
随着大数据技术相关技术的发展和普及,越来越多的公司开始使用基于开源Hadoop的平台系统,同时,越来越多的业务和应用也在从传统的技术架构迁移到大数据平台上。在典型的Hadoop大数据平台中,人们使用HDFS作为存储服 ...
分类:   
如何从MongoDB迁移到MySQL?
如何从MongoDB迁移到MySQL?
最近的一个多月时间都在做数据库的迁移工作,我目前在开发的项目在上古时代是使用 MySQL 作为主要数据库的,后来由于一些业务上的原因从 MySQL 迁移到了 MongoDB,使用了几个月的时间后,由于数据库服务非常不稳定, ...
分类:   
Python的开源人脸识别库:离线识别率高达99.38%
Python的开源人脸识别库:离线识别率高达99.38%
以往的人脸识别主要是包括人脸图像采集、人脸识别预处理、身份确认、身份查找等技术和系统。现在人脸识别已经慢慢延伸到了ADAS中的驾驶员检测、行人跟踪、甚至到了动态物体的跟踪。由此可以看出,人脸识别系统已经由 ...
分类:   
人工智能需要一个可被证明的理论作为基础
人工智能需要一个可被证明的理论作为基础
几何学一开始,就类似今天的人工智能,有很多工程上的应用以及产生的很多定理。不过随后欧几里得将当时主要的平面定理组合以后发现这些定理都可以由5个公理推出来。这是人类历史上很重要的一个里程碑,在很繁复的现 ...
分类:   
人工智能、物联网、智能城市...未来30年的科技发展趋势
人工智能、物联网、智能城市...未来30年的科技发展趋势
在2045年,最保守的预测也认为将会有超过1千亿的设备连接在互联网上。这些设备包括了移动设备、可穿戴设备、家用电器、医疗设备、工业探测器、监控摄像头、汽车,以及服装等。它们所创造并分享的数据将会给我们的工 ...
分类:   
别了,Firebug!
别了,Firebug!
如果你是前端开发者,那你肯定知道或用过 Firebug。10月24日,Mozilla 工程师和 Firebug 团队领导 Jan Honza Odvarko 在 Mozilla 博客发文称, Firebug 是最流行且最强大的 Web 开发工具,有着非凡的成功。2005 年 F ...
分类:   
为什么是无服务器计算?第一手AWS lambda测试报告!
为什么是无服务器计算?第一手AWS lambda测试报告!
为什么一名开发者应该使用AWS Lambda?简单一句话的说,AWS Lambda-是另外一种事件驱动方式,“function-as-a-service”就像Microsoft Azure 的函数计算、谷歌云的函数计算、IBM 的OpenWhisk-simolify,实现了开发工 ...
分类:   
Salesforce帝国的崛起之路,其二:从软件到平台
Salesforce帝国的崛起之路,其二:从软件到平台
在Salesforce开始销售云端的CRM产品时,整个SaaS市场就只有他一个玩家。那时候Salesforce的对手是本地部署软件的巨头们,但是随着时间的推移,这种情况发生了变化。Salesforce成功吸引了大量的SaaS创业者,他们发现S ...
分类:   
Salesforce帝国的崛起之路,其一:让软件更易用
Salesforce帝国的崛起之路,其一:让软件更易用
让我们回到17年前,那天软件服务商Siebel正在进行其用户会议。看起来一切都是安安静静的,但是加州从来就不会一直这么安静,因为这里有好莱坞也有硅谷。突然间,Siebel会议所在地的门口出现了这么一群人,他们高举着 ...
分类:   
Python绘制时间序列数据的时序图、自相关图和偏自相关图
Python绘制时间序列数据的时序图、自相关图和偏自相关图
时序图、自相关图和偏相关图是判断时间序列数据是否平稳的重要依据。本文涉及的扩展库numpy、pandas、statsmodels一般可以使用pip进行在线安装,如果安装失败,可以到http://www.lfd.uci.edu/~gohlke/pythonlibs/下 ...
分类:   
IBM低调发布革命性计算架构,人工大脑三部曲已进入第二阶段?
IBM低调发布革命性计算架构,人工大脑三部曲已进入第二阶段?
10 月 24 日,IBM 研究人员实现了在内存计算技术上的一次重大突破。他们宣布发明了一种可以运行在 100 万个相变内存(Phase Change Memory,PCM 设备)上的无监督式机器学习算法,并且成功地在一系列未知数据流中发 ...
分类:   
MySQL order by 原理以及优化?
MySQL order by 原理以及优化?
偏向于业务的 (MySQL)DBA 或者业务的开发者来说,order by 排序是一个常见的业务功能,将结果根据指定的字段排序,满足前端展示的需求。然而排序操作也是经常出现慢查询排行榜的座上宾。本文将从原理和实际案例优化 ...
分类:   
Linux 运维工程师的 10 个关键技巧
Linux 运维工程师的 10 个关键技巧
好的 Linux 运维工程师区分在效率上。如果一位高效的 Linux 运维工程师能在 10 分钟内完成一件他人需要 2 个小时才能完成的任务,那么他应该受到奖励(得到更多报酬),因为他为公司节约了时间,而时间就是金钱,不 ...
分类:   
vim 神器的打造方式
vim 神器的打造方式
Vim 是一个上古神器,本篇文章主要持续总结使用 Vim 的过程中不得不了解的一些指令和注意事项,以及持续分享一个前端工作者不得不安装的一些插件,而关于 Vim 的简介,主题的选择,以及为何使用 vim-plug 来管理插件 ...
分类:   
开源许可证教程
开源许可证教程
作为一个开发者,如果你打算开源自己的代码,千万不要忘记,选择一种开源许可证license。许多开发者对开源许可证了解很少,不清楚有哪些许可证,应该怎么选择。本文介绍开源许可证的基本知识,主要参考了 OpenSource ...
分类:   
带来高收入的 10 大开源技术,可以涨工资了!
带来高收入的 10 大开源技术,可以涨工资了!
相对于其他类型的 IT 工作者,67% 的管理人员更希望雇佣在开源技术方面有所专长的技术人员。此外,42% 的受访管理人员表示,他们需要招聘更多熟悉开源技术的人才,因为他们正在增加对开源技术的使用,并且有 30% 的 ...
分类:   
阿里RocketMQ是怎样孵化成Apache顶级项目的?
阿里RocketMQ是怎样孵化成Apache顶级项目的?
2016 年 11 月 11 号, 对阿里巴巴中间件消息团队来说,有着极其特殊的意义。这一天,在光明顶上奋战的小伙伴们见证了 RocketMQ 低延迟存储架构的成功试水,完成了保障双十一如丝般顺滑的既定目标。在另一个战场,历 ...
分类:   
如何打造应对超大流量的高性能负载均衡?
如何打造应对超大流量的高性能负载均衡?
什么是负载均衡呢?用户输入的流量通过负载均衡器按照某种负载均衡算法把流量均匀地分散到后端的多个服务器上,接收到请求的服务器可以独立的响应请求,达到负载分担的目的。从应用场景上来说,常见的负载均衡模型有 ...
分类:   
福布斯:机器学习和深度学习将革老牌云服务提供商的命
福布斯:机器学习和深度学习将革老牌云服务提供商的命
过去这几年涌现出了全新类别的产品,这归功于机器学习和深度学习取得了非凡的进步。仅举几个例子,这些新技术在支持产品推荐、医疗成像中的计算机辅助诊断和自动驾驶汽车。大多数机器学习和深度学习算法需要的计算资 ...
分类:   
AWS掌门人畅谈公司发展、云计算、Alexa和经营战略
AWS掌门人畅谈公司发展、云计算、Alexa和经营战略
AWS CEO Andy Jassy 最近接受了彭博(Bloomberg)的专访,主要谈了公司的发展、云计算、Alexa和经营战略等问题,以下是根据视频整理的文字版供大家参阅。主持人:非常感谢您接受我们的采访,很高兴在此见到您。过去 ...
分类:   
Redis 基础、高级特性与性能调优
Redis 基础、高级特性与性能调优
Redis 是一个开源的,基于内存的结构化数据存储媒介,可以作为数据库、缓存服务或消息服务使用。Redis 支持多种数据结构,包括字符串、哈希表、链表、集合、有序集合、位图、Hyperloglogs 等。Redis 具备 LRU 淘汰、 ...
分类:   
为什么 SQL 正在击败 NoSQL,这对未来的数据意味着什么?
为什么 SQL 正在击败 NoSQL,这对未来的数据意味着什么?
自从可以利用计算机做事以来,我们一直在收集的数据以指数级的速度在增长,因此对于数据存储、处理和分析技术的要求也越来越高。在过去的十年里,由于 SQL 无法满足这些要求,软件开发人员就抛弃了它,NoSQL 也就因 ...
分类:   
为什么甲骨文对待开源要搞两面派?一个字:钱!
为什么甲骨文对待开源要搞两面派?一个字:钱!
甲骨文爱开源,除了这个数据库巨头讨厌开源的时候,当然是这样的。从最近它游说美国联邦政府反对开源这一做法来看,似乎大部分时间它是讨厌开源的。没错,甲骨文最近加入了云原生计算基金会(CNCF),加大对 Kuberne ...
分类:   
聊聊分布式事务,再说说解决方案
聊聊分布式事务,再说说解决方案
前言分布式事务是企业集成中的一个技术难点,也是每一个分布式系统架构中都会涉及到的一个东西,特别是在微服务架构中,几乎可以说是无法避免,本文就分布式事务来简单聊一下。数据库事务在说分布式事务之前,我们先 ...
分类:   
Elasticsearch 创始人 Shay Banon:让数据自己说话
Elasticsearch 创始人 Shay Banon:让数据自己说话
随着互联网数据规模的爆炸式增长,如何从海量的历史、实时数据中快速获取有用的信息,变得越来越具有挑战性。而这其中,搜索作为获取信息最高效的途径之一,已经越来越受到人们的青睐。一款优秀的搜索引擎,它连接了 ...
分类:   
科学家们正在尝试用量子计算机来重新发现希格斯粒子
科学家们正在尝试用量子计算机来重新发现希格斯粒子
一台初级量子计算机在某种意义上重新发现了希格斯玻色子。物理学家们已经在“使用量子技术来加速科研计算”的机器开发工作上付出了很多,他们希望这类量子计算机能帮助发现新的自然规律。最近,一个研究小组已经验证 ...
分类:   
上周上市的大数据公司MongoDB的前生今世
上周上市的大数据公司MongoDB的前生今世
上周MongoDB上市成功。股票收在30美元以上,比发行价高了30%。这是近年来上市的又一家大数据背景的故事。上市前估值10亿美元,目前市值大致在15亿美元。这篇文章给大家简单介绍一下MongoDB的发展历程。MongoDB是由名 ...
分类:   
用Python对鹿晗、关晓彤微博进行情感分析
用Python对鹿晗、关晓彤微博进行情感分析
相信最近科技圈都在调侃一件事:10月8日中午的一条微博,引发了一场新浪微博用户们(尤其是女性用户)之间的轩然大波,导致新浪微博瘫痪。这条微博的始作俑者,就是全球超人气偶像明星鹿晗。程序员们纷纷开启了科♂学 ...
分类:   
线上系统性问题定位与方法论
线上系统性问题定位与方法论
什么样的现象应该列为“系统问题”?某个服务的QPS达到1000?对于一般系统或许算是,但是对大型电商网站,或许这只是常态。很显然对于不同规模,不同功能的系统,这个问题无法一概而论。因此快速发现问题的前提是深 ...
分类:   

热门频道

  • 大数据
  • 商业智能
  • 量化投资
  • 科学探索
  • 创业

即将开课

 

GMT+8, 2018-2-21 03:14 , Processed in 0.154534 second(s), 19 queries .