赞了文章2020-02-21
R 和 Python2/Python3 在过去十年(Pandas问世后)的数据科学领域持续着激烈的竞争,随着时间的推移竞争格局也从混沌走向清晰。
赞了文章2019-05-15
Golang和Python都是目前在各自领域最流行的开发语言之一。 Golang其高效而又友好的语法,赢得了很多后端开发人员的青睐,最适用于高并发网络编程的语言之一。 Python不用说,TIOBE排行榜的前十常驻居民,现在已经稳定在前五了。在机器学习、AI、数据分析领域成为必学...
赞了文章2019-03-26
9102年是互联网大环境不太好的一年,这一年更需要苦练基本功,数据科学领域的基本功无非就是数据处理,而 DataFrame 是其中的核心。那么,都9102年了,如何在 R 语言中优雅地使用 DataFrame 呢?是否优雅是矿工生产力差异的重要来源,本文将介绍最近三年来 DataFrame...
发布了文章2019-03-25
群机器人是钉钉群的高级扩展功能。群机器人可以将第三方服务的信息聚合到群聊中,实现自动化的信息同步。例如:通过聚合GitHub,GitLab等源码管理服务,实现源码更新同步;通过聚合Trello,JIRA等项目协调服务,实现项目信息同步。不仅如此,群机器人支持Webhook协议...
赞了文章2018-10-31
背景 近年来,人工智能与数据科学领域发展迅速,传统项目在演化中也越来越复杂了,如何管理大量的机器学习项目成为一个难题。 在真正的机器学习项目中,我们需要在模型之外花费大量的时间。比如: 跟踪实验效果 机器学习算法有可配置的超参通常都是十几个到几十个不...
发布了文章2018-10-31
我之前一直使用highcharter做交互式数据可视化,因为工作的需要开始使用echarts,期间主要使用过两个echarts包,cosname/recharts和JohnCoene/echarts4r。因为使用highcharter比较久,也习惯了它的的实现方式,以及highcharts丰富的官方文档和社区帮助。所以我按照hi...
赞了文章2018-07-19
加快推动从数据探索到数据产品的过程是一件很有意义的事情,数据分析要如何做到尽量和数据分析的流程紧密结合,又要方便工程化落地一直困扰着许多数据分析师和Web工程师。数据分析师不想深究太多前端JS实现,Web工程师也不想插手复杂的业务逻辑与SQL,前后分离看起来...
赞了文章2018-04-03
微服务特性 对于微服务没有适当的定义,你可以说它是一个框架,由小型的、独立的可部署的服务组成,执行不同的操作。 微服务专注于单个业务领域,可以作为完全独立的可部署服务,并在不同的技术栈上实现它们。 在使用微服务构建自己的应用程序之前,需要清楚地了解应...
赞了文章2018-03-19
SparkR 和 Sparklyr 是两个基于Spark的R语言接口,通过简单的语法深度集成到R语言生态中。SparkR 由 Spark 社区维护,通过源码级别更新SparkR的最新功能,最初从2016年夏天的1.5版本开始支持,从使用上非常像Spark Native。Sparklyr 由 RStudio 社区维护,通过深度集...
赞了文章2018-02-07
Echarts 仪表盘实践 项目过程中遇到一个这样的需求: 这明显是一个仪表盘类型的图表,打开echarts的官方文档,可以看到有一个默认的实现,如下: 使用了默认的参数 {代码...} 分析需求后,我们从以下几个方面入手 轴线类别 从第一张图我们可以看出,需求中的轴线不是...
赞了文章2018-01-21
没错,DataFrame就是类似于Excel表格和MySQL数据库一样是一个结构化的数据体。而这种结构化的数据体是当代数据流编程中的中流砥柱,几乎所有先进算法的载体都是DataFrame,比如现在我们耳熟能详的逻辑回归算法、贝叶斯算法、支持向量机算法、XGBoost算法等等都建立在...
发布了文章2018-01-15
在Highmaps data上可以获取Highmaps的全部数据列表,其中关于中国的数据有三条。中国(只包括中国大陆)、中国(中国大陆、香港、澳门)、中国(中国大陆、香港、澳门、台湾)。如果统计中国数据,我们当然是只用第三条数据。
赞了文章2017-11-27
很多人认为数据可视化非常简单,无非是输入几组数据,生成简单的条形图、直线图等等。然而,这未免有点管中窥豹。其实数据可视化大致可分为信息可视化、科学可视化和可视化分析三大类,刚才提到的简单图表只是信息可视化中最常见的几种。一旦数据量增大,可视化目标...
赞了文章2017-11-16
介绍 Sortable.js是一款轻量级的拖放排序列表的js插件(虽然体积小,但是功能很强大)下载地址:[链接]官方DEMO:[链接] 特点 支持触屏设备和大部分浏览器(IE9以下的就不支持了,原因都懂得) 可以从一个列表容器中拖拽一个列表单元到其他容器或本列表容器中进行排...
赞了文章2017-08-07
立即执行函数 (immediately invoked function expression, IIFE) 即通过一对括号包裹一个函数体并在紧随其后的一对括号调用此函数:
发布了文章2017-04-06
在shiny中经常需要根据input来向dplyr的函数提供参数,以便进行相应数据操作。dplyr在filter()、mutate()、summarise()、arrange()、select()、group_by()这些函数中,都支持Non-standard evaluation(NSE),很方便的进行参数传递。
发布了文章2017-04-02
之前在读取和处理较大的csv数据时,在尝试了一次直接读取处理后发现非常耗时,就改用导入数据库,再通过RMySQL或者RODBC来读取处理数据。今天来比较一下。
赞了文章2016-11-22
Shiny是R中的一种Web开发框架,使得R的使用者不必太了解css、js只需要了解一些html的知识就可以快速完成web开发,且shiny包集成了bootstrap、jquery、ajax等特性,极大解放了作为统计语言的R的生产力。使得非传统程序员的R使用者不必依赖于前端、后端工程师就可以自...
赞了文章2016-11-22
对于物联网应用,收集分布式日志数据到一个中央服务器并做数据可视化是一项十分常见的工作,这通常需要部署和维护自己的服务器、数据库和可视化界面。我对系统管理任务毫无乐趣,所以我找到了一种方法使用谷歌表作为数据库和ShinyApps.io作为可视化平台。上传数据到Go...
发布了文章2016-10-27
考试人数有从2015年7月到2016年9月的各科的考试人数数据,其中科目三指“科目三 道路驾驶技能考试”,科目四指“科目三 安全文明常识”。