发布了文章2018-12-03
调整策略,「leetcode 刷题篇」改为根据知识点进行刷题,参照的是 leetcode 题解,一个 github 上特别好的计算机科学笔记。如果之后有时间二刷,将继续用“笨办法”专题来刷题。
发布了文章2018-11-12
特征工程 我们注意到 MSSubClass 其实是一个 category 的值: {代码...} 有: {代码...} 它不应该做为数值型的值进行统计。因此,进行强制类型转换,把它变回 string: {代码...} 然后,统计其出现频次: {代码...} 就很清楚的了解 MSSubClass 特征了。 当我们用 num...
发布了文章2018-11-11
众众众众众所周知,github 是一个好东西。本篇就来说说 Git 的那些指令,网上已经有很多文章,本篇就本不知名小博主在使用过程中用到的一些指令和问题来记录和说明。如果对你有帮助欢迎点赞收藏,觉得写的不好请跳至文末。
发布了文章2018-11-11
影响房价的因素有很多,在本题的数据集中有 79 个变量几乎描述了爱荷华州艾姆斯 (Ames, Iowa) 住宅的方方面面,要求预测最终的房价。
发布了文章2018-11-09
「 Leetcode刷题 」系列,仅为刷题过程中对于算法和编程的思考与记录,如果对你有帮助欢迎点赞收藏。博主也在探索刷题过程中,记录的一些知识点可能很小白,因此主要是想做一个记录。文中的不足请多担待。
发布了文章2018-10-21
给定一个有N个顶点和E条边的无向图,请用DFS和BFS分别列出其所有的连通集。假设顶点从0到N−1编号。进行搜索时,假设我们总是从编号最小的顶点出发,按编号递增的顺序访问邻接点。
发布了文章2018-10-18
首先说明,这个方法是博主在理解高维数组转置的transpose 方法时所提出的,因此严谨性和正确性有待考察,但私以为完全可以这样理解,因此做个记录,如果对你有帮助的话欢迎点赞收藏,如果认为有错误的话请提出批评,督促改进。
发布了文章2018-10-11
给定两棵树T1和T2。如果T1可以通过若干次左右孩子互换就变成T2,则我们称两棵树是“同构”的。例如图1给出的两棵树就是同构的,因为我们把其中一棵树的结点A、B、G的左右孩子互换后,就得到另外一棵树。而图2就不是同构的。
发布了文章2018-10-10
L1和L2是给定的带头结点的单链表,其结点存储的数据是递增有序的;函数Merge要将L1和L2合并为一个非递减的整数序列。应直接使用原序列中的结点,返回归并后的带头结点的链表头指针。
发布了文章2018-10-06
写这篇的原因是在使用 python 的过程中,陆续安装了 python2.7、python3.6、python3.7 的版本,区分 python2 和 python3 还好,而更新到 python3.7 后,每次安装使用命令pip3 install pkg-name 总是容易安装到 python3.7 的 site-packages 中,而我是想要在 python3....
发布了文章2018-09-20
本篇内容为《机器学习实战》第 7 章利用 AdaBoost 元算法提高分类性能程序清单。所用代码为 python3。 AdaBoost优点:泛化错误率低,易编码,可以应用在大部分分类器上,无参数调整。缺点:对离群点敏感。适用数据类型:数值型和标称型数据。 boosting 方法拥有多个...
发布了文章2018-09-20
本篇内容为西瓜书第 8 章集成学习 8.1 8.2 8.3 8.4 8.5 的内容: 8.1 个体与集成 8.2 Boosting 8.3 Bagging与随机森林 8.4 结合策略 8.5 多样性 如移动端无法正常显示文中的公式,右上角跳至网页即可正常阅读。 个体与集成 集成学习 (ensemble learning) 通过构建并...
发布了文章2018-09-17
决策树优点:计算复杂度不高,输出结果易于理解,对中间值的缺失不敏感,可以处理不相关特征数据。缺点:可能会产生过度匹配问题。适用数据类型:数值型和标称型
发布了文章2018-09-16
本篇内容为西瓜书第 4 章决策树 4.1,4.2,4.3 的内容: 4.1 基本流程 4.2 划分选择 4.3 剪枝处理 如移动端无法正常显示文中的公式,右上角跳至网页即可正常阅读。 决策树 (decision tree) 是一种基本的分类与回归方法。在分类问题中,表示基于特征对实例进行分类的...
发布了文章2018-09-15
这两篇内容为西瓜书第 6 章支持向量机 6.1,6.2,6.4,6.3 的内容: 6.1 间隔与支持向量 6.2 对偶问题 6.4 软间隔与正则化 6.3 核函数 由于本章内容较多,分为两篇来叙述。本篇所包含内容为软间隔与正则化和核函数。关于间隔与支持向量和对偶问题可点击支持向量机(...
发布了文章2018-09-14
这两篇内容为西瓜书第 6 章支持向量机 6.1,6.2,6.4,6.3 的内容: 6.1 间隔与支持向量 6.2 对偶问题 6.4 软间隔与正则化 6.3 核函数 由于本章内容较多,分为两篇来叙述。本篇所包含内容为间隔与支持向量和对偶问题。 如移动端无法正常显示文中的公式,右上角跳至网...
发布了文章2018-09-11
简单描述这个过程为:从文本中获取特征,构建分类器,进行分类输出结果。这里的特征是来自文本的词条 (token),需要将每一个文本片段表示为一个词条向量,其中值为 1 表示词条出现在文档中,0 表示词条未出现。
发布了文章2018-09-09
支持向量机优点:泛化错误率低,计算开销不大,结果易解释。 缺点:对参数调节和核函数的选择敏感,原始分类器不加修改仅适用于处理二分类问题。适用数据类型:数值型和标称型数据。
发布了文章2018-09-08
本系列数据结构专题为中国大学MOOC-陈越、何钦铭-数据结构-2018秋课程的学习记录。主要记录内容为编程题解答。每篇内容将会不定期更新,以补充更好的方法。
发布了文章2018-09-03
在最初正式开始接触编程的时候,对编程的认识仅限于用 Visual Studio 编辑代码,但 mac 并没有这个软件,Xcode 又太大,因此对如何执行.c和.cpp文件无从下手,最近才明白了编译器和编辑器的区别,也找到了如何在 mac 上编译运行 C 语言和 C++ 的方法。本文适用于初次...