发布了文章2023-01-18
主要的训练算法集中在 RL_Trainer.run_training_loop 中。通过观察一个循环(iteration)的调用过程,可总结为:
发布了文章2023-01-05
首先明确,这里的 “连续动作空间” ( $\pi(a|s)$ ) 就是单峰的高斯分布。即 动作向量的每个分量连续、独立且分别服从不同参数的高斯分布。
发布了文章2023-01-04
(基于价值的思路和传统的监督学习结合,便提出一系列基于生成 价值数据集 (Qtable)的方法,而基于 policy 的思路和 监督学习结合,就是 基于生成 action 数据集的方法,那就是模仿学习。)
赞了文章2022-01-30
一年多以来,关于嵌入式开发学习路线、规划、看什么书等问题,被问得没有一百,也有大几十次了。但是无奈自己对这方面了解有限,所以每次都没法交代,搞得实在不好意思。
发布了文章2021-08-19
一般来说,我们 Web 应用的生产环境都是 Linux,比如我这次被要求尽量使用 openEuler 环境开发。但很多人的开发环境都是 Windows。而 PowerShell 实际上正如其名,非常强大。这里将涉及一些基本的 PowerShell 指令语法
发布了文章2021-08-19
这是我发现的一个强大的 json 数据校验工具, 不止可以用在 flask app 中 json 数据的校验, 在任何场景 json 数据的校验都非常有力
发布了文章2021-08-19
最近我在为 openEuler 社区添加一个 FAQ 模块, 这一系列正是我在这一过程中的总结全部内容: 如何编写一个 Python Web 应用(零)简单增删改查参考:flask-sqlalchemy: 增删查两种 update复杂关系: 一对一, 一对多在 Mybatis 中, 实现一对多和一堆一, 需要在 .xml 文件...
发布了文章2021-08-19
最近我在为 openEuler 社区添加一个 FAQ 模块, 这一系列正是我在这一过程中的总结全部内容: 如何编写一个 Python Web 应用(零)对于 Flask 最核心的有三点:Application Context: 将整个应用连成一体.View Function & CLI Command: 应用暴漏给外界的操作接口Blue...
发布了文章2021-08-19
最近在为一个 openeuler 社区开发一个 FAQ (Frequently Asked Questions) 服务模块, 开发语言我选择了 Python. 这也是我第一次使用 Python 编写 Web服务. 之前我一直习惯用 Java 来进行 Web 后端开发, 而我熟悉的一套最基础的 Java Web 技术栈是这样的:
发布了文章2021-08-19
OpenEuler 中安装配置 MySQL 与其他系统有所不同, 需要一些手动的配置. 这里整理了在这个过程中涉及的一些 Linux 基础知识