梦想家

68
获赞数
1
关注数
76
粉丝数
IP 属地美国
2018-11-30 加入
浏览 14.2k
╭╮╱╭┳━━━┳╮╱╭╮
┃┃╱┃┃╭━╮┃┃╱┃┃
┃╰━╯┃┃┃┃┃╰━╯┃
╰━━╮┃┃┃┃┣━━╮┃
╱╱╱┃┃╰━╯┃╱╱┃┃
个人简介什么都没有
110 声望|学徒
架构
54
源码
51
nginx
51
redis集群
14
redis
14
黄金勋章
暂未获得该勋章
如何获得
1 白银勋章
1 青铜勋章
个人动态
  • 发布了文章2020-08-04
    【6.C++基础】-智能指针
    程序使用动态内存原因:不知道自己需要多少对象;不知道对象准确类型;需要多个对象间共享数据shared_ptrshared_ptr/weak_ptr 的“计数”在主流平台上是原子操作,没有用锁,性能不俗 {代码...} 当一个shared_ptr绑定到一个普通指针时,就将内存管理责任交给了shared_p...
  • 发布了文章2020-08-04
    【6.C++基础】-锁
    锁的意义原子性+可见性同一时间,只有一个线程执行锁中代码 + 锁内读在锁前代码执行完,写在锁释放前可见原子操作本身内核的原子是通过原子指令实现的[链接]原子库实现的一下方法可以带内存屏障来加强可见性。store //原子写load //原子读exchange //原子交换compare...
  • 发布了文章2020-06-23
    cause理论
    IID(如使用基准数据集的图像识别),要么被人工处理为 IID,如为给定的应用问题精心收集合适的训练数据集,或者使用类似 DeepMind「经验回放」(experience replay)的方法,即强化学习智能体存储观测结果稍后再打乱以便后续训练。互信息:二者对我的影响是同等程度...
  • 发布了文章2020-06-22
    VividCortex-2017
    1.querys信息汇总(action,affected rows,avg.frequency,avg.latency,bytesin,bytesout,count,cputime,errors,failedrate)2.趋势 环比3.faults requests continue to arrive but do not get serviced by the system(mysqld,disk) {why?so you can prevent it from esc...
  • 发布了文章2020-06-22
    DBSeer-2016-sigmod
    功能:performance prediction, performance diagno- sis, bottleneck explanation, workload insight, optimal admission control, and what-if analysis指标:AggregatedOSstatisticsWorkloadstatisticsfromtheDBMS,includingthenumberof SELECT, UPDATE, DELETE a...
  • 发布了文章2020-06-21
    explianit-cisco-2019-sigmod
    RCA的工具一般可以query and classify anomalies,相关性分析(causal probabilistic gaphical models)
  • 发布了文章2020-06-21
    diagnosing root cause of isq-yinzheng-2020-vldb
    定义: 某个sqlQ ,第t次发生,T是Q最近发生的总次数,Qt是iSQ的条件是 这次Xt的执行时间>z(z是概率分布<e的) z是慢日志阈值,e分布。根据workload调整
  • 发布了文章2019-12-09
    【论文】数仓分析和adhoc共存相关论文总结
    背景:一份数据一个系统综合解决多种分析和adhoc的场景。具体四个方面,解决reporting/dashboard(万级别query,ms延时,插入数据多,实时,filters,aggregation,类似)。emmeded statis(simply bug high query,百万/s实时更新)。monitoring(时序)。ad-hos analysis...
  • 发布了文章2019-11-11
    【论文】row and column for hybrid workloads
    Bridging the Archipelago between Row-Stores and Column-Stores for Hybrid WorkloadsCarnegie Mellon University(2016)
  • 发布了文章2019-11-04
    【论文】little table / mesa /confluo/scuba
    哎呀,论文总结的越来越应付了,要看的太多,基本都是总结点了,合在一起吧。第一个是little table,第二个是mesa LittleTable: A Time-Series Database and Its Uses (2017 cisco meraki)
  • 发布了文章2019-11-04
    【论文】timescale-2017
    TimescaleDB: SQL made scalable for time-series data基于postgresql有一个hypertable层,负责分布式和查询优化等
  • 发布了文章2019-11-04
    【论文】chronicleDB-2017
    这个对读写性能要求都高(so,竟然和以前想的一样,如果读写要都高,要用B-TREE类似的,SLM只对写友好,不过应用场景有这么大差异吗,gorrila对读的性能要求巨高吞吐和我们一样,这个对读写的吞吐要求一样,在线业务?我们的读很少)。文章中的索引比较新,不过我没...
  • 发布了文章2019-10-28
    【论文】cloud dbms:architectures and tradeoffs
    这个文章在选型本地/远端,优化关注并发/还是语句解析,冷热缓存,等给了实践上真实的差距,给我们看的目的是坚定利用低成本在网速10G的发展下存储部分 用底层本共享保证可靠性的共享存储,替代自己做多备份posix保证一致性,且用便宜的对象存储+超快的本地易失缓存...
  • 发布了文章2019-10-21
    【论文】Gorilla In-Memory Time Series Database
    背景需求10M写入,4万读取,ms级别读取(我们的读取40ms,这个要求太高,1ms),数据全内存26hours,16G每个,容错。 opentsdb 基于hbase,远程磁盘。query速度不满足
  • 发布了文章2019-10-16
    【论文】BtrDB:Design for Timeseried Processing
    背景druid等专注于复杂多维度数据,样本量相对于监控数据少的场景,读写1mps以下,精度1ms,只能有序追加;cassandra 吞吐量远小于1ms。以上精度和吞吐不能同时满足。Gorilla(facebook内存数据库)和BTRDB性能接近,但s精度且不能乱序。
  • 发布了文章2019-08-30
    【5.linux操作系统】-内存管理
    从物理上需要关注物理架构,RAM的组织管理/分配/页结构,cache,cpu_cache。内存分配设计到伙伴系统、slab。从逻辑上涉及到虚拟内存,页表,地址空间。二者的使用涉及到缺页,回收,交互,共享内存等内容
  • 发布了文章2019-08-21
    【3.工程开发】-ES
    我们用ES作日志检索和简单分析,它适用于全文搜索,近实时分析,也可以作为nosql存储(订单的冷库接入ES),需要关注架构,单机的功能(搜索原理,动态索引),性能(索引和数据组织),分布式的可靠性,可扩展,一致性。
  • 发布了文章2019-08-21
    【3.工程开发】-ES
    我们用ES作日志检索和简单分析,它适用于全文搜索,近实时分析,也可以作为nosql存储(订单的冷库接入ES),需要关注架构,单机的功能(搜索原理,动态索引),性能(索引和数据组织),分布式的可靠性,可扩展,一致性。
  • 发布了文章2019-08-21
    【2.综述数据存储/计算】【精】
    实在不知道起什么名字,打算写三个系列的文章,因为系统尽量有状态和无状态分离,第一个想写下系统中涉及到数据存储/分析/选型/自己设计要怎么做,包含内存/持久,数据量单机到大量到海量分布式的存储和计算。第二个想写无状态系统如何做到高处理能力,涉及到网络/分...
  • 发布了文章2019-08-02
    【6.C++基础】-高效标准的stl实现memcpy,strcpy,strncpy,memmove
    标准的strcpy,strncpy等C风格的char函数基本都没有缓冲区溢出校验,都算是高危函数,标准版都是基于memcpy实现,memcpy可能会出现覆盖,且4字节一次拷贝。除了给出这几个实现,开始的单字节是简化版。