发布了文章2020-08-04
程序使用动态内存原因:不知道自己需要多少对象;不知道对象准确类型;需要多个对象间共享数据shared_ptrshared_ptr/weak_ptr 的“计数”在主流平台上是原子操作,没有用锁,性能不俗 {代码...} 当一个shared_ptr绑定到一个普通指针时,就将内存管理责任交给了shared_p...
发布了文章2020-08-04
锁的意义原子性+可见性同一时间,只有一个线程执行锁中代码 + 锁内读在锁前代码执行完,写在锁释放前可见原子操作本身内核的原子是通过原子指令实现的[链接]原子库实现的一下方法可以带内存屏障来加强可见性。store //原子写load //原子读exchange //原子交换compare...
发布了文章2020-06-23
IID(如使用基准数据集的图像识别),要么被人工处理为 IID,如为给定的应用问题精心收集合适的训练数据集,或者使用类似 DeepMind「经验回放」(experience replay)的方法,即强化学习智能体存储观测结果稍后再打乱以便后续训练。互信息:二者对我的影响是同等程度...
发布了文章2020-06-22
1.querys信息汇总(action,affected rows,avg.frequency,avg.latency,bytesin,bytesout,count,cputime,errors,failedrate)2.趋势 环比3.faults requests continue to arrive but do not get serviced by the system(mysqld,disk) {why?so you can prevent it from esc...
发布了文章2020-06-22
功能:performance prediction, performance diagno- sis, bottleneck explanation, workload insight, optimal admission control, and what-if analysis指标:AggregatedOSstatisticsWorkloadstatisticsfromtheDBMS,includingthenumberof SELECT, UPDATE, DELETE a...
发布了文章2020-06-21
RCA的工具一般可以query and classify anomalies,相关性分析(causal probabilistic gaphical models)
发布了文章2020-06-21
定义: 某个sqlQ ,第t次发生,T是Q最近发生的总次数,Qt是iSQ的条件是 这次Xt的执行时间>z(z是概率分布<e的) z是慢日志阈值,e分布。根据workload调整
发布了文章2019-12-09
背景:一份数据一个系统综合解决多种分析和adhoc的场景。具体四个方面,解决reporting/dashboard(万级别query,ms延时,插入数据多,实时,filters,aggregation,类似)。emmeded statis(simply bug high query,百万/s实时更新)。monitoring(时序)。ad-hos analysis...
发布了文章2019-11-11
Bridging the Archipelago between Row-Stores and Column-Stores for Hybrid WorkloadsCarnegie Mellon University(2016)
发布了文章2019-11-04
哎呀,论文总结的越来越应付了,要看的太多,基本都是总结点了,合在一起吧。第一个是little table,第二个是mesa LittleTable: A Time-Series Database and Its Uses (2017 cisco meraki)
发布了文章2019-11-04
TimescaleDB: SQL made scalable for time-series data基于postgresql有一个hypertable层,负责分布式和查询优化等
发布了文章2019-11-04
这个对读写性能要求都高(so,竟然和以前想的一样,如果读写要都高,要用B-TREE类似的,SLM只对写友好,不过应用场景有这么大差异吗,gorrila对读的性能要求巨高吞吐和我们一样,这个对读写的吞吐要求一样,在线业务?我们的读很少)。文章中的索引比较新,不过我没...
发布了文章2019-10-28
这个文章在选型本地/远端,优化关注并发/还是语句解析,冷热缓存,等给了实践上真实的差距,给我们看的目的是坚定利用低成本在网速10G的发展下存储部分 用底层本共享保证可靠性的共享存储,替代自己做多备份posix保证一致性,且用便宜的对象存储+超快的本地易失缓存...
发布了文章2019-10-21
背景需求10M写入,4万读取,ms级别读取(我们的读取40ms,这个要求太高,1ms),数据全内存26hours,16G每个,容错。 opentsdb 基于hbase,远程磁盘。query速度不满足
发布了文章2019-10-16
背景druid等专注于复杂多维度数据,样本量相对于监控数据少的场景,读写1mps以下,精度1ms,只能有序追加;cassandra 吞吐量远小于1ms。以上精度和吞吐不能同时满足。Gorilla(facebook内存数据库)和BTRDB性能接近,但s精度且不能乱序。
发布了文章2019-08-30
从物理上需要关注物理架构,RAM的组织管理/分配/页结构,cache,cpu_cache。内存分配设计到伙伴系统、slab。从逻辑上涉及到虚拟内存,页表,地址空间。二者的使用涉及到缺页,回收,交互,共享内存等内容
发布了文章2019-08-21
我们用ES作日志检索和简单分析,它适用于全文搜索,近实时分析,也可以作为nosql存储(订单的冷库接入ES),需要关注架构,单机的功能(搜索原理,动态索引),性能(索引和数据组织),分布式的可靠性,可扩展,一致性。
发布了文章2019-08-21
我们用ES作日志检索和简单分析,它适用于全文搜索,近实时分析,也可以作为nosql存储(订单的冷库接入ES),需要关注架构,单机的功能(搜索原理,动态索引),性能(索引和数据组织),分布式的可靠性,可扩展,一致性。
发布了文章2019-08-21
实在不知道起什么名字,打算写三个系列的文章,因为系统尽量有状态和无状态分离,第一个想写下系统中涉及到数据存储/分析/选型/自己设计要怎么做,包含内存/持久,数据量单机到大量到海量分布式的存储和计算。第二个想写无状态系统如何做到高处理能力,涉及到网络/分...
发布了文章2019-08-02
标准的strcpy,strncpy等C风格的char函数基本都没有缓冲区溢出校验,都算是高危函数,标准版都是基于memcpy实现,memcpy可能会出现覆盖,且4字节一次拷贝。除了给出这几个实现,开始的单字节是简化版。