Prometheus--TSDB
2024年12月31日 · 5950 字 · 12 分钟 · Prometheus TSDB
最近晋升,顺便总结一些以前的工作。工作里大规模数据库可观测系统占了很大一部分,不过这个和云原生监控系统Prometheus还是很不一样的。现
2024年12月31日 · 5950 字 · 12 分钟 · Prometheus TSDB
最近晋升,顺便总结一些以前的工作。工作里大规模数据库可观测系统占了很大一部分,不过这个和云原生监控系统Prometheus还是很不一样的。现
2024年2月19日 · 1166 字 · 3 分钟 · Borg K8s Cluster Management
Borg 是一个集群管理系统,类似闭源的k8s。 通过准入控制、高效的任务装箱、超售、机器共享、以及进程级别的性能隔离,实现了高利用率。 为高可用应用提
2023年9月28日 · 2513 字 · 6 分钟 · Distributed System Transaction
好久没学习了,学点想学的。本次内容是分布式事务Percolator, 不翻译论文,没有算法细节,只记录自己的理解。 Percolator 和 2PC 2PC 两阶段提交协议中包含
2023年8月1日 · 1159 字 · 3 分钟 · Distributed System Database Cloud-Native MIT6.824
这篇文章介绍了AWS的数据库产品Aurora的设计考虑,包括存算分离、一写多读、基于Quorum的NRW一致性协议等。同时,文章也提到了PolarDB参考Aurora进行设计,但在网络瓶颈和系统调用方面有所不同。
Aurora是AWS提供的一种数据库产品,主要面向OLTP的业务场景。
设计上,我觉得有这些值得参考的地方:
有趣的是,PolarDB虽然是参考Aurora进行的设计,但它的架构设计认为网络并非瓶颈,而是经过OS的各种系统调用拖慢了整体速度。在彼时阿里云存储底座并不稳定的条件下,所以才有了它架构中的PolarStore,用各种硬件以及FUSE等存储技术越过或者优化系统调用,而如今盘古在稳定性和性能上都做的很不错的情况下,弱化PolarStore这个组件也成为了正常的选择。我认为说的不无道理。
另外,为什么他们选择用NWR而不是用Raft之类的一致性协议?目前看上去,NWR在网络上,一次请求的网络比Raft少一轮,可能是这个原因
https://zhuanlan.zhihu.com/p/319806107
2023年2月8日 · 740 字 · 2 分钟 · Distributed System MIT6.824 ChainReplication
只是简单写写,有一些具体一点的设计建议去读一下原文。 简介 简单来讲,CR论文介绍了一种用于存储服务的满足线性一致性的复制状态机算法。它通过链式
2023年1月3日 · 933 字 · 2 分钟 · Distributed System MIT6.824 ZooKeeper
本文主要讲了ZooKeeper系统在设计和实践上的考量,如wait-free和lock,一致性的选择,系统提供的API以及特定语义上的抉择,
2022年5月10日 · 1385 字 · 3 分钟 · LSM LevelDB
LevelDB源码阅读笔记第二章,有关LevelDB的Write流程。本文并不是step by step的源码阅读教程,而是仅仅作为我的学习笔记,
2022年4月15日 · 2336 字 · 5 分钟 · Raft Distributed System Consensu MIT6.824
之前因为想试一试GSOC,所以看了看Casbin-Mesh的代码,这是基于Raft的一个分布式Casbin应用。这个MIT6.824里的Ra
2022年4月9日 · 3152 字 · 7 分钟 · LSM LevelDB
之前就听LevelDB是所有搞存储的人都会读的一个代码库。最近正好忙完了搞完了毕设的代码,稍微闲了一些,于是也打算看看LevelDB的源码。
2022年2月21日 · 1988 字 · 4 分钟 · Paper Reading Consensu Distributed System MIT6.824
这个寒假可算把搁置许久的Lab02给做完了。之前一直被卡在Test 2B的一个case里,寒假时候重新看看大佬们的实现思路,可算是完成了所有内
2021年11月21日 · 1306 字 · 3 分钟 · DataStructure SkipList
之前闲来无事,打算尝试写一个简单的LSM存储引擎的模型。简单实现了一下SkipList和BloomFilter,BitSet之后,因为一些工
2021年10月6日 · 3596 字 · 8 分钟 · DFS Paper Reading Distributed System
组内的主要项目便是一种提供POXIS文件系统语义的DFS,其中解决losf(lots of small files)的思路就是对小文件单独处理。里面的思想来
2021年9月16日 · 6733 字 · 14 分钟 · Paper Reading MIT6.824 DFS Distributed System
之前在网上找到了别人翻译的BigTable论文,就顺手保存了下来,但一直没开始看。最近发现BigTable和目前组内做的项目有很多设计上相似
2021年9月9日 · 5208 字 · 11 分钟 · GFS MIT6.824 Paper Reading
之前对GFS的理解并不能支持我写出满意的内容,于是一直搁置。最近刚转岗某司存储部门实习,回想起此文,于是在无所事事之时写下这个笔记。 这是鸽了
2021年8月15日 · 3084 字 · 7 分钟 · OS Linux Network IO
先从epoll说起。 epoll是Linux内核的可拓展IO事件通知机制,设计的目的是取代select和poll,是为了处理大量文件描述符而改
2021年5月2日 · 980 字 · 2 分钟 · CPU Cache
起因只是因为面试时被问到的一个问题:什么是CPU伪共享? CPU缓存 让我们先从CPU缓存讲起。 CPU Cache是计算机为了解决CPU和主存之间的速
2021年3月21日 · 890 字 · 2 分钟 · DB MySQL
数据库索引,是DBMS中一个排序的数据结构,以协助快速查询、更新数据库中数据。一般来说,用于构建索引的数据结构有B树,B+树,哈希表等。 My
2021年2月21日 · 1658 字 · 4 分钟 · Network HTTPS HTTP
HTTPS(HTTP over SSL)是为了解决HTTP中可能存在的信息窃听和身份伪装等安全问题而诞生的HTTP加密版本,通常使用 SSL 或者 TLS 来加密客户端和服务器之间所
2021年1月22日 · 2985 字 · 6 分钟 · MIT6.824 Distributed System Paper Reading
大三上学期课程有点硬核,一直没时间去继续6.824的学习,于是学习进度一直停在了Lab 1。寒假时间稍微充裕了点,于是打算继续推进。之后的每一
2020年11月10日 · 1697 字 · 4 分钟 · SQL Parsing DB GO
一直想去完成pingcap的tanlent Plan里面的tinySql路径,但一直没有开始。最近论坛上发现了pingcap创始人的tanle
2020年5月6日 · 1684 字 · 4 分钟 · ML
基于朴素贝叶斯的中文垃圾电子邮件分类 训练数据和测试数据 本次主要使用了github上的开源数据 数据处理 首先使用正则表达式对训练集中的中文邮件的