es的写入过程

2016-07-10 22:41:00

es的写入过程

创建((C)reate)

当我们发送索引一个新文档的请求到协调节点后，将发生如下一组操作：

Elasticsearch集群中的每个节点都包含了改节点上分片的元数据信息。协调节点(默认)使用文档ID参与计算，以便为路由提供合适的分片。Elasticsearch使用MurMurHash3函数对文档ID进行哈希，其结果再对分片数量取模，得到的结果即是索引文档的分片。

shard = hash(document_id) % (num_of_primary_shards)

当分片所在的节点接收到来自协调节点的请求后，会将该请求写入translog(我们将在本系列接下来的文章中讲到)，并将文档加入内存缓冲。如果请求在主分片上成功处理，该请求会并行发送到该分片的副本上。当translog被同步(fsync)到全部的主分片及其副本上后，客户端才会收到确认通知。

内存缓冲会被周期性刷新(默认是1秒)，内容将被写到文件系统缓存的一个新段上。虽然这个段并没有被同步(fsync)，但它是开放的，内容可以被搜索到。

每30分钟，或者当translog很大的时候，translog会被清空，文件系统缓存会被同步。这个过程在Elasticsearch中称为冲洗(flush)。在冲洗过程中，内存中的缓冲将被清除，内容被写入一个新段。段的fsync将创建一个新的提交点，并将内容刷新到磁盘。旧的translog将被删除并开始一个新的translog。

引用

剖析Elasticsearch集群：存储模型和读写操作

关键字：elasticsearch, translog, 分片, 节点

版权声明

本文来自互联网用户投稿，文章观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处。如若内容有涉嫌抄袭侵权/违法违规/事实不符，请点击举报进行投诉反馈！

标签：业界节点 elasticsearch 分片 translog

上一篇 > js 判断一组日期是否是连续的
下一篇 > node - 非阻塞的异步 IO

相关文章

张一鸣不过只是想要一个微博杀手，可是为什么这么难？

年底总结：复盘产品从0到1的研发过程

区块链应用案例：玩客云与链克，看区块链在C端应用

微信亿级用户异常检测框架的设计与实践

“高大上”的风控，究竟是什么？（三）

服务设计思维下节点转化思考

如何评估需求对公司的价值，简单三点概括

如何评估需求对公司的价值

产品需求思考 7 原则（二）

如何用 Fliestack 开发自己的 Soundcloud App？

改版实战！聊聊Pinterest官网再设计过程的经验思考

CentOS 7.安装ELK(Elasticsearch+Logstash+Kibana)

干货：在Mac平台上安装配置ELK时的一些总结

安装 Elasticsearch + Kubana + Marvel

大数据挑战——如何使用Druid实现数据聚合

JavaScript 中的DOM1

es的写入过程

elasticsearch的update_b_quer

[译] RethinkDB compared to MongoDB

Redis Cluster集群搭建

activiti-event-logger写入es

Kubernetes1.3上线可期待的新功能

Redis 的性能幻想与残酷现实

Elasticsearch * Reference1.7 Introduce

ookeeper：node

Elasticsearch river-jdbc used

市长信箱邮件查询服务: 在Docker上安装Elasticsearch集群作为服务

Elasticsearch plugins introduce

Elasticsearch installation-plugins

分布式搜索引擎（二）

Video.js视频控制及进度栏标记

es概念之shard

微信公众账号

微信扫一扫加关注