温馨提示
:在这里我再次提个小要求,希望大家能习惯看官方文档,文档虽然是英文但用词都比较简单,基本都能看懂文档表达的意思。授之以鱼不如授之以渔的道理相信大家都明白,也希望通过猿人谷的这个ZooKeeper系列,让大家入门、到熟悉,举一反三后能精通ZooKeeper。
在前一篇我们介绍了ZooKeeper单机版、伪集群和集群环境搭建 ,通过命令行的方式做了节点的创建、删除、更新、获取节点信息的测试。Zookeeper 的目的是为客户端构建复杂的协调功能提供简单、高效的核心 API,这一篇我们用Java通过ZooKeeper提供的API接口来实现这些增删改查的功能。
1 简介
org.apache.zookeeper.Zookeeper
是ZooKeeper客户端的主类,在官方文档 (该系列文章以v3.5.5为主,v3.6.6的API Docs还没有)中已明确说明(This is the main class of ZooKeeper client library.)。
This is the main class of ZooKeeper client library. To use a ZooKeeper service, an application must first instantiate an object of ZooKeeper class. All the iterations will be done by calling the methods of ZooKeeper class. The methods of this class are thread-safe unless otherwise noted.
Once a connection to a server is established, a session ID is assigned to the client. The client will send heart beats to the server periodically to keep the session valid.
创建一个ZooKeeper的实例来使用org.apache.zookeeper.Zookeeper
里的方法,官方文档已经指出没有特别声明的话,ZooKeeper类里的方法是线程安全
的。客户端连接到ZooKeeper服务的时候,会给客户端分配一个会话ID(session ID),客户端与服务端会通过心跳来保持会话有效。
org.apache.zookeeper.Zookeeper
里的方法非常多,就不一一列举了,只列几个增删改查的。
Method | Description |
---|---|
create(String path, byte[] data, List acl, CreateMode createMode) | Create a node with the given path. (创建指定路径的节点) |
create(String path, byte[] data, List acl, CreateMode createMode, AsyncCallback.Create2Callback cb, Object ctx) | The asynchronous version of create.(异步形式创建) |
create(String path, byte[] data, List acl, CreateMode createMode, Stat stat) | Create a node with the given path and returns the Stat of that node.(按指定路径创建节点并返回节点状态信息) |
delete(String path, int version) | Delete the node with the given path.(删除指定路径的节点) |
delete(String path, int version, AsyncCallback.VoidCallback cb, Object ctx) | The asynchronous version of delete.(异步删除指定路径的节点) |
exists(String path, boolean watch) | Return the stat of the node of the given path.(返回指定路径的节点状态信息) |
getChildren(String path, boolean watch) | Return the list of the children of the node of the given path.(返回指定路径的所有子节点状态信息) |
getData(String path, boolean watch, Stat stat) | Return the data and the stat of the node of the given path.(返回指定路径的节点数据和状态信息) |
setData(String path, byte[] data, int version) | Set the data for the node of the given path if such a node exists and the given version matches the version of the node (if the given version is -1, it matches any node’s versions).(给指定路径和版本的节点设置新值,如版本为-1,即给所有版本设置值) |
2 测试环境搭建
这里新建一个Spring Boot的项目来进行测试,新建Spring Boot项目的过程很简单,也不是这里的重点,就不做介绍了。
项目里会需要额外引入两个包来进行测试:
1 | <dependency> |
3 API测试
完整测试代码如下:
1 | /** |
上面有用到@Before
,简单说明下:
- @BeforeClass – 表示在类中的任意public static void方法执行之前执行
- @AfterClass – 表示在类中的任意public static void方法执行之后执行
- @Before – 表示在任意使用@Test注解标注的public void方法执行之前执行
- @After – 表示在任意使用@Test注解标注的public void方法执行之后执行
- @Test – 使用该注解标注的public void方法会表示为一个测试方法
如果将SESSION_TIME_OUT设置的时间太短,会报API客户端异常:org.apache.zookeeper.KeeperException$ConnectionLossException: KeeperErrorCode = ConnectionLoss for /zk_demo
。完整的报错信息如下:
1 | 09:33:52.139 [main-SendThread(106.12.111.172:2181)] DEBUG org.apache.zookeeper.ClientCnxnSocketNIO - Ignoring exception during shutdown input |
起初以为是ZooKeeper服务部署有问题或服务没启动,经检查确认无误后,debug调试发现,是SESSION_TIME_OUT = 2000;设置的值太小,改为10000后,不再报错。
SESSION_TIME_OUT 是
会话超时时间
,也就是当一个zookeeper超过该时间没有心跳,则认为该节点故障。所以,如果此值小于zookeeper的创建时间,则当zookeeper还未来得及创建连接,会话时间已到,因此抛出异常认为该节点故障。
3.1 创建会话
通过创建一个ZooKeeper实例来连接ZooKeeper服务器(详见ZooKeeper单机版、伪集群和集群环境搭建)。
官方提供了10种ZooKeeper构造方法和描述如下:
Constructor | Description |
---|---|
ZooKeeper(String connectString, int sessionTimeout, Watcher watcher) | To create a ZooKeeper client object, the application needs to pass a connection string containing a comma separated list of host:port pairs, each corresponding to a ZooKeeper server. |
ZooKeeper(String connectString, int sessionTimeout, Watcher watcher, boolean canBeReadOnly) | To create a ZooKeeper client object, the application needs to pass a connection string containing a comma separated list of host:port pairs, each corresponding to a ZooKeeper server. |
ZooKeeper(String connectString, int sessionTimeout, Watcher watcher, boolean canBeReadOnly, HostProvider aHostProvider) | To create a ZooKeeper client object, the application needs to pass a connection string containing a comma separated list of host:port pairs, each corresponding to a ZooKeeper server. |
ZooKeeper(String connectString, int sessionTimeout, Watcher watcher, boolean canBeReadOnly, HostProvider aHostProvider, ZKClientConfig clientConfig) | To create a ZooKeeper client object, the application needs to pass a connection string containing a comma separated list of host:port pairs, each corresponding to a ZooKeeper server. |
ZooKeeper(String connectString, int sessionTimeout, Watcher watcher, boolean canBeReadOnly, ZKClientConfig conf) | To create a ZooKeeper client object, the application needs to pass a connection string containing a comma separated list of host:port pairs, each corresponding to a ZooKeeper server. |
ZooKeeper(String connectString, int sessionTimeout, Watcher watcher, long sessionId, byte[] sessionPasswd) | To create a ZooKeeper client object, the application needs to pass a connection string containing a comma separated list of host:port pairs, each corresponding to a ZooKeeper server. |
ZooKeeper(String connectString, int sessionTimeout, Watcher watcher, long sessionId, byte[] sessionPasswd, boolean canBeReadOnly) | To create a ZooKeeper client object, the application needs to pass a connection string containing a comma separated list of host:port pairs, each corresponding to a ZooKeeper server. |
ZooKeeper(String connectString, int sessionTimeout, Watcher watcher, long sessionId, byte[] sessionPasswd, boolean canBeReadOnly, HostProvider aHostProvider) | To create a ZooKeeper client object, the application needs to pass a connection string containing a comma separated list of host:port pairs, each corresponding to a ZooKeeper server. |
ZooKeeper(String connectString, int sessionTimeout, Watcher watcher, long sessionId, byte[] sessionPasswd, boolean canBeReadOnly, HostProvider aHostProvider, ZKClientConfig clientConfig) | To create a ZooKeeper client object, the application needs to pass a connection string containing a comma separated list of host:port pairs, each corresponding to a ZooKeeper server. |
ZooKeeper(String connectString, int sessionTimeout, Watcher watcher, ZKClientConfig conf) | To create a ZooKeeper client object, the application needs to pass a connection string containing a comma separated list of host:port pairs, each corresponding to a ZooKeeper server. |
关于每种构造方法的英文描述用词都很简单,基本都能看的很明白,根据实际的应用场景选取相应的构造方法。
有传入参数中包括sessionId和sessionPasswd的构造方法,分别代表会话ID
和会话密钥
。这两个参数能够唯一确定一个会话,同时客户端使用这两个参数可以实现客户端会话复用
,从而达到恢复会话的效果。具体使用方法是第一次连接上ZooKeeper服务器时,通过调用ZooKeeper对象实例的以下两个接口,即可获取当前会话的ID和密钥:long getSessionId(); byte[] getSessionPasswd();获取到这两个参数值之后,就可以在下次创建ZooKeeper对象实例的时候传入构造方法了。
选取几个典型的构造方法来带领大家解读下文档。
3.1.1 ZooKeeper(String connectString, int sessionTimeout, Watcher watcher)
1 | public ZooKeeper(String connectString, |
有一点需要特别说明下,文档说客户端和服务端建立会话是异步
的。构造方法会在处理完客户端初始化工作后立即返回,在通常情况下,此时并没有真正建立好一个可用的会话,此时在会话的生命周期中处于“CONNECTING”的状态。当该会话真正创建完毕后,ZooKeeper服务端会向会话对应的客户端发送一个事件通知,以告知客户端,客户端只有在获取这个通知后,才算真正建立了会话。
实例化的ZooKeeper客户端对象将从connectString列举的服务器中随机
选择一个服务器,并尝试连接到该服务器。如果建立连接失败,将尝试连接另一个服务器(顺序是不确定的
,因为列举的服务器是随机洗牌的),直到建立连接。即客户端连接一个服务器失败,将继续尝试,直到会话显式关闭。
从3.2.0版本
开始添加了可选的”chroot”后缀,意思就是可将“chroot”加在connectString中列举的服务器后面,即客户端连上ZooKeeper服务器后,所有对ZooKeeper的操作都会基于这个根目录
。
对参数做下简要说明:
参数 | 描述 |
---|---|
connectString | 指定ZooKeeper服务器列表,有英文逗号分隔的host:port字符串组成,如”127.0.0.1:3000,127.0.0.1:3001,127.0.0.1:3002”。可以指定客户端连上connectString中服务器后的根目录,如 “127.0.0.1:3000,127.0.0.1:3001,127.0.0.1:3002/app/a” ,对ZooKeeper的操作都会基于/app/a这个根目录,即创建路径为”/foo/bar”的节点,实际该节点的路径为”/app/a/foo/bar” 。 |
sessionTimeout | 会话的超时事件,以“毫秒”为单位的整型值。在一个会话周期内,ZooKeeper客户端和服务器之间会通过心跳检测机制来维持会话的有效性,一旦在sessionTimeout时间内没有进行有效的心跳检测,会话就会失效。 |
watcher | ZooKeeper允许客户端在构造方法中传入一个接口Watcher(org.apache.zookeeper.Watcher)的实现类对象来作为默认的Watch事件通知器。该参数也可以设置为null,表明不需要设置默认的Watch处理器。 |
3.1.2 ZooKeeper(String connectString, int sessionTimeout, Watcher watcher, boolean canBeReadOnly)
1 | public ZooKeeper(String connectString, |
这个构造方法跟上个方法非常相似,只是从3.4版本
开始多了一个canBeReadOnly
参数,用于标识当前会话是否支持“read-only”模式(只读模式
)。默认情况下,在ZooKeeper集群中,一个节点如果和集群中过半及以上节点失去网络连接(建立不了连接),那么这个机器将不再处理客户端请求(包括读写请求)。但是在某些使用场景下,当ZooKeeper服务器发生此类故障的时候,还是希望ZooKeeper服务器能够提供读服务(写服务肯定无法提供),这就是ZooKeeper的“read-only”模式
。但客户端可以连接某一分区的服务器,它将以只读模式连接到其中一个服务器,允许读取请求,而不允许写入请求,然后继续在后台寻找更多数的服务器(这一句我描述的不够简练精准)。
3.2 新增
1 | public String create(String path, |
Talk is cheap. Show me the code.这里我们不瞎BB,直接上官方文档。官方文档是不是很容易看懂,而且解释的非常清楚(而且稍显啰嗦的感觉)?
这里简单列下文档中的几个关键点:
按指定路径和节点形式创建,可指定节点为持久节点、临时节点等。
这里要说下CreateMode
,大家可能都说ZooKeeper只有4种形式的节点(持久、临时、持久顺序、临时顺序),看文档的话,其实是有7种
形式的。1
2
3
4
5
6
7
8
9public enum CreateMode {
PERSISTENT(0, false, false, false, false),
PERSISTENT_SEQUENTIAL(2, false, true, false, false),
EPHEMERAL(1, true, false, false, false),
EPHEMERAL_SEQUENTIAL(3, true, true, false, false),
CONTAINER(4, false, false, true, false),
PERSISTENT_WITH_TTL(5, false, false, false, true),
PERSISTENT_SEQUENTIAL_WITH_TTL(6, false, true, false, true);
}- PERSISTENT:持久节点(也有叫永久节点的),不会随着会话的结束而自动删除。
- PERSISTENT_SEQUENTIAL:带单调递增序号的持久节点,不会随着会话的结束而自动删除。
- EPHEMERAL:临时节点,会随着会话的结束而自动删除。
- EPHEMERAL_SEQUENTIAL:带单调递增序号的临时节点,会随着会话的结束而自动删除。
CONTAINER
:容器节点,用于Leader、Lock等特殊用途,当容器节点不存在任何子节点时,容器将成为服务器在将来某个时候删除的候选节点。PERSISTENT_WITH_TTL
:带TTL(time-to-live,存活时间)的持久节点,节点在TTL时间之内没有得到更新并且没有子节点,就会被自动删除。PERSISTENT_SEQUENTIAL_WITH_TTL
:带TTL(time-to-live,存活时间)和单调递增序号的持久节点,节点在TTL时间之内没有得到更新并且没有子节点,就会被自动删除。
- 如果指令路径和版本的节点已经存在,则会抛出一个KeeperException异常。
临时节点不能有子节点
。如果给临时节点创建子节点会抛KeeperException异常。- 临时节点的生命周期与客户端会话绑定。一旦客户端会话失效(客户端与 Zookeeper连接断开不一定会话失效),那么这个客户端创建的所有临时节点都会被移除。
byte[] data允许的最大数据量为1MB(1,048,576 bytes)
。如果超过,会抛KeeperExecption。
运行创建节点的代码:
1 |
|
可以通过日志信息得到节点创建成功:
1 | DEBUG org.apache.zookeeper.ClientCnxn - Reading reply sessionid:0x101402626bb000b, packet:: clientPath:null serverPath:null finished:false header:: 1,1 replyHeader:: 1,12884901937,0 request:: '/zk_demo,#616e6e6132303139,v{s{31,s{'world,'anyone}}},0 response:: '/zk_demo |
在服务端查看,/zk_demo节点创建成功:
1 | [zk: 127.0.0.1:2181(CONNECTED) 21] ls / |
3.3 获取
1 | public byte[] getData(String path, |
指定路径的节点不存在时就抛KeeperException.NoNode异常。
运行:
1 |
|
结果:
1 | 13:51:00.288 [main] INFO com.yuanrengu.demo.ZooKeeperDemo - /zk_demo的信息:anna2019 |
3.4 更新
1 | public Stat setData(String path, |
主要注意以下几点:
- 版本为-1时,即代表适配指定路径节点的所有版本。
- 如果指定路径的节点不存在会抛KeeperException.NoNode异常,该节点没有传入的版本,会抛KeeperException.BadVersion异常。
byte[] data允许的最大数据量为1MB(1,048,576 bytes)
。如果超过,会抛KeeperExecption。
运行:
1 |
|
可以看到数据已经更新:
1 | 15:46:16.472 [main] INFO com.yuanrengu.demo.ZooKeeperDemo - yuanrengu |
更新的接口提到了版本的概念,上面提到版本为-1时,即代表适配指定路径节点的所有版本。节点每次setData时版本会加1,更新时指定的版本不存在会报KeeperException.BadVersion异常
。我们做个测试:
1 |
|
运行结果如下:
1 | 09:56:00.931 [main-SendThread(106.12.111.172:2181)] DEBUG org.apache.zookeeper.ClientCnxn - Reading reply sessionid:0x1014dce26220008, packet:: clientPath:null serverPath:null finished:false header:: 1,5 replyHeader:: 1,12884902005,0 request:: '/versionDemo,#7975616e72656e677532303230,-1 response:: s{12884901996,12884902005,1576720362715,1576720560918,1,0,0,0,13,0,12884901996} |
测试代码进行了3次setData操作,第一次setData时传入的版本为-1,成功后version变为1;第二次setData时传入的version为1,成功后version变为2;第三次setData时传入的版本为1,此时就抛了KeeperException.BadVersion异常。如果第三次setData传入的版本为-1,能更新成功。
3.5 删除
1 | public void delete(String path, |
节点可能含有子节点,删除节点的操作有几点需要特别注意:
- 版本为-1时,即代表适配指定路径节点的所有版本。
- 如果指定路径的节点不存在会抛KeeperException.NoNode异常,该节点没有传入的版本,会抛KeeperException.BadVersion异常。
如果节点含有子节点,删除父节点(parent node)时会抛KeeperException.NotEmpty异常。
在ZooKeeper中,只允许删子节点。如果一个节点存在一个或多个子节点,该节点就无法被直接删除,必须先删除所有子节点。
/app1有子节点,我们做下删除操作:
1 | /** |
可以看到日志:
1 | org.apache.zookeeper.KeeperException$NotEmptyException: KeeperErrorCode = Directory not empty for /app1 |
4 总结
上面我们实现了节点的增、删、改、查的测试,后面的篇章会有更多好玩的用法,如实现分布式锁、配置中心等。
基于上面的分析,总结几个注意的点:
- 节点有
7种形式
:
- PERSISTENT:持久节点(也有叫永久节点的),不会随着会话的结束而自动删除。
- PERSISTENT_SEQUENTIAL:带单调递增序号的持久节点,不会随着会话的结束而自动删除。
- EPHEMERAL:临时节点,会随着会话的结束而自动删除。
- EPHEMERAL_SEQUENTIAL:带单调递增序号的临时节点,会随着会话的结束而自动删除。
CONTAINER
:容器节点,用于Leader、Lock等特殊用途,当容器节点不存在任何子节点时,容器将成为服务器在将来某个时候删除的候选节点。PERSISTENT_WITH_TTL
:带TTL(time-to-live,存活时间)的持久节点,节点在TTL时间之内没有得到更新并且没有子节点,就会被自动删除。PERSISTENT_SEQUENTIAL_WITH_TTL
:带TTL(time-to-live,存活时间)和单调递增序号的持久节点,节点在TTL时间之内没有得到更新并且没有子节点,就会被自动删除。
- 临时节点不能有子节点。如果给临时节点创建子节点会抛KeeperException异常。
- 临时节点的生命周期与客户端会话绑定。一旦客户端会话失效(客户端与 Zookeeper连接断开不一定会话失效),那么这个客户端创建的所有临时节点都会被移除。
byte[] data允许的最大数据量为1MB(1,048,576 bytes)
。