需要注意的是:发送心跳的对象并不是datanode,而是一个名为namenode的对象,难道在datanode端就直接有个namenode的引用吗?其实不然,我们来看看这个namenode吧:
代码二:namenode其实是一个DatanodeProtocol的引用,在对hadoop RPC机制分析的文章中我提到过,这是一个Datanode和Namenode通信的协议,其中有许多未实现的接口方法,sendHeartbeat()就是其中的一个。下面看看这个namenode对象是怎么被实例化的吧:
代码三:其实这个namenode并不是Namenode的一个对象,而只是一个Datanode端对Namenode的代理对象,正是这个代理完成了“心跳”。代理的底层实现就是RPC机制了。
三.Tasktracker、Jobtracker心跳源码分析 同样我们从Tasktracker入手,下面贴出Tasktracker.class的关键代码: 代码四:其实我觉得分析到这里大家就可以自己分析了,jobClient也是一个协议:
代码五:该协议用于定义Tasktracker和Jobtracker的通信。同样,它也是一个代理对象:
代码六: