您的位置:首页 > 理论基础 > 计算机网络

RPC服务和HTTP服务对比

2018-03-13 19:13 363 查看


RPC服务和HTTP服务对比

很长时间以来都没有怎么好好搞清楚RPC(即Remote Procedure Call,远程过程调用)和HTTP调用的区别,不都是写一个服务然后在客户端调用么?这里请允许我迷之一笑~Naive!本文简单地介绍一下两种形式的C/S架构,先说一下他们最本质的区别,就是RPC主要是基于TCP/IP协议的,而HTTP服务主要是基于HTTP协议的,我们都知道HTTP协议是在传输层协议TCP之上的,所以效率来看的话,RPC当然是要更胜一筹啦!下面来具体说一说RPC服务和HTTP服务。

OSI网络七层模型

在说RPC和HTTP的区别之前,我觉的有必要了解一下OSI的七层网络结构模型(虽然实际应用中基本上都是五层),它可以分为以下几层: (从上到下)第一层:应用层。定义了用于在网络中进行通信和传输数据的接口;
第二层:表示层。定义不同的系统中数据的传输格式,编码和解码规范等;
第三层:会话层。管理用户的会话,控制用户间逻辑连接的建立和中断;
第四层:传输层。管理着网络中的端到端的数据传输;
第五层:网络层。定义网络设备间如何传输数据;
第六层:链路层。将上面的网络层的数据包封装成数据帧,便于物理层传输;
第七层:物理层。这一层主要就是传输这些二进制数据。
实际应用过程中,五层协议结构里面是没有表示层和会话层的。应该说它们和应用层合并了。我们应该将重点放在应用层和传输层这两个层面。因为HTTP是应用层协议,而TCP是传输层协议。好,知道了网络的分层模型以后我们可以更好地理解为什么RPC服务相比HTTP服务要Nice一些!

RPC服务

从三个角度来介绍RPC服务:分别是RPC架构,同步异步调用以及流行的RPC框架。

RPC架构

先说说RPC服务的基本架构吧。允许我可耻地盗一幅图哈~我们可以很清楚地看到,一个完整的RPC架构里面包含了四个核心的组件,分别是Client ,Server,Client Stub以及Server Stub,这个Stub大家可以理解为存根。分别说说这几个组件:客户端(Client),服务的调用方。
服务端(Server),真正的服务提供者。
客户端存根,存放服务端的地址消息,再将客户端的请求参数打包成网络消息,然后通过网络远程发送给服务方。
服务端存根,接收客户端发送过来的消息,将消息解包,并调用本地的方法。


RPC主要是用在大型企业里面,因为大型企业里面系统繁多,业务线复杂,而且效率优势非常重要的一块,这个时候RPC的优势就比较明显了。实际的开发当中是这么做的,项目一般使用maven来管理。比如我们有一个处理订单的系统服务,先声明它的所有的接口(这里就是具体指Java中的
interface
),然后将整个项目打包为一个
jar
包,服务端这边引入这个二方库,然后实现相应的功能,客户端这边也只需要引入这个二方库即可调用了。为什么这么做?主要是为了减少客户端这边的
jar
包大小,因为每一次打包发布的时候,
jar
包太多总是会影响效率。另外也是将客户端和服务端解耦,提高代码的可移植性。

同步调用与异步调用

什么是同步调用?什么是异步调用?
同步调用
就是客户端等待调用执行完成并返回结果。
异步调用
就是客户端不等待调用执行完成返回结果,不过依然可以通过回调函数等接收到返回结果的通知。如果客户端并不关心结果,则可以变成一个单向的调用。这个过程有点类似于Java中的
callable
runnable
接口,我们进行异步执行的时候,如果需要知道执行的结果,就可以使用
callable
接口,并且可以通过
Future
类获取到异步执行的结果信息。如果不关心执行的结果,直接使用
runnable
接口就可以了,因为它不返回结果,当然啦,
callable
也是可以的,我们不去获取
Future
就可以了。

流行的RPC框架

目前流行的开源RPC框架还是比较多的。下面重点介绍三种:gRPC是Google最近公布的开源软件,基于最新的HTTP2.0协议,并支持常见的众多编程语言。 我们知道HTTP2.0是基于二进制的HTTP协议升级版本,目前各大浏览器都在快马加鞭的加以支持。 这个RPC框架是基于HTTP协议实现的,底层使用到了Netty框架的支持。
Thrift是Facebook的一个开源项目,主要是一个跨语言的服务开发框架。它有一个代码生成器来对它所定义的IDL定义文件自动生成服务代码框架。用户只要在其之前进行二次开发就行,对于底层的RPC通讯等都是透明的。不过这个对于用户来说的话需要学习特定领域语言这个特性,还是有一定成本的。
Dubbo是阿里集团开源的一个极为出名的RPC框架,在很多互联网公司和企业应用中广泛使用。协议和序列化框架都可以插拔是及其鲜明的特色。同样 的远程接口是基于Java Interface,并且依托于spring框架方便开发。可以方便的打包成单一文件,独立进程运行,和现在的微服务概念一致。
偷偷告诉你
集团内部已经不怎么使用dubbo啦,现在用的比较多的叫HSF,又名“好舒服”。后面有可能会开源,大家拭目以待。

HTTP服务

其实在很久以前,我对于企业开发的模式一直定性为HTTP接口开发,也就是我们常说的RESTful风格的服务接口。的确,对于在接口不多、系统与系统交互较少的情况下,解决信息孤岛初期常使用的一种通信手段;优点就是简单、直接、开发方便。利用现成的http协议进行传输。我们记得之前本科实习在公司做后台开发的时候,主要就是进行接口的开发,还要写一大份接口文档,严格地标明输入输出是什么?说清楚每一个接口的请求方法,以及请求参数需要注意的事项等。比如下面这个例子:
POST http://www.httpexample.com/restful/buyer/info/share[/code] 接口可能返回一个JSON字符串或者是XML文档。然后客户端再去处理这个返回的信息,从而可以比较快速地进行开发。但是对于大型企业来说,内部子系统较多、接口非常多的情况下,RPC框架的好处就显示出来了,首先就是长链接,不必每次通信都要像http一样去3次握手什么的,减少了网络开销;其次就是RPC框架一般都有注册中心,有丰富的监控管理;发布、下线接口、动态扩展等,对调用方来说是无感知、统一化的操作。

总结

RPC服务和HTTP服务还是存在很多的不同点的,一般来说,RPC服务主要是针对大型企业的,而HTTP服务主要是针对小企业的,因为RPC效率更高,而HTTP服务开发迭代会更快。总之,选用什么样的框架不是按照市场上流行什么而决定的,而是要对整个项目进行完整地评估,从而在仔细比较两种开发框架对于整个项目的影响,最后再决定什么才是最适合这个项目的。一定不要为了使用RPC而每个项目都用RPC,而是要因地制宜,具体情况具体分析。

知乎回答:

这个回答里恰巧讲了一些rpc通信协议的细节,但是强调一遍通信协议不是rpc最重要的部分,不要被这个回答带偏了。如果要了解rpc请更多的去了解服务治理(soa)的一些基本策略,推荐去看看dubbo的文档。
这个问题其实是有理解误区的,首先 http 和 rpc 并不是一个并行概念。
rpc是远端过程调用,其调用协议通常包含传输协议和编码协议。
传输协议包含: 如著名的 [gRPC](grpc / grpc.io) 使用的 http2 协议,也有如dubbo一类的自定义报文的tcp协议。
编码协议包含: 如基于文本编码的 xml json,也有二进制编码的 protobuf binpack 等。

PS:二进制编码和文本编码的速度差距
json是这些年慢慢兴起的轻量级数据交换格式。比起老大哥XML。因其更快的解析速度和更小的体积,可谓是用过的都说好。一般情况下json足够满足你的大多数需求,但是在计算机领域,没有最快,只有更快。
当你的传输数据大到一定程度的时候,json的速度也不能满足你需求的时候,你就需要更快的protobuf。
protocolbuffer(以下简称PB)是google 的一种数据交换的格式,它独立于语言,独立于平台。(百度百科)。
因为其使用二进制存储,所以会比json更快。但是缺点也是显而易见,二进制存储易读性很差。
我曾遇到要解析40M json的需求。在PC端,使用litjson需要解析10秒钟。但是将相同的内容通过protobuf再导出成bytes。只要17M。缩小了2.5倍左右。但是读取速度只要0.8秒,还包括了数据解析后的处理。
0.1秒和0.008秒可能给人差别不大,但是10秒和0.8秒的差别真的是天壤地别。

如果需要传输的数据量比较大时,protobuf是你的不二选择。

因此我理解的你想问的问题应该是:为什么要使用自定义 tcp 协议的 rpc 做后端进程通信?
要解决这个问题就应该搞清楚 http 使用的 tcp 协议,和我们自定义的 tcp 协议在报文上的区别。
首先要否认一点 http 协议相较于自定义tcp报文协议,增加的开销在于连接的建立与断开。http协议是支持连接池复用的,也就是建立一定数量的连接不断开,并不会频繁的创建和销毁连接。二一要说的是http也可以使用protobuf这种二进制编码协议对内容进行编码,因此二者最大的区别还是在传输协议上。
通用定义的http1.1协议的tcp报文包含太多废信息,一个POST协议的格式大致如下
HTTP/1.0 200 OK
Content-Type: text/plain
Content-Length: 137582
Expires: Thu, 05 Dec 1997 16:00:00 GMT
Last-Modified: Wed, 5 August 1996 15:55:28 GMT
Server: Apache 0.84

<html>
<body>Hello World</body>
</html>
即使编码协议也就是body是使用二进制编码协议,报文元数据也就是header头的键值对却用了文本编码,非常占字节数。如上图所使用的报文中有效字节数仅仅占约 30%,也就是70%的时间用于传输元数据废编码。当然实际情况下报文内容可能会比这个长,但是报头所占的比例也是非常可观的。
那么假如我们使用自定义tcp协议的报文如下
<img data-rawheight="188" src="https://pic3.zhimg.com/50/v2-89c905b0806577471aa7789a25ac0d44_hd.jpg" data-rawwidth="1220" class="origin_image zh-lightbox-thumb" width="1220" data-original="https://pic3.zhimg.com/v2-89c905b0806577471aa7789a25ac0d44_r.jpg">报头占用的字节数也就只有16个byte,极大地精简了传输内容。
这也就是为什么后端进程间通常会采用自定义tcp协议的rpc来进行通信的原因。
-- 分割线 2017.08.03 --
可能回答里面没有描述清楚,这个回答仅仅是用来纠正victory的回答的。所谓的效率优势是针对http1.1协议来讲的,http2.0协议已经优化编码效率问题,像grpc这种rpc库使用的就是http2.0协议。这么来说吧http容器的性能测试单位通常是kqps,自定义tpc协议则通常是以10kqps到100kqps为基准
简单来说成熟的rpc库相对http容器,跟多的是封装了“服务发现”,"错误重试"一类面向服务的高级特性。可以这么理解,rpc框架是面向服务的更高级的封装。如果把一个http server容器上封装一层服务发现和函数代理调用,那它就已经可以做一个rpc框架了。
所以为什么要用rpc调用?

因为良好的rpc调用是面向服务的封装,针对服务的可用性和效率等都做了优化。单纯使用http调用则缺少了这些特性。

知乎回答2:
HTTP严格来说跟RPC不是一个层级的概念。HTTP本身也可以作为RPC的传输层协议。    我理解你的意思是,RPC应用场景是企业内网服务间的调用,HTTP可以做到跨语言的传输,但是企业的复杂技术需求通常对于远程调用需要做到包含但不止以下几种需求:  (1)下游路由配置,服务治理。调用的下游服务处在重启、扩容状态或者某些机器下线,需要及时关闭对应机器的流量,避免造成不可用。调整不同主机的流量配比,调整流量的路由策略(round-robin, session-sticked,random..)。还有更加细化的同地区、同机房调用优先等策略。  (2)负载均衡。将流量平均打到下游服务的所有机器上。  (3)服务降级、熔断。当下游服务调用错误率显著增高后,及时熔断避免影响上游服务,服务恢复后及时恢复流量。自动降级到fallback,等。    HTTP请求通常配置了域名,需要先经由DNS解析获取ip地址。  而内网的HTTP调用通常需要经过一个proxy实现上面说的这些功能,然后再到Backend的服务器上。甚至,Proxy集群本身做了业务部署的隔离,在DNS解析完成后,需要经过一层LVS做虚拟主机,路由到对应的proxy集群(通常是nginx),再经由proxy得到对应upstream backend的ip和port,再进行通信。甚至在很多企业,可能需要经过很多层的proxy,才能到达backend。  而大部分企业的rpc框架,诸如负载均衡,服务治理,或者自动熔断/降级均在客户端的框架代码内实现。Upstream列表维护在Zookeeper或者Consul或者etcd这些服务,在客户端做负载均衡等功能,避免了经过代理带来的额外网络和代理处理的开销,极大提高了远程调用的效率和部署复杂度。只有对外的api服务需要proxy。  事实上,对于http,也可以作为RPC框架的通信层协议和实现。无需多层的proxy,直接和服务端Host做通信。诸如负载均衡、服务治理均与RPC调用无区别。  只不过,对于大部分企业成熟的RPC框架,使用thrift等工具可以实现二进制传输,相比HTTP的文本传输无疑大大提高了传输效率;HTTP通常使用的json,一个需要用户序列化/反序列化,性能和复杂度较高。相比之下,Thrift等工具,使用了成熟的代码生成技术,将通信接口的IDL文件生成了对应语言的代码接口,实现了远程调用接近于本地方法的调用。另外无论是网络传输编码、解码,还是传输内容大小还是网络开销都想比HTTP有较大的优势,另外一个企业内部的开发语言、框架不会有太大的异构性,使用RPC是大势所趋。HTTP并无优势。
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: