Hessian Bug修复
一、背景说明
近日开发同学说Php调用Java一个接口报错,表现是如果参数比较大,如56K就报错,其它情况下不报错。让其提供相应参数,发现一个参数的长度是81360,对应十六进制是13DD0,通过抓包发现,实际上传到Java这里长度只有3DD0
即上图中第7行,这是什么情况呢,还是从Hessian协议说起,Hessian中字符长度只能是2字节,即单包最多只能传65535字节,如果长度超过65535,则需要封多次包发送,官方说明如下:
string ::= x52 b1 b0 <utf8-data> string
::= S b1 b0 <utf8-data>
::= [x00-x1f] <utf8-data>
::= [x30-x33] b0 <utf8-data>
A 16-bit unicode character string encoded in UTF-8. Strings are encoded in chunks. x53 ('S') represents the final chunk and x52 ('R') represents any non-final chunk. Each chunk has a 16-bit unsigned integer length value.
The length is the number of 16-bit characters, which may be different than the number of bytes.
String chunks may not split surrogate pairs.
分几种情况:
如果长度在0到1f(31)之间,直接附上字符串;
如果32-1023之间又是一种编码,具体编码方式后面会上代码;
1024-65535之间又是另一种编码;
如果长度大于65535,则前面的包都是R开头的包,最后一个包才是S包,表示结束。
举个例子,如果字符串长度为81360,则应该是这样封包:
R,FFFF,<前66535个字符>
S,3DD1,<最末15825个字符>
其中,是不存在的,只是方便阅读作为间隔符。
具体细节可以看官方文档:
http://hessian.caucho.com/doc/hessian-serialization.html#anchor32
二、代码分析&解决
我们看Php代码实现:
function writeString($value){
$len = HessianUtils::stringLength($value);
if($len < 32){
return pack('C', $len)
. $this->writeStringData($value);
} else
if($len < 1024){
$b0 = 0x30 + ($len >> 8);
$stream = pack('C', $b0);
$stream .= pack('C', $len);
return $stream . $this->writeStringData($value);
} else {
$total = $len;
$stream = '';
$tag = 'S';
$stream .= $tag . pack('n', $len);
$stream .= $this->writeStringData($value);
return $stream;
}
}
可以看到最后一个else判断里,并没有判断剩余长度是否大于65535,所以导致上面的问题,修改后的代码如下:
function writeString($value)
{
$len = HessianUtils::stringLength($value);
if ($len < 32) {
return pack('C', $len)
. $this->writeStringData($value);
} else if ($len < 1024) {
$b0 = 0x30 + ($len >> 8);
$stream = pack('C', $b0);
$stream .= pack('C', $len);
return $stream . $this->writeStringData($value);
} else if ($len < 65536) {
$total = $len;
$stream = '';
$tag = 'S';
$stream .= $tag . pack('n', $len);
$stream .= $this->writeStringData($value);
return $stream;
} else {
$left = $len;
$offset = 0;
//数据包分R包和S包
$stream = '';
while ($left > 0) {
if ($left > 65535) {
$tag = 'R';
$stream .= $tag . pack('n', 65535);
$stream .= $this->writeStringData(substr($value, $offset, 65535));
$offset += 65535;
$left -= 65535;
} else {
$tag = 'S';
$stream .= $tag . pack('n', $left);
$stream .= $this->writeStringData(substr($value, $offset, $left));
$left = 0;
}
}
return $stream;
}
}
其实也可以参考Java代码的实现,
com.caucho.hessian.io.Hessian2Output用于Hessian封包,我们
看它的字符串封装:
while (length > 0x8000) {
int sublen = 0x8000;
offset = _offset;
if (SIZE <= offset + 16) {
flushBuffer();
offset = _offset;
}
// chunk can't end in high surrogate
char tail = value.charAt(strOffset + sublen - 1);
if (0xd800 <= tail && tail <= 0xdbff)
sublen--;
buffer[offset + 0] = (byte) BC_STRING_CHUNK;
buffer[offset + 1] = (byte) (sublen >> 8);
buffer[offset + 2] = (byte) (sublen);
_offset = offset + 3;
printString(value, strOffset, sublen);
length -= sublen;
strOffset += sublen;
}
offset = _offset;
if (SIZE <= offset + 16) {
flushBuffer();
offset = _offset;
}
if (length <= STRING_DIRECT_MAX) {
buffer[offset++] = (byte) (BC_STRING_DIRECT + length);
}
else if (length <= STRING_SHORT_MAX) {
buffer[offset++] = (byte) (BC_STRING_SHORT + (length >> 8));
buffer[offset++] = (byte) (length);
}
else {
buffer[offset++] = (byte) ('S');
buffer[offset++] = (byte) (length >> 8);
buffer[offset++] = (byte) (length);
}
_offset = offset;
printString(value, strOffset, length);
可以看到这里是以0x8000即32768作为单次包的最大字节数,如果大于32768就不断地封S包,剩下的才根据协议处理,当然其实现复杂些,引入了缓冲区,这里就不细讨论了。
- JavaScript 教程
- JavaScript 编辑工具
- JavaScript 与HTML
- JavaScript 与Java
- JavaScript 数据结构
- JavaScript 基本数据类型
- JavaScript 特殊数据类型
- JavaScript 运算符
- JavaScript typeof 运算符
- JavaScript 表达式
- JavaScript 类型转换
- JavaScript 基本语法
- JavaScript 注释
- Javascript 基本处理流程
- Javascript 选择结构
- Javascript if 语句
- Javascript if 语句的嵌套
- Javascript switch 语句
- Javascript 循环结构
- Javascript 循环结构实例
- Javascript 跳转语句
- Javascript 控制语句总结
- Javascript 函数介绍
- Javascript 函数的定义
- Javascript 函数调用
- Javascript 几种特殊的函数
- JavaScript 内置函数简介
- Javascript eval() 函数
- Javascript isFinite() 函数
- Javascript isNaN() 函数
- parseInt() 与 parseFloat()
- escape() 与 unescape()
- Javascript 字符串介绍
- Javascript length属性
- javascript 字符串函数
- Javascript 日期对象简介
- Javascript 日期对象用途
- Date 对象属性和方法
- Javascript 数组是什么
- Javascript 创建数组
- Javascript 数组赋值与取值
- Javascript 数组属性和方法
- 彻底解决小程序无法触发SESSION问题
- 如何搭建前端异常监控系统
- JS+CSS 3实现图片滑块效果
- 深入理解 AuthenticationManagerBuilder 【源码篇】
- 每天一道前端面试题:如何进行网站性能优化
- PowerBI DAX 度量值管理 - 驾驭度量值依赖关系,删除无效
- Git 实用命令小抄
- 手把手教你画酷炫环形图(图文详解)
- 为什么说神经网络可以逼近任意函数?
- 缩放|位移|渐变简单动画
- HTTP状态码及其含义
- 卷积神经网络中的参数共享/权重复制
- 前端面试基础题:从浏览器地址栏输入url到显示页面的步骤
- 学会这15个TS面试题,拿到更高薪的offer
- 前端面试基础题:请描述⼀下 cookies , sessionStorage 和 localStorage 的区别?