ue4同c#通信时的中文乱码问题

转：https://blog.csdn.net/XIAOZHI0999/article/details/80785570

本文讨论C#同ue4进行通信，出现的中文乱码情况，其他语言类似。

本文分两种情况讨论，

1.C#向ue4发送string

在C#发送string时，要先区分发送的字符串中是否包含中文，判断方法很简单，如下：

private bool IsPureAnsi(string str)
{
for (int i = 0; i < str.Length; ++i)
{
if ((int)str[i] > 127)
{
return false;
}
}

return true;
}
当string中不包含中文时，每个字符占1个字节，string前要先发送string的长度，占4个字节，string结束要加'\0'结尾（c传统）
当string中包含中文时，每个字节占用2个字节，格式同上（注意string长度无需*2，而且string长度要取反，string结尾需要两个字节的'\0'）

具体代码如下：

public byte[] StringToBytes(string str)
{
Stream stream = new MemoryStream();

if (this.IsPureAnsi(str))
{
byte[] strLenBytes = System.BitConverter.GetBytes(str.Length + 1);
stream.Write(strLenBytes, 0, strLenBytes.Length);

byte[] strBytes = Encoding.ASCII.GetBytes(str);
stream.Write(strBytes, 0, strBytes.Length);
stream.WriteByte(0);
}
else
{
int strLen = str.Length + 1;
byte[] strLenBytes = System.BitConverter.GetBytes(-strLen);
stream.Write(strLenBytes, 0, strLenBytes.Length);

byte[] strBytes = Encoding.Unicode.GetBytes(str);
stream.Write(strBytes, 0, strBytes.Length);
stream.WriteByte(0);
stream.WriteByte(0);
}

return StreamToBytes(stream);
}
2.ue4向C#发送string
这种情况，ue4端照常发送，c#解析的时候需要做一定处理

c#在接收到string数据时，先取出string长度信息，如果string长度>=0,则说明c#接收到的string是ascii编码，如果小于0，说明接收到的string是unicode编码

具体代码如下

public String GetString(byte[] data, int index, out int outIndex)
{
int strLen = System.BitConverter.ToInt32(data, index);
bool Ascii = strLen >= 0;
if (Ascii)
{
outIndex = index + 4 + strLen;

int begin = index + 4;
int end = outIndex;
byte[] byteStr = data.Skip(begin).Take(end - begin - 1).ToArray();

string str = Encoding.Default.GetString(byteStr);
return str;
}
else
{
strLen = -strLen;
outIndex = index + 4 + strLen*2;

int begin = index + 4;
int end = outIndex;
byte[] byteStr = data.Skip(begin).Take(end - begin - 2).ToArray();

string str = Encoding.Unicode.GetString(byteStr);
return str;
}
}
以上内容主要参考的是ue4中的源码，具体源码如下：
FArchive& operator<<( FArchive& Ar, FString& A )
{
// > 0 for ANSICHAR, < 0 for UCS2CHAR serialization

if (Ar.IsLoading())
{
int32 SaveNum;
Ar << SaveNum;

bool LoadUCS2Char = SaveNum < 0;
if (LoadUCS2Char)
{
SaveNum = -SaveNum;
}

// If SaveNum is still less than 0, they must have passed in MIN_INT. Archive is corrupted.
if (SaveNum < 0)
{
Ar.ArIsError = 1;
Ar.ArIsCriticalError = 1;
UE_LOG(LogNetSerialization, Error, TEXT("Archive is corrupted"));
return Ar;
}

auto MaxSerializeSize = Ar.GetMaxSerializeSize();
// Protect against network packets allocating too much memory
if ((MaxSerializeSize > 0) && (SaveNum > MaxSerializeSize))
{
Ar.ArIsError = 1;
Ar.ArIsCriticalError = 1;
UE_LOG( LogNetSerialization, Error, TEXT( "String is too large" ) );
return Ar;
}

// Resize the array only if it passes the above tests to prevent rogue packets from crashing
A.Data.Empty (SaveNum);
A.Data.AddUninitialized(SaveNum);

if (SaveNum)
{
if (LoadUCS2Char)
{
// read in the unicode string and byteswap it, etc
auto Passthru = StringMemoryPassthru<UCS2CHAR>(A.Data.GetData(), SaveNum, SaveNum);
Ar.Serialize(Passthru.Get(), SaveNum * sizeof(UCS2CHAR));
// Ensure the string has a null terminator
Passthru.Get()[SaveNum-1] = '\0';
Passthru.Apply();

INTEL_ORDER_TCHARARRAY(A.Data.GetData())

// Since Microsoft's vsnwprintf implementation raises an invalid parameter warning
// with a character of 0xffff, scan for it and terminate the string there.
// 0xffff isn't an actual Unicode character anyway.
int Index = 0;
if(A.FindChar(0xffff, Index))
{
A[Index] = '\0';
A.TrimToNullTerminator();
}
}
else
{
auto Passthru = StringMemoryPassthru<ANSICHAR>(A.Data.GetData(), SaveNum, SaveNum);
Ar.Serialize(Passthru.Get(), SaveNum * sizeof(ANSICHAR));
// Ensure the string has a null terminator
Passthru.Get()[SaveNum-1] = '\0';
Passthru.Apply();
}

// Throw away empty string.
if (SaveNum == 1)
{
A.Data.Empty();
}
}
}
else
{
bool SaveUCS2Char = Ar.IsForcingUnicode() || !FCString::IsPureAnsi(*A);
int32 Num = A.Data.Num();
int32 SaveNum = SaveUCS2Char ? -Num : Num;

Ar << SaveNum;

A.Data.CountBytes( Ar );

if (SaveNum)
{
if (SaveUCS2Char)
{
// TODO - This is creating a temporary in order to byte-swap. Need to think about how to make this not necessary.
#if !PLATFORM_LITTLE_ENDIAN
FString ATemp = A;
FString& A = ATemp;
INTEL_ORDER_TCHARARRAY(A.Data.GetData());
#endif

Ar.Serialize((void*)StringCast<UCS2CHAR>(A.Data.GetData(), Num).Get(), sizeof(UCS2CHAR)* Num);
}
else
{
Ar.Serialize((void*)StringCast<ANSICHAR>(A.Data.GetData(), Num).Get(), sizeof(ANSICHAR)* Num);
}
}
}

return Ar;
}
注意，ue4,发送和接收数据都是用这段代码，Ar.IsLoading()为true代表接收数据，否则为发送数据
---------------------
作者：--小智--
来源：CSDN
原文：https://blog.csdn.net/XIAOZHI0999/article/details/80785570
版权声明：本文为博主原创文章，转载请附上博文链接！

ue4同c#通信时的中文乱码问题的更多相关文章

[MacOS] 终端使用ssh时，中文乱码问题处理
终端显示中文问题处理: vim ~/.inputrc 加入以下代码 set meta-flag on set convert-meta off set input-meta on set output ...
解决在Linux下安装Oracle时的中文乱码问题
本帖最后由 TsengYia 于 2012-2-22 17:06 编辑解决在Linux下安装Oracle时的中文乱码问题操作系统:Red Hat Enterprise Linux 6.1数据库:O ...
(转)MySQL 插入数据时，中文乱码问题的解决
MySQL 插入数据时,中文乱码问题的解决原文:http://www.cnblogs.com/sunzn/archive/2013/03/14/2960248.html 当向 MySQL 数据库插 ...
IDEA使用maven构建时控制台中文乱码的解决办法
使用maven clean install 项目时控制台中文乱码,解决办法如下: Setting->maven->runner VMoptions: -Dfile.encoding=UTF ...
source命令导入.sql文件时，中文乱码或者是注释乱码
1.source命令导入.sql文件时,中文乱码或者是注释乱码首先进入dos命令,进入mysql数据库,之后use 数据库:之后查看你的mysql数据库编码如下命令:模糊查询变量charact ...
Java通信过程的中文乱码的解决
J在基于Java的编程中,常常会碰到汉字的处里及显示的问题.比方一大堆乱码或问号. 这是由于JAVA中默认的编码方式是UNICODE.而中国人通常使用的文件和DB都是基于GB2312或者BIG5等编码 ...
关于struts2中表单提交时，中文乱码问题的解决
http://blog.csdn.net/hjw506848887/article/details/8966194 今天写项目时,突然遇到了struts2中表单提交的中文乱码问题,调了好久就是不知道答 ...
Tomcat 处理请求时的中文乱码问题
利用Tomcat8作为服务器,采用servlet接收前端请求后进行处理的过程中,前台请求中有中文时,中文信息变成了乱码. 经过调试和查阅,发现Tomcat在处理get请求和post请求是有区别的.参照 ...
action接收到来自jsp页面的请求时出现中文乱码问题处理方法
写JSP程序时,在Servlet中取请求参数时出现了乱码,当然,这种乱码问题再简单不过了.由于在JSP中使用了GBK作用页面的编码,那么提交的中文信息自然也会被按着GBK进行编码,为%xx格式的GBK ...

随机推荐

mysql TO_DAYS()
mysql TO_DAYS(date) 函数 TO_DAYS(date) 给定一个日期date, 返回一个天数 (从年份0开始的天数 ). mysql> SELECT TO_DAYS(95050 ...
ArduinoUno和Leonardo的区别
学习过Arduino的同学对ArduinoUno和Lenardo的不同点会有所了解,但说起具体的区别估计还是很多人答不上来,今天我们就详细解释下Arduino Uno和Leonardo的不同. 我们从 ...
elasticsearch 中文API river
river-jdbc 安装 ./bin/plugin --install jdbc --url http://xbib.org/repository/org/xbib/elasticsearch/pl ...
使用 jQuery 设置 disabled 属性与移除 disabled 属性
表单中readOnly和disabled的区别:Readonly只针对input(text/ password)和textarea有效,而disabled对于所有的表单元素都有效,包括select,r ...
Ln- Linux必学的60个命令
1.作用 ln命令用来在文件之间创建链接,它的使用权限是所有用户. 2.格式 ln [options] 源文件 [链接名] 3.参数 -f:链结时先将源文件删除. -d:允许系统管理者硬链结自己的目录 ...
廖雪峰Java10加密与安全-2加密算法-1URL编码
1.URL编码 URL编码是浏览器发送数据给服务器时使用的编码. 如通过百度搜索美女: 编码前:https://www.baidu.com/s?wd=美女编码后:https://www.baidu. ...
微信小程序上传报错：以下文件没有被打包上传: · .gitignore
简单粗暴的办法就是:找到gitignore文件,把该文件删除掉即可. 在使用Git的过程中,我们喜欢有的文件比如日志,临时文件,编译的中间文件等不要提交到代码仓库,这时就要设置相应的忽略规则,来忽略这 ...
机器学习之五正则化的线性回归-岭回归与Lasso回归
机器学习之五正则化的线性回归-岭回归与Lasso回归注:正则化是用来防止过拟合的方法.在最开始学习机器学习的课程时,只是觉得这个方法就像某种魔法一样非常神奇的改变了模型的参数.但是一直也无法对其基 ...
转：Linux 2.4.x内核软中断机制
源地址:http://www.ibm.com/developerworks/cn/linux/kernel/interrupt/ Linux 2.4.x内核软中断机制杨沙洲 (pubb@163.ne ...
Ubuntu连不上网一直提示连接已断开的解决方案
win10搜索:服务把VMware DHCP Service启动即可

ue4同c#通信时的中文乱码问题

ue4同c#通信时的中文乱码问题的更多相关文章

随机推荐

热门专题