转:https://blog.csdn.net/XIAOZHI0999/article/details/80785570

本文讨论C#同ue4进行通信,出现的中文乱码情况,其他语言类似。

本文分两种情况讨论,

1.C#向ue4发送string

在C#发送string时,要先区分发送的字符串中是否包含中文,判断方法很简单,如下:

private bool IsPureAnsi(string str)
{
for (int i = 0; i < str.Length; ++i)
{
if ((int)str[i] > 127)
{
return false;
}
}

return true;
}
当string中不包含中文时,每个字符占1个字节,string前要先发送string的长度,占4个字节,string结束要加'\0'结尾(c传统)
当string中包含中文时,每个字节占用2个字节,格式同上(注意string长度无需*2,而且string长度要取反,string结尾需要两个字节的'\0')

具体代码如下:

public byte[] StringToBytes(string str)
{
Stream stream = new MemoryStream();

if (this.IsPureAnsi(str))
{
byte[] strLenBytes = System.BitConverter.GetBytes(str.Length + 1);
stream.Write(strLenBytes, 0, strLenBytes.Length);

byte[] strBytes = Encoding.ASCII.GetBytes(str);
stream.Write(strBytes, 0, strBytes.Length);
stream.WriteByte(0);
}
else
{
int strLen = str.Length + 1;
byte[] strLenBytes = System.BitConverter.GetBytes(-strLen);
stream.Write(strLenBytes, 0, strLenBytes.Length);

byte[] strBytes = Encoding.Unicode.GetBytes(str);
stream.Write(strBytes, 0, strBytes.Length);
stream.WriteByte(0);
stream.WriteByte(0);
}

return StreamToBytes(stream);
}
2.ue4向C#发送string
这种情况,ue4端照常发送,c#解析的时候需要做一定处理

c#在接收到string数据时,先取出string长度信息,如果string长度>=0,则说明c#接收到的string是ascii编码,如果小于0,说明接收到的string是unicode编码

具体代码如下

public String GetString(byte[] data, int index, out int outIndex)
{
int strLen = System.BitConverter.ToInt32(data, index);
bool Ascii = strLen >= 0;
if (Ascii)
{
outIndex = index + 4 + strLen;

int begin = index + 4;
int end = outIndex;
byte[] byteStr = data.Skip(begin).Take(end - begin - 1).ToArray();

string str = Encoding.Default.GetString(byteStr);
return str;
}
else
{
strLen = -strLen;
outIndex = index + 4 + strLen*2;

int begin = index + 4;
int end = outIndex;
byte[] byteStr = data.Skip(begin).Take(end - begin - 2).ToArray();

string str = Encoding.Unicode.GetString(byteStr);
return str;
}
}
以上内容主要参考的是ue4中的源码,具体源码如下:
FArchive& operator<<( FArchive& Ar, FString& A )
{
// > 0 for ANSICHAR, < 0 for UCS2CHAR serialization

if (Ar.IsLoading())
{
int32 SaveNum;
Ar << SaveNum;

bool LoadUCS2Char = SaveNum < 0;
if (LoadUCS2Char)
{
SaveNum = -SaveNum;
}

// If SaveNum is still less than 0, they must have passed in MIN_INT. Archive is corrupted.
if (SaveNum < 0)
{
Ar.ArIsError = 1;
Ar.ArIsCriticalError = 1;
UE_LOG(LogNetSerialization, Error, TEXT("Archive is corrupted"));
return Ar;
}

auto MaxSerializeSize = Ar.GetMaxSerializeSize();
// Protect against network packets allocating too much memory
if ((MaxSerializeSize > 0) && (SaveNum > MaxSerializeSize))
{
Ar.ArIsError = 1;
Ar.ArIsCriticalError = 1;
UE_LOG( LogNetSerialization, Error, TEXT( "String is too large" ) );
return Ar;
}

// Resize the array only if it passes the above tests to prevent rogue packets from crashing
A.Data.Empty (SaveNum);
A.Data.AddUninitialized(SaveNum);

if (SaveNum)
{
if (LoadUCS2Char)
{
// read in the unicode string and byteswap it, etc
auto Passthru = StringMemoryPassthru<UCS2CHAR>(A.Data.GetData(), SaveNum, SaveNum);
Ar.Serialize(Passthru.Get(), SaveNum * sizeof(UCS2CHAR));
// Ensure the string has a null terminator
Passthru.Get()[SaveNum-1] = '\0';
Passthru.Apply();

INTEL_ORDER_TCHARARRAY(A.Data.GetData())

// Since Microsoft's vsnwprintf implementation raises an invalid parameter warning
// with a character of 0xffff, scan for it and terminate the string there.
// 0xffff isn't an actual Unicode character anyway.
int Index = 0;
if(A.FindChar(0xffff, Index))
{
A[Index] = '\0';
A.TrimToNullTerminator();
}
}
else
{
auto Passthru = StringMemoryPassthru<ANSICHAR>(A.Data.GetData(), SaveNum, SaveNum);
Ar.Serialize(Passthru.Get(), SaveNum * sizeof(ANSICHAR));
// Ensure the string has a null terminator
Passthru.Get()[SaveNum-1] = '\0';
Passthru.Apply();
}

// Throw away empty string.
if (SaveNum == 1)
{
A.Data.Empty();
}
}
}
else
{
bool SaveUCS2Char = Ar.IsForcingUnicode() || !FCString::IsPureAnsi(*A);
int32 Num = A.Data.Num();
int32 SaveNum = SaveUCS2Char ? -Num : Num;

Ar << SaveNum;

A.Data.CountBytes( Ar );

if (SaveNum)
{
if (SaveUCS2Char)
{
// TODO - This is creating a temporary in order to byte-swap. Need to think about how to make this not necessary.
#if !PLATFORM_LITTLE_ENDIAN
FString ATemp = A;
FString& A = ATemp;
INTEL_ORDER_TCHARARRAY(A.Data.GetData());
#endif

Ar.Serialize((void*)StringCast<UCS2CHAR>(A.Data.GetData(), Num).Get(), sizeof(UCS2CHAR)* Num);
}
else
{
Ar.Serialize((void*)StringCast<ANSICHAR>(A.Data.GetData(), Num).Get(), sizeof(ANSICHAR)* Num);
}
}
}

return Ar;
}
注意,ue4,发送和接收数据都是用这段代码,Ar.IsLoading()为true代表接收数据,否则为发送数据
---------------------
作者:--小智--
来源:CSDN
原文:https://blog.csdn.net/XIAOZHI0999/article/details/80785570
版权声明:本文为博主原创文章,转载请附上博文链接!

ue4同c#通信时的中文乱码问题的更多相关文章

  1. [MacOS] 终端使用ssh时,中文乱码问题处理

    终端显示中文问题处理: vim ~/.inputrc 加入以下代码 set meta-flag on set convert-meta off set input-meta on set output ...

  2. 解决在Linux下安装Oracle时的中文乱码问题

    本帖最后由 TsengYia 于 2012-2-22 17:06 编辑 解决在Linux下安装Oracle时的中文乱码问题 操作系统:Red Hat Enterprise Linux 6.1数据库:O ...

  3. (转)MySQL 插入数据时,中文乱码问题的解决

    MySQL 插入数据时,中文乱码问题的解决  原文:http://www.cnblogs.com/sunzn/archive/2013/03/14/2960248.html 当向 MySQL 数据库插 ...

  4. IDEA使用maven构建时控制台中文乱码的解决办法

    使用maven clean install 项目时控制台中文乱码,解决办法如下: Setting->maven->runner VMoptions: -Dfile.encoding=UTF ...

  5. source命令 导入.sql文件时,中文乱码 或者是注释乱码

    1.source命令 导入.sql文件时,中文乱码 或者是注释乱码 首先进入dos命令,进入mysql数据库,之后use 数据库:之后查看你的mysql数据库编码 如下命令:模糊查询变量charact ...

  6. Java通信过程的中文乱码的解决

    J在基于Java的编程中,常常会碰到汉字的处里及显示的问题.比方一大堆乱码或问号. 这是由于JAVA中默认的编码方式是UNICODE.而中国人通常使用的文件和DB都是基于GB2312或者BIG5等编码 ...

  7. 关于struts2中表单提交时,中文乱码问题的解决

    http://blog.csdn.net/hjw506848887/article/details/8966194 今天写项目时,突然遇到了struts2中表单提交的中文乱码问题,调了好久就是不知道答 ...

  8. Tomcat 处理请求时的中文乱码问题

    利用Tomcat8作为服务器,采用servlet接收前端请求后进行处理的过程中,前台请求中有中文时,中文信息变成了乱码. 经过调试和查阅,发现Tomcat在处理get请求和post请求是有区别的.参照 ...

  9. action接收到来自jsp页面的请求时出现中文乱码问题处理方法

    写JSP程序时,在Servlet中取请求参数时出现了乱码,当然,这种乱码问题再简单不过了.由于在JSP中使用了GBK作用页面的编码,那么提交的中文信息自然也会被按着GBK进行编码,为%xx格式的GBK ...

随机推荐

  1. mysql TO_DAYS()

    mysql TO_DAYS(date) 函数 TO_DAYS(date) 给定一个日期date, 返回一个天数 (从年份0开始的天数 ). mysql> SELECT TO_DAYS(95050 ...

  2. ArduinoUno和Leonardo的区别

    学习过Arduino的同学对ArduinoUno和Lenardo的不同点会有所了解,但说起具体的区别估计还是很多人答不上来,今天我们就详细解释下Arduino Uno和Leonardo的不同. 我们从 ...

  3. elasticsearch 中文API river

    river-jdbc 安装 ./bin/plugin --install jdbc --url http://xbib.org/repository/org/xbib/elasticsearch/pl ...

  4. 使用 jQuery 设置 disabled 属性与移除 disabled 属性

    表单中readOnly和disabled的区别:Readonly只针对input(text/ password)和textarea有效,而disabled对于所有的表单元素都有效,包括select,r ...

  5. Ln- Linux必学的60个命令

    1.作用 ln命令用来在文件之间创建链接,它的使用权限是所有用户. 2.格式 ln [options] 源文件 [链接名] 3.参数 -f:链结时先将源文件删除. -d:允许系统管理者硬链结自己的目录 ...

  6. 廖雪峰Java10加密与安全-2加密算法-1URL编码

    1.URL编码 URL编码是浏览器发送数据给服务器时使用的编码. 如通过百度搜索美女: 编码前:https://www.baidu.com/s?wd=美女 编码后:https://www.baidu. ...

  7. 微信小程序上传报错:以下文件没有被打包上传: · .gitignore

    简单粗暴的办法就是:找到gitignore文件,把该文件删除掉即可. 在使用Git的过程中,我们喜欢有的文件比如日志,临时文件,编译的中间文件等不要提交到代码仓库,这时就要设置相应的忽略规则,来忽略这 ...

  8. 机器学习之五 正则化的线性回归-岭回归与Lasso回归

    机器学习之五 正则化的线性回归-岭回归与Lasso回归 注:正则化是用来防止过拟合的方法.在最开始学习机器学习的课程时,只是觉得这个方法就像某种魔法一样非常神奇的改变了模型的参数.但是一直也无法对其基 ...

  9. 转:Linux 2.4.x内核软中断机制

    源地址:http://www.ibm.com/developerworks/cn/linux/kernel/interrupt/ Linux 2.4.x内核软中断机制 杨沙洲 (pubb@163.ne ...

  10. Ubuntu连不上网一直提示连接已断开的解决方案

    win10搜索:服务 把VMware DHCP Service启动即可