.NET Core 迁移躺坑记
最近将自己负责的一个核心接口系统从.Net Framework迁移到了.Net Core。
整体过程,从业务层面说一般般吧(整体还好但还是搞的业务有感,没出严重故障)但是技术层面上感觉其实并没有达到要求,不过预期也是应该不会那么顺利,接下来可能还需要几个小Fix来处理各种奇奇怪怪的问题。
回顾下迁移时候遇到的若干个坑,希望对后续有此类操作的人所有帮助。
1.NetCore下的路由行为和Web Api的不一致
我们回顾下在Web Api里时候的一个路由定义

这个配置下可以让
Get RootUrl/123 和 Get RootUrl?id=123 同时映射到 GetThirdPartyChannel方法里。
但是,假如在不做改动前提下直接将这个Controller定义变为Core的话,Get RootUrl?id=123 这个路由将无法正常运作 (而 Get RootUrl/123 则依然可以正常运行)。
原因是在AspNetCore下他发现了[Route(“{Id}”)]就会认为Id是Path的一部分,然后相当于隐式给id这个参数默认了[FromPath],但是[Route(“”)]这里并没有定义id作为Path。
会导致一旦调用 Get RootUrl?id=123 的时候,首先路由是能匹配上 [Route(“”)]的,但是参数里的id恒定是空(即代码里获取到的id字段永远是null)。
解决方案有2种
①强制在方法参数的id里加上[FromQuery],但是这个会有个咖喱是Swagger生成的文档里会有2个Id字段(Path里有一个,你强制了Query里有一个)但是接口能正常工作;
②将2个路由拆开来分别对应2个方法。
总结:
按照我们组内规范,定义Url是不能放Path的,这些都是一些早期设计的,没有遵照规范将其替换完一直遗留着,规范不严格,代码两行泪。
2.NetCore下加载程序集的时候会识别版本号
我们有使用到部分的类库会依赖动态程序集加载,目前有:
Hangfire 用于实现Fire-and-Forgot模式异步执行以及延迟任务;
Protobuf-net 用于存储到Redis的时候转Protobuf更快更小。
这类程序集有个特点是他要将你要执行的东西序列化为某种类型(我不管json还是二进制的信息),然后需要时候在加载程序集。
而他们序列化的时候对程序集的处理统统都是用了Type.AssemblyQualifiedName方法,改方法可能会产生类似“ClassLibrary1.Class1, ClassLibrary1, Version=1.2.0.0, Culture=neutral, PublicKeyToken=null”的字符串。
而我们自己在CI的时候有一个机制是,每次TFS编译的时候会自动修改dll的版本号,具体可以参考以前写的文章 Azure Devops/Tfs 编译的时候自动修改版本号
以前.Net Framework加载一个程序集的时候,比如程序集的信息是 “ClassLibrary1.Class1, ClassLibrary1, Version=1.2.0.0, Culture=neutral, PublicKeyToken=null” 其中的Version的值他是不认的,随便Version是什么他都能加载(咱不讨论StrongName模式)
而到Core之后如果Version不匹配,则会报错(他会认可Version的值了)
解决方案:
暂时去掉了自动修改版本号机制,固定版本号到某个值。
3.NetCore下的Redis有点诡异(不稳定)
具体体现在好像迁移到Core之后连接Redis的链接更不稳定了,无论是链接超时还是首次建立链接的成功率都显著下降。
也是因为这个问题导致这次发布闹出了不该有的动静。
发布那会的临时解决方案:
Redis的链接字符串加了,abortConnect=false让连接不上的时候也继续跑着先吧
进行中的解决方案
根据https://stackoverflow.com/questions/42956377/stackexchange-redis-timeout-exception-in-net-core
试着将代码内频繁查询的Redis读取转Async试试。
4.NetCore下的Http请求不稳定(时而报SocketException)
到Core之后我们的未知知识库里又新增了一个全新异常模式

这个异常看起来像如下几个地址里提到的情况
https://github.com/dotnet/corefx/issues/30691
https://github.com/dotnet/corefx/pull/32903
https://github.com/dotnet/corefx/issues/32902
但是要说3.0才fix,等不了那么久……
另外已知在小访问量下好像不容易出现这个(我们之前已经有几个小站点已经是core里但是都没发生这个问题),有概率跟请求压力有关系。
目前的临时解决方案
参考官方文档 https://docs.microsoft.com/en-us/dotnet/api/system.net.http.socketshttphandler?view=netcore-2.2 先将core2.1引入的SocketHttpHandler禁用了
可以直接Powershell执行
[environment]::SetEnvironmentvariable("DOTNET_SYSTEM_NET_HTTP_USESOCKETSHTTPHANDLER", "false", "Machine")
但是现在也是零星会偶尔冒一下出来(感觉并没有什么卵用)
进行中的解决方案
基于HttpClientFactory构造HttpClient外加Polly如果失败就再来一次的模式。
5.迷之超时
现在发觉有一部分机器会有超时的现象,而这个现象比较诡异在于IIS日志里是有记录到这次请求的(超时的请求),而作为我们站点监控的Application Insights是没收到这个请求的
暂时想法是不是因为现在IIS只是一个Reverse Proxy的角色,而IIS到达真正承载站点的kestrel的时候这个过程有问题

因为我们当前是基于Net Core 2.1(因为是LTS),并没有2.2所引入的进程内托管这种模式,这个问题目前还在定位中
另外有人建议(包括网上寻找资料得到的信息)是IIS里调整下
Start Mode 改为Always Runing
Idel Time-out Action改为Suspend
但是这都是Win 2012才引入的功能,而我们家是08R2,两行泪的羡慕隔壁好多家都是2016的!
临时解决方案:
看到超时的机器就下掉
而且发现这个超时现象主要集中在某几个服务器上
之后在看看系列的解决方案
后面转Linux后的话直接kestrel硬扛,IIS一边去
最后
好像在.Net Framework里经常推崇的在异步方法里加ConfigureAwaiter(false)在.Net Core下是没什么卵用的,参考
http://blog.stephencleary.com/2017/03/aspnetcore-synchronization-context.html
.NET Core 迁移躺坑记的更多相关文章
- .NET Core 迁移躺坑记续集--Win下莫名其妙的超时
继上一集里说到遇到的各种问题并且弄了n个解决方案之后,特别是对于问题4的解决方案对于切换了HttpClientFactory 我用了你家netcore 2.1下专门解决之前HttpClient口病已久 ...
- android studio 2.32躺坑记
按说这是没啥记录意义的.不过作为一个偶尔用一下ADT开发安卓程序的跨界老码农,遇到一个尴尬事,现在手机已经用上安卓6了,而电脑里的ADT里SDK还是18,19.越来越多的项目是android stud ...
- Android组件化aar躺坑记:ButterKnife 报 元素值必须为常量表达式错误
背景: 项目有需求,将自己写的模块作为一个module给到大项目使用,所以准备把自己的项目打包成aar包. 一.如何将独立项目打包成aar: 1.修改module下的application 为libr ...
- .Net Core 迁移之坑二 《ToString("F") 输出与windows不一致问题》
大家都知道 ToString("F") 是干什么的 这里我还是介绍一下 格式字符串采用以下形式:Axx,其中 A 为格式说明符,指定格式化类型,xx 为精度说明符,控制格式化输出的 ...
- .Net Core 迁移之坑一 《WebAPI Get请求参数传入输入带有[]不识别问题》
在Framwork 体系下 WebAPI项目 会有很多默认特性,例如:Get查询竟然支持三种数组查询方式 1.https://localhost:44390/api/values?status=1&a ...
- .NET CORE迁移踩坑
https://www.cnblogs.com/leolaw/p/10740678.html
- .NET Core爬坑记 1.0 项目文件
前言: 之所以要写这个系列是因为在移植项目到ASP.NET Core平台的过程中,遇到了一些“新变化”,这些变化有编译方面的.有API方面的,今天要讲的是编译方面的一些问题.我把它们整理后分享出来,以 ...
- Spark踩坑记——Spark Streaming+Kafka
[TOC] 前言 在WeTest舆情项目中,需要对每天千万级的游戏评论信息进行词频统计,在生产者一端,我们将数据按照每天的拉取时间存入了Kafka当中,而在消费者一端,我们利用了spark strea ...
- UiAutomator2.0升级填坑记
UiAutomator2.0升级填坑记 SkySeraph May. 28th 2017 Email:skyseraph00@163.com 更多精彩请直接访问SkySeraph个人站点:www.sk ...
随机推荐
- PyQt IDE 环境搭建
Eric的安装 1.按照目前pyqt5的要求安装了python3的最新版 2 pip3 install PyQt5 3. pip3 install QScintilla 4.download eric ...
- Django单元测试简明实践
1.准备数据模式,Django空库测试需要所有相关数据模式必须在Django中定义,说白了,model不能有managed=Fasle,为了解决这个问题,你必须得有一个managed全部为True的S ...
- Invoke-ASCmd 部署SSAS database
Install-Module -Name SqlServer -RequiredVersion 21.0.17099 -AllowClobberInvoke-ASCmd -Server 10.162. ...
- js判断是否下拉刷新
if(document.body.scrollTop + window.innerHeight>=document.body.clientHeight-10){ this.loadPointsL ...
- 关于HTTP请求、Ajax请求,请求的同步和异步
使用了很长时间的Ajax请求了,一直都是在以异步的方式在使用.昨天听了一个讲座涉及到apache server,偶然想到了这Ajax请求和HTTP请求的一些区别和联系,就在网上好好搜了一顿,把搜到的结 ...
- Win10 UWP开发系列:解决Win10不同版本的Style差异导致的兼容性问题
最近在开发一个项目时,遇到了一个奇怪的问题,项目依赖的最低版本是10586,目标版本是14393,开发完毕发布到商店后,很多用户报无法正常加载页面.经查,有问题的都是Win10 10586版本. 我上 ...
- MySQL常见备份方案
MySQL常见备份方案有以下三种: mysqldump + binlog lvm + binlog xtrabackup 本例为方便演示,数据库里面数据为空.下面开始动手 mkdir /opt/bac ...
- 语音识别中的CTC算法的基本原理解释
欢迎大家前往腾讯云+社区,获取更多腾讯海量技术实践干货哦~ 本文作者:罗冬日 目前主流的语音识别都大致分为特征提取,声学模型,语音模型几个部分.目前结合神经网络的端到端的声学模型训练方法主要CTC和基 ...
- Maven学习(二)-- Maven项目构建过程练习
摘自:http://www.cnblogs.com/xdp-gacl/p/4051690.html 一.创建Maven项目 1.1.建立Hello项目 1.首先建立Hello项目,同时建立Maven约 ...
- mac 上安装 nvm 遇到的坑
本人之前在 mac 上已经装过 nvm 了,今天帮朋友在他电脑上装,由于是新版本,没想到有点坑. ** 一定要参考官方文档 一.命令行安装 (图片来自 github ) 意思是,无论你安装还是更新 ...