AI算法工程师炼成之路 面试题: l  自我介绍/项目介绍 l  类别不均衡如何处理 l  数据标准化有哪些方法/正则化如何实现/onehot原理 l  为什么XGB比GBDT好 l  数据清洗的方法有哪些/数据清洗步骤 l  缺失值填充方式有哪些 l  变量筛选有哪些方法 l  信息增益的计算公式 l  样本量很少情况下如何建模 l  交叉检验的实现 l  决策树如何剪枝 l  WOE/IV值计算公式 l  分箱有哪些方法/分箱原理是什么 l  手推SVM:目标函数,计算逻辑,公式都写出来,平…
基础好工具 idea iterm2 和 oh-my-zsh git 热加载 java web项目每次重启时间成本太大. 编程有一个过程很重要, 就是试验, 在一次次试验中探索, 积累素材优化调整程序模型. 单元热加载 改动文件后, 编译该单元 -> 可能 会触发热加载该模块. ( build -> Recompile '-..java' ) idea IDE支持 Run ​ 没有编译后reload功能 Debug ​ reload the recompile的class. 最好用 引入Spri…
继承Object和ContextBoundObject处理效率上的差距 ContextBoundObject一个很熟悉的对象,它提供对象有处理上下文的能力:通过它能够方便地实现AOP处理机制.它带来好处的同时也会带来效率上的损失,到底继承ContextBoundObject后会在效率上损失多少呢?下面用简单的代码测试一下:测试方法很简单就是建立两个具有相同方法的对象,一个继承于ContextBoundObject一个没有:然后分别循环次数地执行对象的创建和方法调用(以下测试代码并不能完全反映所有…
本文转载自:http://www.huaxiaozhuan.com/ 这是一份机器学习算法和技能的学习手册,可以作为学习工作的参考,都看一遍应该能收获满满吧. 作者华校专,曾任阿里巴巴资深算法工程师,现任智易科技首席算法研究员,<Python 大战机器学习>的作者. 这是作者多年以来学习总结的笔记,经整理之后开源于世.目前还有约一半的内容在陆续整理中,已经整理好的内容放置在此. 曾有出版社约稿,但是考虑到出版时间周期较长,而且书本购买成本高不利于技术广泛传播,因此作者采取开源的形式. 笔记内容…
--- vim源码安装: 1. git clone https://github.com/vim/vim.git 2. cd vim && ./configure --prefix=xxx -enable-multibyte --enable-pythoninterp=yes --enable-python3interp=yes 3. make && make install 4. 遇到一个库的错误,解决方法: sudo apt-get install libncurses…
差距都在细节上. Serverless 要成就云计算的下一个 10 年,不仅需要在技术上持续精进,也需要在产品体验上精耕细作. 近日,阿里云 Serverless 再度升级,发布了一系列围绕产品体验方面的优化,包括函数计算 FC 全面融入容器生态,添加容器镜像的触发:宣布开源国内首个 Serverless 开发者平台 Serverless Devs, 帮助开发者实现一键体验多云产品,极速部署 Serverless 项目:SAE 提供了 QPS/RT 维度的弹性策略配置,增加了限流降级等企业级特性…
QMap vs. QHash: A small benchmark While working on my Qt developer days 2012 presentation (QtCore in depth), I made a benchmark comparing QMap and QHash. I thought it would be nice to share the results in this short blog entry. Under The Hood The Qt…
全球知名HRM SaaS厂商Workday在世界各地攻城拔寨,俨然是HR SaaS的代名词,更是HRM市场的领导品牌.但是却单单在中国市场悄无声息,除了为数不多的海尔海外.联想海外等规模客户和部分rollout到中国的跨国企业外,鲜有市场声音和大规模推广活动,这种奇怪的现象是何原因呢? 1.中国市场不成熟,暂缓进入? 下述中国IT市场的特点,可能是Workday暂缓进入的原因: 1)中国IT市场一向落后于全球市场.日本和亚太市场,在对云计算的接受.SaaS观念的转变等方面明显落后于全球同步市场:…
​ 写在开头 从 2021 开始,有一个很有意思的说法经常在各大技术媒体或开源论坛中出现,「开源正在吞噬一切」.不论是否言过其实,从一个行业从业者的切身感知来看,开源确实从少数极客的小众文化成为主流的软件开发模式,有越来越多的企业开始拥抱开源技术,享受到开源技术带来的福利. 一面是开源技术得到更广范围的应用和落地.以我们所处的数据库和大数据领域来看,2021 年全球开源数据库的流行指数首次超过商用数据库,以 Apache Hadoop.Apache Spark.Apache Flink 等为代表…
摘要:本文带大家快速浏览昇思MindSpore全场景AI框架1.6版本的关键特性. 全新的昇思MindSpore全场景AI框架1.6版本已发布,此版本中昇思MindSpore全场景AI框架易用性不断改进,提升了开发效率,控制流性能提升并支持副作用训练,与此同时,昇思MindSpore全场景AI框架发布高效易用的图学习框架昇思MindSpore Graph Learning,高性能可扩展的强化学习计算框架昇思MindSpore Reinforcement,提供支持第三方框架模型迁移工具,让用户即时…