PGO的引入

Go 1.20 发布了配置文件引导优化(PGO)的预览版,使编译器能够根据运行时配置文件信息,执行应用程序和工作负载的特定性优化。提供要构建的配置文件,使编译器能够将应用程序的速度提高大约 3-4%,官方鼓励开发者尝试一下整个新特性,但可能存在一些未知的问题。

具体可参考:Profile-guided optimization: https://go.dev/doc/pgo

PGO 是计算机编程中的一种编译器优化技术,借助配置文件来引导编译,能够在不改业务代码的情况下,达到提高程序运行时性能的目的。

该优化是一门通用技术,不局限于某一门语言:

  • Chrome 浏览器,在 64 位版本的 Chrome 中从 53 版开始启用 PGO, 32 位版在 54 版中启用。
  • Microsoft Visual C++ 也同样有所使用。
  • AutoFDO 进行了 PGO 的优化,直接将某数据中心中的 C/C++ 程序的性能提高了 5-15%(不用改业务代码)。
  • 在 Go PGO 中将会依托 runtime/pprof 所生成的 profile 来完成。

PGO 怎么优化

PGO 通过缩小代码大小、减少代码分支错误预测和重新组织代码布局以减少指令缓存问题来提高应用程序性能。也可以向编译器提供有关应用程序中最常执行的区域的信息。

编译器再通过分析这些信息,编译器能够在优化应用程序时更具选择性和针对性,做出最优的选择。

PGO 由三个阶段组成。如下图:

  • 检测程序:编译器从你的源代码和编译器的代码创建并链接一个检测程序。

  • 运行检测的可执行文件:每次执行插桩代码时,插桩程序都会生成一个动态信息文件,用于最终编译。

  • 最终编译:当你第二次编译时,动态信息文件将合并到一个摘要文件中。编译器会使用此文件中的概要信息,然后尝试选择程序中最频繁最优的运行路径去执行。

这就是 PGO 这项优化的基本过程了。

语言变化

  • 切片可以直接转化为数组
  • unsafe 包中添加了 SliceSliceDataStringStringData 函数

切片转数组示例

package main

import "fmt"

func main() {
sli := []int{1, 2, 3, 4, 5}
arr := [5]int(sli)
fmt.Println(arr)
}
// 输出如下
// [1 2 3 4 5]

unsafe 包中新增函数原型

package unsafe

// Slice 根据指针参数和长度参数构造一个切片并返回
// 修改切片元素值会影响底层的数组元素值
func Slice(ptr *ArbitraryType, len IntegerType) []ArbitraryType // SliceData 返回参数切片的指针
func SliceData(slice []ArbitraryType) *ArbitraryType // String 根据指针参数和长度参数构造一个字符串并返回
// 修改参数指向的值会同时修改字符串的值
func String(ptr *byte, len IntegerType) string // StringData 返回参数字符串底层的字节数组指针
func StringData(str string) *byte

下面是两个小例子,分别使用到了 Slice 函数和 String 函数。

使用 unsafe.Slice,根据数组生成切片

package main

import (
"fmt"
"unsafe"
) func main() {
arr := [5]int{1, 2, 3, 4, 5}
// 注意: 这里是传递首个元素的指针,而非数组的指针
sli := unsafe.Slice(&arr[0], 3)
fmt.Printf("slice = %+v, len = %d\n", sli, len(sli)) // 修改切片元素的值会影响底层的数组
for i := range sli {
sli[i] *= 100
}
fmt.Printf("slice = %+v, len = %d\n", sli, len(sli))
// 此时数组的元素值已经变化
fmt.Printf("array = %+v, len = %d\n", arr, len(arr))
} // 运行输出如下
// slice = [1 2 3], len = 3
// slice = [100 200 300], len = 3
// array = [100 200 300 4 5], len = 5

使用 unsafe.String,根据切片生成字符串

package main

import (
"fmt"
"unsafe"
) func main() {
bs := []byte{'h', 'e', 'l', 'l', 'o'}
// 注意: 这里是传递首个元素的指针,而非切片的指针
str := unsafe.String(&bs[0], 2)
fmt.Printf("str = %s, len = %d\n", str, len(str)) // 修改参数指向的值会同时修改字符串的值
bs[1] = 'i' // 此时字符串的值已经变化
fmt.Printf("str = %s, len = %d\n", str, len(str))
fmt.Printf("bs = %s, len = %d\n", bs, len(str))
} // 运行输出如下
// str = he, len = 2
// str = hi, len = 2
// bs = hillo, len = 2

标准库增强

• 新增了几个 时间转换格式常量

• 新包 crypto/ecdh 支持通过 NIST 曲线和 Curve25519 椭圆曲线 Diffie-Hellman 密钥交换

• 新类型 http.ResponseController 访问 http.ResponseWriter 接口未处理的扩展请求

• httputil.ReverseProxy 包含一个新的 Rewrite 钩子函数,取代了之前的 Director 钩子

• 新方法 context.WithCancelCause 提供了一种方法来取消具有给定错误的上下文

• os/exec.Cmd 结构体中的新字段 Cancel 和 WaitDelay, 指定 Cmd 在其关联的 Context 被取消或其进程退出时的回调

errors.Join

新方法 errors.Join 返回一个错误列表,如果错误类型实现了 Unwrap() []error,则可以再次获得错误列表

在原有 Go1.13 的 errors API 上进行新增和修改,核心是支持一个错误可以封装多个错误的特性。新方法 errors.Join 返回一个错误列表,如果错误类型实现了 Unwrap() []error,则可以再次获得错误列表。

func main() {
err1 := errors.New("err1")
err2 := errors.New("err2")
err := errors.Join(err1, err2)
fmt.Println(err)
if errors.Is(err, err1) {
fmt.Println("err is err1")
}
if errors.Is(err, err2) {
fmt.Println("err is err2")
}
}
// 输出结果
err1
err2
err is err1
err is err2

优化时间比较和格式记忆

Go1.20 新增了几个 时间转换格式常量,便于直接引用:

package time

const (
DateTime = "2006-01-02 15:04:05"
DateOnly = "2006-01-02"
TimeOnly = "15:04:05"
)

Time.Compare

新增了时间比较的方法。

在现在的标准库中,有 3 个方法来比较 time.Time 对象,分别是:Before()、Equal() 和 After(),作用上类似 <、== 和 >。但缺少 <= 和 >= 的等价物。

Go1.20 将会支持 Time.Compare,以此来达到类似的效果。作用是将 Time 对象 t 和 u 两者进行比较。

func (t Time) Compare(u Time) int

该方法返回如下几种结果:

  • 如果 t 在 u 之前,则返回 -1。
  • 如果 t 在 u 之后,则返回 +1。
  • 如果它们相同,则返回 0。

工具改进

cover 工具可以收集整个程序的覆盖率,不仅仅是单元测试

go buildgo install 和其他与构建相关的命令可以接收一个 -pgo 标志,启用配置文件引导优化,以及一个 -cover 标志,用于整个程序覆盖率分析

go test -json 的实现已得到改进,可以处理复杂多样的 Stdout 输出

vet 在并行运行的测试中可能会发生更多循环变量引用错误

• 在没有 C 工具链 的系统上默认禁用 CGO

性能提升

• 编译器和 GC 的优化减少了内存开销,并将 CPU 性能整体提高了 2%

• 针对编译时间进行了优化,提升了 10%。使得构建速度与 Go 1.17 保持一致 (恢复到了泛型之前的速度)

• Go 发行版瘦身,新版本起,Go 的 $GOROOT/pkg 目录将不再存储标准库的预编译包存档,Go 发行版的将迎来一轮瘦身。

从 1.21 版本开始,一些较旧的操作系统将不再受支持:包括 Windows 7、8、Server 2008 和 Server 2012、macOS 10.13 High Sierra 和 10.14 Mojave。

Go 1.20更新了那些内容的更多相关文章

  1. SQL技巧两则:选择一个表的字段插入另一个表,根据其它表的字段更新本表内容

    最近,在作django数据表迁移时用到的. 因为在django中,我把本来一个字符型字段,更改成了外键, 于是,哦喝~~~字符型字段相当于被删除了, 为了能导入这些字段的外键信息,于是出此下策. 其实 ...

  2. [转]MFC子线程中更新控件内容的两种办法

    一.概述 每个系统中都有线程(至少都有一个主线程),而线程最重要的作用就是并行处理,提高软件的并发率.针对界面来说,还能提高界面的响应能力.一般的,为了应用的稳定性,在数据处理等耗时操作会单独在一个线 ...

  3. SQL通过Datatable更新数据库表内容

    SQL通过Datatable更新数据库表内容   //要注意的一点是在Select语句中要选择的列中必须包含主键的列,此外不支持多表连接查询 DataTable dt = new DataTable( ...

  4. HMS Core 分析服务 6.4.1版本上线啦,快来看看更新了哪些内容。

    更新概览 支持转化事件回传至华为应用市场商业推广,便捷归因,实时调优. 卸载分析模型支持用户卸载前事件和路径分析,深度剖析卸载根因. 实时漏斗体验开放,灵活定位异常流失. 详情介绍 更新一:全面开放深 ...

  5. DLNA介绍(包含UPnP,2011/6/20 更新)

    这部分的内容大多来源于网络及官方文档,依照自己的翻译理解整理所成.东西比較多,从头慢慢看还是能够懂个大概的. 文件夹: 一.DNLA的建立 二.DLNA的成员 三.DLNA标准的制定 四.DLNA的设 ...

  6. [android更新类的内容开发APP]四、项目布局的基本功能(继续)

    昨天,只拿到电脑,别说,眼泪 http://joveth.github.io/funny/ 1.选项卡的滑动效果 要知道.用这个选项卡就是想让它滑动起来,不然的话.我才不喜欢用它呢. 在让他滑动之前, ...

  7. poi 技术动态更新 Excel模板内容,动态更新内容

    1.控制器方法 private URL base = this.getClass().getResource(""); /** * 流拍之后,可以下载询价单 * * @param ...

  8. 使用观察者模式更新Fragment的内容

    最近有个需求,就是在Fragment没有切换的时候(show,hide)更新Fragment显示的内容,想了一会,终于想到可以用观察者模式来解决这个问题的. 定义一个[被观察者(接口)]: publi ...

  9. wordpress通过$wpdp更新数据表内容

    如下面的代码 更新id为1的数据 table 指的是要更新的数据表 第一个数组 array( 'column1' => 'value1', 'column2' => 'value2' ) ...

  10. 关于Git在Visual studio及Git Bush中的日常操作教程,有图有说明,会一直更新本页内容... (Git相对SVN具有更加安全的分布式存储, 分支版本之间切换秒级速度, 分支版本强大灵活等特点)

    >安装命令行和TortoiseGit UI程序. <git bash的安装> https://git-scm.com/downloads <windows可视化工具 Torto ...

随机推荐

  1. .NET Core 类型系统(Types System)底层原理浅谈

    C#类型系统 C# 是一种强类型语言. 每个变量和常量都有一个类型,每个求值的表达式也是如此. 每个方法声明都为每个输入参数和返回值指定名称.类型和种类(值.引用或输出). .NET 类库定义了内置数 ...

  2. Qt音视频开发29-Onvif云台控制

    一.前言 云台控制也是onvif功能中最常用的,最常用的功能排第一的是拿到视频流地址,排第二的就是云台控制了,云台控制的含义就是对带云台的摄像机进行上下左右的移动,一般云台摄像机都是带有一个小电机,一 ...

  3. Spring Data JPA中使用Example进行动态查询

    Spring Data JPA中使用Example进行动态查询主要涉及:实体对象.ExampleMatcher和Example等三种类类型.基于实例的动态查询所包含的三要素如下:1.实体对象:在ORM ...

  4. 即时通讯技术文集(第28期):IM开发技术合集(Part1) [共18篇]

    为了更好地分类阅读 52im.net 总计1000多篇精编文章,我将在每周三推送新的一期技术文集,本次是第28 期. [- 1 -] 新手入门一篇就够:从零开发移动端IM [链接] http://ww ...

  5. Windows应用开发-常用工具集推荐

     .NET/WPF开发 Visual Studio 最新版本是VS2022,官网下载:Visual Studio 2022 IDE - 适用于软件开发人员的编程工具 VsColorOutput 控制台 ...

  6. 特殊数据类型的深度分析:JSON、数组和 HSTORE 的实用价值

    title: 特殊数据类型的深度分析:JSON.数组和 HSTORE 的实用价值 date: 2025/1/4 updated: 2025/1/4 author: cmdragon excerpt: ...

  7. [LC646]最长数对链

    题目概述 给出 n 个数对. 在每一个数对中,第一个数字总是比第二个数字小. 现在,我们定义一种跟随关系,当且仅当 b < c 时,数对(c, d) 才可以跟在 (a, b) 后面.我们用这种形 ...

  8. c# 设置桌面壁纸: 只在win10 上测试了,不知道其它系统如何

    c# 设置桌面壁纸: 只在win10 上测试了,不知道其它系统如何. using System; using System.Collections.Generic; using System.Comp ...

  9. android主线程与子线程

    创建子线程创建子线程 更多关于java线程的文章可以查看这两篇 线程1 创建线程的方法 在android中穿件子线程的方案很简单 创建子线程的几种方法 ///////第一种/////// class ...

  10. h5移动端像素适配 postcss-pxtorem和amfe-flexible

    Vant 中的样式默认使用px作为单位,如果需要使用rem单位,推荐使用以下两个工具: postcss-pxtorem 是一款 postcss 插件,用于将单位转化为 rem; amfe-flexib ...