「Python实用秘技16」快速提取字体子集

本文完整示例代码及文件已上传至我的Github仓库https://github.com/CNFeffery/PythonPracticalSkills

　　这是我的系列文章「Python实用秘技」的第16期，本系列立足于笔者日常工作中使用Python积累的心得体会，每一期为大家带来一个几分钟内就可学会的简单小技巧。

　　作为系列第16期，我们即将学习的是：快速提取字体子集。

　　在我们日常进行数据可视化、web应用开发等场景中，经常会用到一些特殊的非系统自带字体，尤其是中文字体，由于包含的字符数量众多，因此体积一般都比较大，这在进行数据可视化读取字体文件，或是网页应用中通过网络加载字体文件时，就会带来更多的耗时。

　　而我们完全可以针对字体文件运用“按需引入”的思想，从原始的体积较大的全量字体文件中，根据我们实际使用到的文字范围，进行子集的提取，从而大幅度提升效率。

　　我们可以利用Python中的fonttools库来快捷实现此项需求，它由谷歌开源，自带了若干实用的字体处理相关命令行工具，使用pip install fonttools安装完成后，我们只需要按照下列格式执行命令行工具pyftsubset即可：

pyftsubset 原始字体文件路径 --text=需要保留的字符 --output-file=输出子集字体文件路径

　　而当我们需要进行保留的字符众多时，则可以通过书写Python脚本的方式，批量拼接命令行进行模拟执行：

import os

import re

# 读入目标文本内容

with open('./将进酒.txt', encoding='utf-8') as t:

    source_content = t.read()

# 模拟执行pyftsubset命令生成字体子集

os.system(

    'pyftsubset 钟齐志莽行书.ttf --text={} --output-file=钟齐志莽行书mini.ttf'.format(

        # 去除空白字符后去重

        ''.join(set(re.sub('\s', '', source_content)))

    )

)

　　通过上面的示例代码，我们从本地原体积为4698kb的字体文件中，提取出大小仅有76kb的目标子集字体文件：

　　在此基础上，我们就可以在项目中大幅度优化外部字体的使用效率，譬如下面的示例dash应用（相关源码及文件已上传至文章开头仓库）：

　　本期分享结束，咱们下回见~

「Python实用秘技16」快速提取字体子集的更多相关文章

「Python实用秘技08」一行代码解析地址信息
本文完整示例代码及文件已上传至我的Github仓库https://github.com/CNFeffery/PythonPracticalSkills 这是我的系列文章「Python实用秘技」的第8期 ...
「Python实用秘技01」复杂zip文件的解压
本文完整示例代码及文件已上传至我的Github仓库https://github.com/CNFeffery/PythonPracticalSkills 这是我的新系列文章「Python实用秘技」的第1 ...
「Python实用秘技03」导出项目的极简环境依赖
本文完整示例代码及文件已上传至我的Github仓库https://github.com/CNFeffery/PythonPracticalSkills 这是我的系列文章「Python实用秘技」的第3期 ...
「Python实用秘技04」为pdf文件批量添加文字水印
本文完整示例代码及文件已上传至我的Github仓库https://github.com/CNFeffery/PythonPracticalSkills 这是我的系列文章「Python实用秘技」的第4期 ...
「Python实用秘技02」给Python函数定“闹钟”
本文完整示例代码及文件已上传至我的Github仓库https://github.com/CNFeffery/PythonPracticalSkills 这是我的系列文章「Python实用秘技」的第2期 ...
「Python实用秘技05」在Python中妙用短路机制
本文完整示例代码及文件已上传至我的Github仓库https://github.com/CNFeffery/PythonPracticalSkills 这是我的系列文章「Python实用秘技」的第5期 ...
「Python实用秘技06」逐行监听Python程序的内存消耗
本文完整示例代码及文件已上传至我的Github仓库https://github.com/CNFeffery/PythonPracticalSkills 这是我的系列文章「Python实用秘技」的第6期 ...
「Python实用秘技07」pandas中鲜为人知的隐藏排序技巧
本文完整示例代码及文件已上传至我的Github仓库https://github.com/CNFeffery/PythonPracticalSkills 这是我的系列文章「Python实用秘技」的第7期 ...
「Python实用秘技09」更好用的函数运算缓存
本文完整示例代码及文件已上传至我的Github仓库https://github.com/CNFeffery/PythonPracticalSkills 这是我的系列文章「Python实用秘技」的第9期 ...
「Python实用秘技10」深度比较Python对象间差异
本文完整示例代码及文件已上传至我的Github仓库https://github.com/CNFeffery/PythonPracticalSkills 这是我的系列文章「Python实用秘技」的第10 ...

随机推荐

Centos7.x 安装 nmon性能监控工具
一.简介 nmon 工具可以帮助在一个屏幕上显示所有重要的性能优化信息,并动态地对其进行更新.这个高效的工具可以工作于任何哑屏幕.telnet 会话.甚至拨号线路.另外,它并不会消耗大量的 CPU 周 ...
Spring之丐版IOC实现
文章目录 IOC控制反转依赖注入 Bean的自动装配方式丐版IOC实现 BeanDefinition.java ResourceLoader.java BeanRegister.java Bean ...
快速上手Linux核心命令（十一）：Linux用户相关命令
目录前言 useradd 创建用户 usermod 修改用户信息 userdel 删除用户 groupadd 创建新的用户组 groupdel 删除用户组 passwd 修改用户密码 chage 修 ...
Xposed框架关于无法在模拟器中下载和激活的问题
开头最近xposed不知道出了什么问题,导致安装的时候一直在失败,所以记录下网上参考到的并用于实践中安装软件 1.模拟器逍遥游模拟器安卓7.1 版本.下载地址为: https://www.52 ...
2021-09-19：数字 n 代表生成括号的对数，请你设计一个函数，用于能够生成所有可能的并且有效的括号组合。
2021-09-19:数字 n 代表生成括号的对数,请你设计一个函数,用于能够生成所有可能的并且有效的括号组合. 福大大答案2021-09-19: 递归. 参数1:左括号-右括号的数量. 参数2:左 ...
2021-09-05：单词搜索 II。给定一个 m x n 二维字符网格 board 和一个单词（字符串）列表 words，找出所有同时在二维网格和字典中出现的单词。单词必须按照字母顺序，通过相邻的
2021-09-05:单词搜索 II.给定一个 m x n 二维字符网格 board 和一个单词(字符串)列表 words,找出所有同时在二维网格和字典中出现的单词.单词必须按照字母顺序,通过相邻的 ...
vue全家桶进阶之路44：Vue3 Element Plus el_row和el_col组件
在 Vue 3 中,Element Plus 也提供了 ElRow 和 ElCol 组件,用于实现栅格布局. ElRow 组件的常用属性: gutter:栅格间距,默认为 0. type:布局模式,可 ...
only仅显示一些字段
only仅显示一些字段仅显示nickname,age两列的数据 Student.objects.all().only('nickname','age')
NeRF(Neural Radiance Fields)神经辐射场方法学习总结
最近需要写一篇关于NeRF的文献综述,看了看网上有关NeRF的所有教程和笔记,感觉对于初入门的初学者并不是很友好,在这里开个坑,准备更新NeRF的知识和相关的论文综述如下: 神经辐射场在视图合成和三 ...
解码器 | 基于 Transformers 的编码器-解码器模型
基于 transformer 的编码器-解码器模型是表征学习和模型架构这两个领域多年研究成果的结晶.本文简要介绍了神经编码器-解码器模型的历史,更多背景知识,建议读者阅读由 Sebastion ...

「Python实用秘技16」快速提取字体子集

「Python实用秘技16」快速提取字体子集的更多相关文章

随机推荐

热门专题