源自术语词典API项目 · Issue #85 · program-in-chinese/overview, 打算先用早先的代码提取JDK API中的类/方法/参数名, 看看有哪些词需要翻译.

源码在program-in-chinese/programming_term_dictionary

类型名提取器.java 扩展了语法树遍历器, 对公开(public)的类型/方法/参数进行保存:

public class 类型名提取器 extends ASTVisitor {

  private 类型名 名 = new 类型名();

  private String 当前类名 = "";

  @Override
public boolean visit(MethodDeclaration 方法节点) {
String 当前方法名 = 方法节点.getName().getFullyQualifiedName();
if (为公开声明(方法节点)) {
名.方法名.put(当前方法名, 当前类名);
} for (Object 参数 : 方法节点.parameters()) {
VariableDeclaration 变量声明 = (VariableDeclaration) 参数;
String 参数名 = 变量声明.getName().getFullyQualifiedName(); // 忽略所有单字母参数名. TODO: 是否需要研究单字母命名?
if (参数名.length() > 1) {
名.参数名.put(参数名, 当前类名 + "." + 当前方法名);
}
}
return super.visit(方法节点);
} @Override
public boolean visit(TypeDeclaration 类型节点) {
if (为公开声明(类型节点)) { // TODO: 取完整类名(包括包名)
当前类名 = 类型节点.getName().getFullyQualifiedName();
名.类名.put(类型节点.getName().getFullyQualifiedName(), 当前类名);
}
return super.visit(类型节点);
} public 类型名 获取名() {
return 名;
} private boolean 为公开声明(BodyDeclaration 节点) {
return (节点.getModifiers() & Modifier.PUBLIC) != 0;
} public class 类型名 {
public Map<String, String> 类名 = new HashMap<>();
public Map<String, String> 方法名 = new HashMap<>();
public Map<String, String> 参数名 = new HashMap<>();
}
}

遍历JDK类型名.java 暂时只对util部分进行分析

public class 遍历JDK类型名 {

  private static final ASTParser 语法解析器 = ASTParser.newParser(AST.JLS8);

  // JDK源码内路径
private static final String 常量_源文件路径 = "java/util";
private static final String 常量_输出文件路径 = "命名列表/"; private static final 类型名提取器 提取器 = new 类型名提取器(); /**
*
* @param 参数 第一个参数为JDK路径。可由JDK目录下的src.zip解压。
* @throws Exception
*/
public static void main(String[] 参数) throws Exception {
if (参数.length != 1) {
System.out.println("需要JDK源码路径作为唯一参数");
return;
} 文件功用.创建路径(常量_输出文件路径);
处理Java文件(new File(参数[0] + 常量_源文件路径)); 类型名 名 = 提取器.获取名(); // 从方法列表中删除所有构造方法
for (String 类名 : 名.类名.keySet()) {
名.方法名.remove(类名);
} String 后缀 = "_" + 常量_源文件路径.replaceAll("/", "_");
文件功用.写行入文件(名.类名, 常量_输出文件路径 + "类" + 后缀 + ".txt");
文件功用.写行入文件(名.方法名, 常量_输出文件路径 + "方法" + 后缀 + ".txt");
文件功用.写行入文件(名.参数名, 常量_输出文件路径 + "参数" + 后缀 + ".txt");
System.out.println("提取完毕: " + 名.类名.size() + "类;" + 名.方法名.size() + "方法;" + 名.参数名.size() + "参数");
} private static void 处理Java文件(File 路径) throws Exception {
if (路径.isFile()) {
if (路径.getName().endsWith(".java")) {
解析Java文件(路径);
}
} else {
File[] 文件 = 路径.listFiles();
if (文件 != null) {
for (File 某文件 : 文件) {
处理Java文件(某文件);
}
}
}
} private static void 解析Java文件(File 文件) throws Exception {
语法解析器.setSource(文件功用.取源文件文本(文件).toCharArray());
语法解析器.createAST(null).accept(提取器);
}
}

初步统计:

提取完毕: 332类;1172方法;449参数

按照骆驼命名对提取出的命名进行单词拆分后, 得到902个单词, 其中有不少同根词, 如:

sequence
sequential
split
splittable
token
tokenizer
word
words
write
writer
zone
zoned

还有不少不明所以的:

csn
em
fd

接下去将拆分出的单词与源API联系起来, 以便翻译时结合原API语义(已更新上面的源码). 比如csn来源于java.util.Formatter.Formatter(String fileName, String csn, Locale l), javadoc中意为The name of a supported {@linkplain java.nio.charset.Charset charset}. 真猜不到.

顺便对所有java/下的源码进行统计:

1579类;5093方法;2022参数
2752个单词

5倍左右数量的API但单词数只有3倍, 看来复用率蛮高. 总单词表在.

2018-08-27 使用JDT核心库解析JDK源码后初步分析API命名的更多相关文章

  1. 1.1 jvm核心类加载器--jdk源码剖析

    目录 前提: 运行环境 1. 类加载的过程 1.1 类加载器初始化的过程 1.2 类加载的过程 1.3 类的懒加载 2. jvm核心类加载器 3. 双亲委派机制 4. 自定义类加载器 5. tomca ...

  2. Python解析器源码加密系列之(二):一次使用标准c的FILE*访问内存块的尝试

    摘要:由于近期打算修改Python解释器以实现pyc文件的加密/解密,出于保密的要求,解密之后的数据只能放在内存中,不能写入到文件中.但是后续的解析pyc文件的代码又只能接受FILE*作为入参,所以就 ...

  3. 设计模式-简单工厂Coding+jdk源码解析

    感谢慕课geely老师的设计模式课程,本套设计模式的所有内容均以课程为参考. 前面的软件设计七大原则,目前只有理论这块,因为最近参与项目重构,暂时没有时间把Coding的代码按照设计思路一点点写出来. ...

  4. Jsoup解析网页源码时常用的Element(s)类

    Jsoup解析网页源码时常用的Element(s)类 一.简介 该类是Node的直接子类,同样实现了可克隆接口.类声明:public class Element extends Node 它表示由一个 ...

  5. HTTP请求库——axios源码阅读与分析

    概述 在前端开发过程中,我们经常会遇到需要发送异步请求的情况.而使用一个功能齐全,接口完善的HTTP请求库,能够在很大程度上减少我们的开发成本,提高我们的开发效率. axios是一个在近些年来非常火的 ...

  6. 如何实现一个HTTP请求库——axios源码阅读与分析 JavaScript

    概述 在前端开发过程中,我们经常会遇到需要发送异步请求的情况.而使用一个功能齐全,接口完善的HTTP请求库,能够在很大程度上减少我们的开发成本,提高我们的开发效率. axios是一个在近些年来非常火的 ...

  7. HtmlAgilityPack --解析Html源码

    最近项目需要从网络上抓取一下数据解析Html源码,奈何正则表达式难写,于是网上搜索找到了“ HtmlAgilityPack”类库,敏捷开发,果然效率非同寻常. 在此做笔记,写下心得,顺便给自己总结一下 ...

  8. mvc5 解析route源码实现自己的route系统

    Asp.net mvc5 解析route源码实现自己的route系统   url route 路由系统的责任是找到匹配的路由,创建路由数据,并将请求分配给一个处理程序. 选择动作是 MVC 的处理程序 ...

  9. 浩哥解析MyBatis源码(十)——Type类型模块之类型处理器

    原创作品,可以转载,但是请标注出处地址:http://www.cnblogs.com/V1haoge/p/6715063.html 1.回顾 之前的两篇分别解析了类型别名注册器和类型处理器注册器,此二 ...

随机推荐

  1. C++ Opencv 傅里叶变换的代码实现及关键函数详解

    一.前言 最近几天接触了图像的傅里叶变换,数学原理依旧不是很懂,因此不敢在这里妄言.下午用Opencv代码实现了这一变换,有一些经验心得,愿与大家分享. 二.关键函数解析 2.1copyMakeBor ...

  2. 【MySQL】存储emoji表情报错(Incorrect string value: '\xF0\x9F\x98\x82\xF0\x9F...')的解决方案

    Emoji表情字符现在在APP已经广泛支持了.但是MySQL的UTF8编码对Emoji字符的支持却不是那么好.所以我们经常会遇到这样的异常:   Java.sql.SQLException: Inco ...

  3. csv与xlsx导出

    一.csv与xlsx格式基本介绍       csv即comma seperate values - 逗号分隔值,文件以纯文本形式来存储表格数据,它可以由任意数目的记录组成,记录之间通过某种换行符来分 ...

  4. 解决:MVC对象转json包含\r \n

    项目中对象转json字符串时,如下:JsonSerializerSettings jsetting = new JsonSerializerSettings(); jsetting.DefaultVa ...

  5. Chrome 浏览器最牛插件之一 Vimium

    导航当页: ? 显示help,查询vimium的所有使用方法 h 向左滚动 j 向下滚动 k 向上滚动 l 向右滚动 gg 滚动到顶部 G 滚动到底部 d 向下滚动半页 u 向上滚动半页面 f 显示链 ...

  6. 【K8S】client-go、python-k8sclient开发K8S

    0x01 client-go 1.简介 Client-go是kubernetes官方发布的调用K8S API的golang语言包,可以用来开发K8S的管理服务.监控服务,配合前端展示,就可以开发出一款 ...

  7. mysql中计算日期整数差

    TIMESTAMPDIFF 语法: TIMESTAMPDIFF(interval,datetime_expr1,datetime_expr2) : 返回日期或日期时间表达式datetime_expr1 ...

  8. 为什么你作为一个.NET的程序员工资那么低?

    最近看到很多抱怨贴,也许有一定的道理,但是你想过没,为什么大部分.NET程序员工资相对低?我个人是这么看的: 大批半罐子水的程序员,永远被局限在.NET的原始的小圈圈里.前端不会(你放弃了一项很重要的 ...

  9. 第9条:try-with-resources优于try-finally

    try-finally例子 打开文件读取第一行 static String firstLineOffFile(String path) throws IOException { BufferedRea ...

  10. SpringBoot(11) SpringBoot自定义拦截器

    自定义拦截器共两步:第一:注册.第二:定义拦截器. 一.注册 @Configuration 继承WebMvcConfigurationAdapter(SpringBoot2.X之前旧版本) 旧版本代码 ...