法律AI数据及应用
本文简单列举了法律AI目前的应用,数据集,研究方向。
历史
1970年,Buchanan和Headrick发表文章“关于人工智能和法律推理的一些猜测”,讨论了对法律研究和推理进行建模的可能性,特别是对于建议、法律分析的构建。
1977年,TAXMAN系统的论文,该论文以公司税法中的问题为缘由提供了一个定理证明的方法。基于他对这个早期系统的研究经验,他还研究开发法律概念的深层模型,如税法背景下的股权问题。
1978年,Carole Hafner发表了她关于使用人工智能方法改善流通票据领域的法律信息检索(IR)的系统的博士研究;它使用语义网络表达来超越纯粹基于关键词的方法。大约在这个时候,挪威计算机和法律中心由Knut Selmer和Jon Bing于1971年创立,扩大了对IR的关注,包括智能技术。随着网络的出现,对智能法律IR的重新研究再次蓬勃发展。
到了20世纪80年代,人工智能和法律工作得到了极大的关注。1981年,兰德公司民事司法中心的唐纳德沃特曼和马克彼得森为《侵权法》中产品责任案件的和解建立了法律决策专家系统;他们后来探讨了在石棉肺病特定领域使用专家系统的情况。伦敦帝国理工学院的Marek Sergot,Robert Kowalski和他们的同事使用逻辑编程来模拟《英国国籍法》的一部分,这是一部庞大而独立的法令。
20世纪80年代,人工智能的兴趣显着增加,研究界愈演愈烈。一些专业会议,如佛罗伦萨IDG和休斯敦大学的会议,紧接着是专门针对普通人工智能受众IJCAI-85。日本的人工智能和法律研究也开始于这一时期,东京明治大学 Hajime Yoshino的实验室就是其中的。日本第五代计算机系统工程(1982-1995)提供了很大的动力,特别是在使用专家系统和其他基于逻辑的技术方面的发展。
到20世纪80年代中期,美国一些主要的法学院也开始举办关于人工智能和法律的研讨会。第一次是在1984年斯坦福法学院,由三位法学教授:保罗·布雷斯特(后来成为院长)、汤姆·海勒和鲍勃·麦克诺肯。1985年,Rissland在哈佛法学院举办了关于人工智能和法律推理的研讨会。1987年,伯曼和哈夫纳在美国东北大学举办了他们的研讨会,此后每两年召开一次大会。该会的主要涉及的研究题目包括形式法律推理的模型、论证和决策的计算模式、运用证据推理的计算模式、多重角色参与的法律推理系统、可执行的立法程序模式、自动化的法律文献分类和总结、机器学习和电子发现的数据运用以及其他相关领域。
1991年,国际人工智能和法律协会的成立。多年来,这些研讨会层出不穷,并成为汇集AI和法律界的论坛。
法律AI任务分类
任务分类
从实际应用角度分类
摘自CAIL2018的PPT报告。
| 任务名称 | 解释 |
|---|---|
| 智能案例检索 | 类案推荐,非普通文本检索 |
| 判决预测 | 预测刑期、相关法条、罪名 |
| 文书自动生成 | 通常用于裁判文书生成 |
| 法律智能推荐 | |
| 法律文本翻译 | 机器翻译在法律领域的应用 |
| 法律智能问答 | 法律咨询,对话系统 |
| 风险提示 | 阅读理解。合同、协议等 |
| 法律文本挖掘 | 使用判例的数据点,赢/损失率和法官的历史,用于趋势和模式 |
| 合规审查 |
从研究角度分类
列出部分。翻译自ICAIL2019
- 从自然文本中挖掘证据
- 从法律文本中进行信息抽取
- 法律文本分类及摘要
- 谈判和合同制定的计算方法
- 计算机辅助争议调解
- 证据推理的形式和计算模型
- 本体论和法律知识表示
- 智能法律辅导系统
- ...
法律AI任务形式化程度较低,比较少见leaderboard形式的比赛。
法律AI数据集
国内数据集
美国数据集
法律只能方面的开放数据,大部分是原始数据,与AI任务不直接关联。下面几个数据集引用自10-best-legal-datasets-for-machine-learning.
- Legal Case Reports Data Set
机器学习任务相关。自动摘要、引证分析。- Department of Justice Open Data
高质量的开放数据集,并非面向具体任务。包括多个具体的数据库,如暴力犯罪案例、FBI犯罪报告、统计报告等。- The Supreme Court Database
200多个美国最高法院的案例,自1791年开始到2017年。- Caselaw Access Project (CAP)
包含美国360年的判例法(以判例形式出现的法律,英文名为caselaw)。- Bureau of Justice
美国的一些执法机构、监狱、假释、缓刑数据- Carp-Manning U.S. District Court Database
暂时无法访问。包含1927年开始的110000多个美国联邦地方法院的判决。- Patent Litigations
包含72000个案例信息,跨度52年。包含当事人、律师、诉讼结果、时间、地点信息。- Google Patents Public Data
国际专利制度相关的公开数据。- California Crime and Law Enforcement
加州的犯罪率、执法公开数据- Credit card agreement database
各信用卡发行单位的信用卡协议
Kaggle上也有一些法律、犯罪等方面的开放数据集,有些包括具体任务,有些不包括具体任务:
- 芝加哥犯罪数据
不包括具体任务- 旧金山犯罪分类的比赛
分类预测任务
法律AI比赛
国内
国际
开放比赛
非开放比赛
- LawGeex
LawGeex与斯坦福大学、杜克大学法学院和南加州大学。内容是四小时审查五项保密协议(NDA),并确定30个法律问题,包括仲裁,关系保密和赔偿。在这场比赛里,人类律师的平均准确率达到了85%,而AI的准确率达到了95%。AI也在26秒内完成了任务,而人类律师平均需要92分钟。
国际会议
法律AI应用
国内
国双科技
华宇元典
科大讯飞
国外
摘自Best Artificial Intelligence (AI) Software for Law Firms和5 Lawyer Bots You Can Try Now,列举了目前在商业中使用的一些法律人工智能服务。
- ToB的应用主要面向律师事务所,或面向一般公司。面向律师事务所的,以提高律师工作效率为目标。包括阅读理解协议、合同、文书,提取关键条款等,包括对历史诉讼数据的挖掘,也包括高效率的、面向律师的检索服务。
- ToC的应用。一种类型是在一个很窄但有需求量的领域深耕,如帮用户申诉停车费;也有帮助用户生成协议文书的;也有提供基本咨询服务,并介绍具体律师的。
Kira
主要面向合约文件分析。
合同分析。合同条款提取
合同审查
租赁条款提取
ROSS
主要面向律师事务所,提高律师处理case的效率。主要包括:
类案检索;
特定的排序、检索需求;
RAVN Systems
面向律师事务所,文档管理系统,并非只针对法律领域。高效管理文档、抽取信息。
Luminance
面向律师事务所。法律文件分析,提示需要重点关注的地方。
rradar
面向公司。提供法律建议、法律风险规避。
lexmachina
为律师事务所或公司的法律顾问服务。挖历史掘诉讼数据,为用户提供有用信息。
LISA
面向一般用户,帮助起草协议。通过自动向用户提一些问题,根据用户的回答生成协议。目前也支持起草房屋租赁等商业合同。
billybot
面向一般用户的法律咨询机器人,以对话系统方式提供服务。可以提供基本的法律信息,也可以帮助用户找到律师或调解员。
Automio
面向律师事务所。一个服务平台,帮助律师建立自己的律师机器人,提高面向用户的问答效率,也可以起草文书等。
DoNotPay
面向一般用户。帮助用户申诉不合理的停车费。
法律AI数据及应用的更多相关文章
- AI数据标注行业面临的5大发展困局丨曼孚科技
根据艾瑞咨询发布的行业白皮书显示,2018年中国人工智能基础数据服务市场规模为25.86亿元,预计2025年市场规模将突破113亿元,行业年复合增长率达到了23.5%. 作为人工智能产业的基石,数据 ...
- AI产品经理成长路
AI产品经理成长路 https://www.jianshu.com/p/4b98314ad3c0 以下都是自己平时知识的一些总结,只是一些个人的愚见,下面出现的公司.书籍.视频.网站都是自己看过体验过 ...
- 2050年这些职业将逐渐被AI(人工智能)取代
耳熟能详的人工智能 深蓝Deep Blue是美国IBM公司生产的一台超级国际象棋电脑,重1270公斤,有32个大脑(微处理器),每秒钟可以计算2亿步."深蓝”输入了一百多年来优秀棋手的对 ...
- 解读 --- 基于微软企业商务应用平台 (Microsoft Dynamics 365) 之上的人工智能 (AI) 解决方案
9月25日微软今年一年一度的Ignite 2017在佛罗里达州奥兰多市还是如期开幕了.为啥这么说?因为9月初五级飓风厄玛(Hurricane Irma) 在佛罗里达州登陆,在当地造成了挺大的麻烦.在这 ...
- 金牌架构师:我们是这样设计APP数据统计产品的
前言:近期,智能大数据服务商“个推”推出了应用统计产品“个数”,今天我们就和大家来谈一谈个数实时统计与AI数据智能平台整合架构设计. 很多人可能好奇,拥有数百亿SDK的个推,专注消息推送服务多年,现在 ...
- AI决策算法 之 GOAP (三)
源码地址:http://pan.baidu.com/s/1dFwzmfB 这篇我们使用上篇文章写的GOAP框架来完成一个实例: 实例内容: AI有10HP, 需要去站岗,站岗完成扣5HP 当HP< ...
- 新零售下的 AI智能货柜
公司有个智能货柜,通过微信扫码开门,拿货,自动扣款,挺智能的.还不错.研究一下原理,网上查了一下. 文章简介: 目前新零售风刮的蛮大,笔者进入该领域近一年,负责过无人便利店.智能货柜.智慧商超等产品, ...
- AI行业精选日报_人工智能(12·23)
日本探索用人工智能指挥交通 据日本共同社报道,日本一家机构正在研究开发一套新的交通系统,将应用人工智能技术分析数据来缓解城市交通拥堵.报道称,在日本新能源和产业技术综合开发机构研发的这套系统中,人工智 ...
- AI行业精选日报_人工智能(12·24)
特斯拉完全自动驾驶进步:新系统能识别交通信号标志 12 月 24 日,有美国车友称,升级最新的特斯拉 2019.40.50 系统后已经可以识别红绿灯和停车标志(目前仅限搭载 HW3.0 硬件的车型), ...
随机推荐
- 洛谷P3066 [USACO12DEC]逃跑的BarnRunning Away From…
题面链接 一句话题意:给出以1号点为根的一棵有根树,问每个点的子树中与它距离小于等于l的点有多少个. 我:似乎并不好做啊...看了题解后大雾... sol:考虑树上差分,对于一个点,在他那个位置++, ...
- 安卓创始人计划推出能帮你约会的AI手机
安卓操作系统的创始人安迪·鲁宾早些年已经离开谷歌公司,离开谷歌后鲁宾成立Essential Phone手机品牌.不过正如你所知道的那样尽管安迪·鲁宾有着很大的名气,但Essential Phone ...
- day9 笔记
集合 去重 无序 元素不可变类型 可hash 命令 set() 创建可变集合 frozenset() 创建不可变集合 .add() 添加元素,只能放单个值 .update() 添加元素,可以更新多个值 ...
- Mercurial(Hg)基本操作
Mercurial(Hg)基本操作 来源 https://www.cnblogs.com/gb2013/archive/2012/05/18/Mercurial_Basic.html Mercuria ...
- MT【240】6*6放黑白子
$6*6$的方格中放三个完全相同的黑子和三个完全相同的白子,要求每行每列都有一个棋子,且每一格只有一个棋子.问有多少不同放法? 解:$\dfrac{36*25*16*9*4*1}{3!*3!}=144 ...
- Sublime text3 插件HTML/CSS/JS prettify 格式化代码
1.首先安装插件 菜单的preference->packages control,然后输入install .. 回车,再输入HTML/CSS/JS prettify 再回车,重启后就可以了. 2 ...
- android post 方式 访问网络 实例
android post 方式 访问网络 实例 因为Android4.0之后对使用网络有特殊要求,已经无法再在主线程中访问网络了,必须使用多线程访问的模式 该实例需要在android配置文件中添加 网 ...
- emwin 之消息 WM_INIT_DIALOG
@2018-08-09 小记 消息 WM_INIT_DIALOG 在创建窗口时首先发送且只在创建窗口时发送即只发送这一次
- luogu4849 寻找宝藏 (cdq分治+dp)
设f[i]是已经走到i号点的值. 先要给第四维离散化.然后去重 第一维排序,第二维cdq分治,第三维cdq分治,第四维树状数组,找到满足j(x,y,z,w)<=i(x,y,z,w)的j,给i统计 ...
- shoi2017小结
某省选 胡雨菲让我做的,她自己已经AK了... 在loj(自由oj?)上面搜索shoi2017即可. 洛谷上也有,搜六省联考就行 第一题:大水题枚举 P3745 看题目就很水:(其实是因为胡雨菲给我讲 ...