内容审查器

Azure 内容审查器也是一项认知服务。它支持对文本、图形、视频进行内容审核。可以过滤出某些不健康的内容,关键词。使你的网站内容符合当地的法律法规,提供更好的用户体验。

文本内容审核

其中文本内容的审核应用比较广泛。比如在审核游戏中的群聊内容,过滤掉不健康关键词;在社交媒体发布的内容过滤关键词等。Azure 内容审查器支持对绝大多数语言的审核,当然也包括中文。它已经内置了中文常用关键词列表,当然也可以自定义关键词列表。下面让我们看看如何

创建内容审查器

在portal管理平台找到内容审查器,点击“创建”。



区域选择离你最近的。

定价层选择免费F0。

内容审查器的免费策略为:5000事务/月,1次/s 。



创建完资源后,点击资源左边菜单:密码与终结点。复制好密钥跟终结点信息后面会用到。

使用.NET调用文本审核API

创建控制台项目

使用VS创建一个控制台项目。我们来简单演示下如何使用C#代码来实现文本审核。

创建完控制台项目后,在nuget管理工具里找到:Microsoft.Azure.CognitiveServices.ContentModerator这个包安装之。

编写代码进行审核

修改main方法为以下内容:

    static void Main(string[] args)
{
Console.WriteLine("Hello World!"); var endpoint = "https://x.cognitiveservices.azure.com/";
var subscriptionkey = "x"; var client = new ContentModeratorClient(new ApiKeyServiceClientCredentials(subscriptionkey));
client.Endpoint = endpoint; var text = @"哈哈,从前有个xx,他喜欢吃山芋。他喜欢骂人xxx的,xxx什么的。";
Console.WriteLine(text);
var screen =
client.TextModeration.ScreenText(
"text/plain",
new MemoryStream(Encoding.UTF8.GetBytes(text)),
"zho",
true,
true,
null,
true); foreach (var term in screen.Terms)
{
Console.WriteLine(term.Term);
} Console.ReadLine();
}

代码很简单。实例化一个ContentModeratorClient之后把骂人的话传进去调用ScreenText方法就会返回包含的关键词。

注意第三个参数lang要穿 zho ,不然识别不出来。

让我们看一下识别的结果。可以看到脏话都给识别出来了,哈哈。

自定义关键词列表

Azure已经内置了常用的关键词列表。如果想要加入自定义的关键词可以自己创建关键词列表。在调用ScreenText的时候传入列表的id就可以了。

//自定义过滤关键词列表
static string CreateList(ContentModeratorClient client)
{
Body body = new Body("blacklist", "Term list description");
TermList list = client.ListManagementTermLists.Create("application/json", body);
client.ListManagementTerm.AddTerm(list.Id.ToString(), "二愣子", null); return list.Id.ToString();
}
 var screen =
client.TextModeration.ScreenText(
"text/plain",
new MemoryStream(Encoding.UTF8.GetBytes(text)),
"zho",
true,
true,
listId,//自定义关键词listId
true);

总结

Azure 内容审查器是除了文本审核还包括图片视频内容的审核。本次简单介绍了如何使用.Net平台来实现文本内容的审核。由于Azure已经内置了大量常用关键词,也封装了SDK所以基本上可以做到开箱即用。当然了它还支持REST API方式来调用,这样就不受语言限制了。接下来还会介绍如何进行图片、视频的识别,敬请期待。

关注我的公众号一起玩转技术

Azure 内容审查器之文本审查的更多相关文章

  1. Azure内容审查器之羞羞图审查

    上一篇 Azure 内容审查器之文本审查我们已经介绍了如果使用Azure进行文字内容的审核.对于社区内容,上传的图片是否含有羞羞内容也是需要过虑的.但是最为一般开发者自己很难实现这种级别的智能识别.但 ...

  2. 转换 Html 内容为纯文本内容(html,文本互转)

    转自http://www.cnblogs.com/jyshi/archive/2011/08/09/2132762.html : /// <summary> /// 转换纯文本内容为 HT ...

  3. python开发_tkinter_获取文本框内容_给文本框添加键盘输入事件

    在之前的blog中有提到python的tkinter中的菜单操作 python开发_tkinter_窗口控件_自己制作的Python IDEL_博主推荐 python开发_tkinter_窗口控件_自 ...

  4. 获取input type=file 的文件内容(纯文本)

    一.获取input type=file 的文件内容(纯文本) 1.需求一 通过点击其他事件,来触发 文件选择框(限定格式为 .c 文件),而不是手动鼠标点击触发. [思路:] step1:将 inpu ...

  5. 编写Java程序,读取文本文档的内容,去除文本中包含的“广告”字样,把更改后的内容保存到一个新的文本文档中

    查看本章节 查看作业目录 需求说明: 读取文本文档的内容,去除文本中包含的"广告"字样,把更改后的内容保存到一个新的文本文档中 实现思路: 在main() 方法中,使用 new F ...

  6. Python: translate()审查清理文本字符串

    ①凌乱的字符串如下: ②创建一个小的转换表格然后使用translate()方法 空白字符\t和\f已经被重新映射到一个空格. \r直接被删除 ③构建一个更大的表格,删除所有的和音符

  7. Azure AI 服务之文本翻译

    当下人工智能可谓是风头正劲,几乎所有的大厂都有相关的技术栈.微软在 AI 领域自然也是投入了重注,并且以 Azure 认知服务的方式投入了市场: 也就是说作为开发者我们不需要学习太多 AI 的理论知识 ...

  8. LINUX文件内容处理及文本编辑器vim

    Linux基本操作命令 echo命令 echo命令: 把echo后面的内容显示到屏幕. -n 显示内容的时候不显示每行结尾的回车 echo 内容 >> 文件名 表示把内容加到一个文件的末尾 ...

  9. 服务端JSON内容中有富文本时

    问题背景 由于数据中存在复杂的富文本,包含各种引号和特殊字符,导致后端和前端通过JSON格式进行数据交互引发前端JSON解析出错. 解决方案 后端将富文本内容 ConvertToBase64Strin ...

随机推荐

  1. 重拾Java Web应用的基础体系结构

    目录 一.背景 二.Web应用 2.1 HTML 2.2 HTTP 2.3 URL 2.4 Servlet 2.4.1 编写第一个Servlet程序 2.5 JSP 2.6 容器 2.7 URL映射到 ...

  2. Apache Hudi 0.6.0版本重磅发布

    1. 下载信息 源码:Apache Hudi 0.6.0 Source Release (asc, sha512) 二进制Jar包:nexus 2. 迁移指南 如果您从0.5.3以前的版本迁移至0.6 ...

  3. 两台Windows Server 2012 R2数据库同步

    文件服务器/备库(192.168.0.1) 数据库服务器/备份文件服务器(192.168.0.2) 数据库实时同步 一.在主数据库服务器里,同样打开隐藏文件,找到C:\ProgramData\MySQ ...

  4. 详解 `HTTP` 系列之一

    前言 本文介绍的是HTTP的基础知识,包括HTTP的由来.HTTP的报文信息.状态码.HTTP三个版本的对比等.希望这篇简短的文章能对大家认识HTTP协议提供帮助. HTTP的前世今生 HTTP 由来 ...

  5. 【python】迭代器与生成器到底是什么?看完你就知道

    迭代器跟生成器,与上篇文章讲的装饰器一样,都是属于我的一个老大难问题. 通常就是遇到的时候就去搜一下,结果在一大坨各种介绍博客中看了看,回头又忘记了. 你是不是也是这样呢? 俗话说:好记性不如烂笔头, ...

  6. 题解 洛谷P3799 【妖梦拼木棒】

    一道水题 (还是做了一个小时,我太菜了 基本思路: 题里面说,4根棍子拼成一个正三角形(等边三角形) 若设这四根棍子长度为\(a,b,c,d\)且\(a≥b>c≥d\) 那很容易得到 (真的很容 ...

  7. 知识点干货——CSS动画

    CSS动画 (transition.animation) //2D动画 transform:translate(); /*偏移*/ transform:rotate(); /*旋转角度*/ trans ...

  8. C002:计算球体体积(半径固化)

    程序: #include "stdafx.h" int _tmain(int argc, _TCHAR* argv[]) { float sphereRadius=10.0f; f ...

  9. 20190926-02Redis五大数据类型之Set 000 028

  10. Tomcat源码分析(从启动流程到请求处理)

    Tomcat 8.5下载地址 https://tomcat.apache.org/download-80.cgi Tomcat启动流程 Tomcat源码目录 catalina目录 catalina包含 ...