虽然，虽然，虽然，今天：

　　百度发布了2019年第一季度未经审计的财务报告。本季度百度营收241亿元人民币（约合35.9亿美元），同比增长15%，移除业务拆分收入影响，同比增长21%。低于市场预期242.7亿元。净亏损为人民币3.27亿元（约合4900万美元），去年同期净利润为人民币66.94亿元。这也是百度上市以来的首个季度亏损。

　　但我还是要肯定百度科技公司要做的工作，尤其是在AI的商业落地方面，做出了不少贡献，其开源的一系列资源供大多数科研工作者、企业工作者等摸索前进，心怀感恩，开放包容。

　　我做NLP这块，用到了百度AI平台的文本审核功能，也就是文本分类，判别文本的内容是否有违禁、暴恐、涉黄等内容。访问了它的API，一些工作记录如下：

百度AI文本审核地址：http://ai.baidu.com/solution/censoring

批量访问：

　　1）python工具

　　2）步骤1：申请access token，代码如下：

def get_access_key():

    # client_id 为官网获取的AK， client_secret 为官网获取的SK

    host = 'https://aip.baidubce.com/oauth/2.0/token?grant_type=client_credentials&client_id=【百度云应用的AK】&client_secret=【百度云应用的SK】'

    request = urllib.request.Request(host)

    request.add_header('Content-Type', 'application/json; charset=UTF-8')

    response = urllib.request.urlopen(request)

    content = response.read()

    if (content):

        print(content)

　　从content中抽取，access token字段

　　3）文本审核，代码如下：

def check_content():

    request_url = 'https://aip.baidubce.com/rest/2.0/antispam/v2/spam?access_token=【你自己的access token哦！！！】'

    items = {'':'暴恐违禁', '':'文本色情', '':'政治敏感', '':'恶意推广', '':'低俗辱骂', '':'低质灌水'}

    with open('./baidu_data/checked_data_1.txt', 'r', encoding='utf8') as fr:

        with open('./baidu_data/data_1_check_result.txt', 'a', encoding='utf8') as fw:

            for i, each in enumerate(fr.readlines()):

                print('正在检测样本：{}'.format(i))

                params = {'content': each.strip().split('\t')[-1]}

                result = requests.post(request_url, headers={'Content-Type': 'application/x-www-form-urlencoded'}, data=params).text

                predict_res = (json.loads(result).get('result')).get('reject')

                print(predict_res)

                if len(predict_res) == 0:

                    # 普通直接保存

                    fw.write('普通\t'+'0\t###\t'+each)

                else:

                    # 获取拒绝得分最高的那个

                    score = []

                    content = []

                    for each_hit in predict_res:

                        score.append(each_hit.get('score'))

                        temp = each_hit.get('hit')

                        content.append(str(each_hit.get('label'))+'\t'+','.join(each_hit.get('hit'))+'\t')

                    # 找到得分最大的那个索引

                    max_score_index = score.index(max(score))

                    tag_label = content[max_score_index]

                    # 写入

                    fw.write('{}\t'.format(items.get(tag_label.split('\t')[0]))+tag_label+each)

　　我这里是根据任务，找到结果中我需要的信息，流程是没问题的，你可以根据你的需求改正哦

　　就这么简单，为什么api文档中不给出样例demo呢，花了一些时间。

百度AI文本审核API使用说明的更多相关文章

百度AI开放平台- API实战调用
百度AI开放平台- API实战调用一. 前言首先说一下项目需求. 两个用户,分别上传了两段不同的文字,要计算两段文字相似度有多少,匹配数据库中的符合条件的数据,初步估计列出来会有60-1 ...
AI文本审核垃圾内容
今天无意获得一个AI的文本审核的API,基于深度学习及大规模样本训练的人工智能文本审核技术,一站式准确检测识别文本中夹杂的色情.推广.辱骂.违禁违法等垃圾内容,净化网络环境,为您的应用提供更可靠 ...
利用PHP和百度ai实现文本以及图片的审核
步骤: 首先打开百度ai 开发平台注册一个账号: 注册账号,进入控制台创建自己的应用,获取apikey 和秘钥进入文档页文本审核: 图像审核: 代码实例: class Sentive { pr ...
PHP利用百度ai实现文本和图片审核
之前做平台内容发布审核都是自己构建一套违禁词库,在代码中利用词库判断用户发布的内容,现在可以使用百度ai api完成这个功能.接下来就简单说下怎么做吧: 首先打开百度ai 开发平台注册一个账号: 注 ...
python 全栈开发，Day122(人工智能初识,百度AI)
一.人工智能初识什么是智能? 我们通常把人成为智慧生物,那么”智慧生物的能力”就是所谓的”智能”我们有什么能力?听,说,看,理解,思考,情感等等什么是人工智能? 顾名思义就是由人创造的”智慧能力” ...
了解人工智能？-百度AI
了解人工智能? 什么是人工智能? 由人创造的"智慧能力",同样具备智慧生物的能力耳朵=倾听=麦克风=语音识别 ASR Automatic Speech Recognition 嘴 ...
百度AI开发平台简介
AIstudio https://aistudio.baidu.com/aistudio/index 关于AI Studio AI Studio是基于百度深度学习平台飞桨的一站式AI开发平台,提供在线 ...
基于百度AI开放平台的人脸识别及语音合成
基于百度AI的人脸识别及语音合成课题课题需求 (1)人脸识别在Web界面上传人的照片,后台使用Java技术接收图片,然后对图片进行解码,调用云平台接口识别人脸特征,接收平台返回的人员年龄.性别.颜 ...
人工智能-调百度AI接口+图灵机器人
1.登陆百度AI的官网 1.注册:没有账号注册 2.创建应用 3.创建应用 4.查看应用的ID 5.Python代码 from aip import AipSpeech APP_ID = " ...

随机推荐

python基础语法1 用户交互，基本数据类型，格式化输出，运算符
与用户交互: 输入: python2: input一定要声明你输入的类型 >>> input(">>:") >>:sean Traceba ...
【Postgres】根据字段数据创建空间字段
--添加空间字段 , ); --根据其他字段更新空间字段数据 update "GIS" b ) from "GIS" a where b."ID&qu ...
hive中时间操作（二）
转:https://blog.csdn.net/qq646748739/article/details/77997276 --Hive中日期函数总结:--1.时间戳函数--日期转时间戳:从1970-0 ...
vue 自定义过滤器
vue允许自定义过滤器,被用作一些常见文本的格式化.由“管道符”指示,格式如下:  {{message | capitalize}} <!-- 在 ...
优化sql技巧
当表很大的时候可以设计冗余字段,避免与大表连表查询造成性能低下比如日志表和用户表,日志表通常到后期会相当的大可以做一个username的冗余字段,避免查看username的时候去和user表关联当 ...
KD-Tree总结
KD-Tree总结问题引入平面上有$n$个点,$q$组询问,每一次查询距离$(x,y)$最近的点对,强制在线. 问题解决暴力显然我们可以直接枚举点然后算距离取$min$,这样子 ...
HashSet Integer输出有序，String输出无序
1. 背景自己在测试HashSet时,发现其输出Integer是有序的.2. 测试public static void hashSetObjectTest(){ Set<Integer> ...
LCA的几种做法
P3379 LCA $ 1:$蜗牛爬式 void dfs(int u,int fa) { f[u]=fa;//预处理father for(int i=head[u]; i; i=e[i].nxt) i ...
[Gamma]Scrum Meeting#1
github 本次会议项目由PM召开,时间为5月26日晚上10点30分时长25分钟任务表格人员昨日工作下一步工作木鬼撰写博客,组织例会 swoip 前端显示屏幕,翻译坐标 bhlt 后端 ...
[技术博客]JSCover+selenium获得js代码覆盖率
本文档讲解了我们是如何使用JSCover来获得Selenium的测试样例的js代码文件的执行覆盖率的. 事实上网上有挺多博客讲这玩意儿了,不过完全按照网上已有的教程去弄的的话,并无法满足我们的需要. ...

百度AI文本审核API使用说明

虽然，虽然，虽然，今天：

百度AI文本审核API使用说明的更多相关文章

随机推荐

热门专题