借助ltp语义分析提取特征，之后，文本生成

"""
地点-哪里有做-业务-的(正规|靠谱)-公司？
地点-做-业务-的(正规|靠谱)-公司(有哪些？|的联系方式是什么？|哪家口碑好值得信赖？)
地点-做-业务-(怎么能省钱？|费用是多少？|需要注意什么？|有哪些流程？)
地点-业务-(靠谱吗？到底怎样？)
地点-(最好的|靠谱的)业务-是哪家？
"""
p, b = '深圳市', ['广告设计', '网络推广']

ltp_model = ['地点-哪里有做-业务-的(正规|靠谱)-公司？', '地点-做-业务-的(正规|靠谱)-公司(有哪些|的联系方式是什么|哪家口碑好值得信赖)？',
             '地点-做-业务-(怎么能省钱|费用是多少|需要注意什么|有哪些流程|靠谱吗|到底怎样)？', '地点-(最好的|靠谱的)业务-是哪家？']
r_l = []
for s in ltp_model:
    s = s.replace('地点', p).replace('-', '')
    for i in b:
        r_l.append(s.replace('业务', i))

def deal_first_splittag_str(i):
    s_l_1 = []
    psl, psr = i.find('(', 0), i.find(')', 0)
    sl, sm, sr = i[0:psl], i[psl + 1:psr], i[psr + 1:]
    l = sm.split('|')
    for ii in l:
        s_l_1.append('%s%s%s' % (sl, ii, sr))
    return s_l_1

def deal_first_splittag(s_l_0):
    s_l_1 = []
    for i in s_l_0:
        psl, psr = i.find('(', 0), i.find(')', 0)
        if psl == -1:
            s_l_1.append(i)
        else:
            sl, sm, sr = i[0:psl], i[psl + 1:psr], i[psr + 1:]
            l = sm.split('|')
            for ii in l:
                s_l_1.append('%s%s%s' % (sl, ii, sr))
    return s_l_1

while True:
    f = 0
    for i in r_l:
        if '(' in i:
            f = 1
            del r_l[r_l.index(i)]
            l = deal_first_splittag_str(i)
            r_l += l
    if f == 0:
        break

d = 9

def gen_r(uid):
    from pymongo import MongoClient

    def select_to_dic(k, collection_name,
                      database=MongoClient("mongodb://192.168.2.50:27017/", username='admin', password='admin')[
                          "personas_test"], where={}, fields={}):
        collection, r = database[collection_name], {}
        if fields == {}:
            cursor = collection.find(where)
        else:
            cursor = collection.find(where, fields)
        try:
            for doc in cursor:
                r[doc[k]] = doc
        finally:
            cursor.close()
        return r

    uid = int(uid)
    user_info = select_to_dic('_id', 'Analyse_user',
                              fields={'city': 1, 'city': 1, 'province': 1, 'core_keyword': 1, 'extract_keyword': 1,
                                      'biz': 1},
                              where={'uid': uid})
    if user_info == {}:
        return ['uid not in db']
    for k in user_info:
        d = user_info[k]
        p = '%s%s' % (d['province'], d['city'])
        b = d['core_keyword'] + d['extract_keyword'] + d['biz']
        b = [i for i in set(b)]

    """
    地点-哪里有做-业务-的(正规|靠谱)-公司？
    地点-做-业务-的(正规|靠谱)-公司(有哪些？|的联系方式是什么？|哪家口碑好值得信赖？)
    地点-做-业务-(怎么能省钱？|费用是多少？|需要注意什么？|有哪些流程？)
    地点-业务-(靠谱吗？到底怎样？)
    地点-(最好的|靠谱的)业务-是哪家？
    """
    # p, b = '深圳市', ['广告设计', '网络推广']

    ltp_model = ['地点-哪里有做-业务-的(正规|靠谱)-公司？', '地点-做-业务-的(正规|靠谱)-公司(有哪些|的联系方式是什么|哪家口碑好值得信赖)？',
                 '地点-做-业务-(怎么能省钱|费用是多少|需要注意什么|有哪些流程|靠谱吗|到底怎样)？', '地点-(最好的|靠谱的)业务-是哪家？']
    r_l = []
    for s in ltp_model:
        s = s.replace('地点', p).replace('-', '')
        for i in b:
            r_l.append(s.replace('业务', i))

    def deal_first_splittag_str(i):
        s_l_1 = []
        psl, psr = i.find('(', 0), i.find(')', 0)
        sl, sm, sr = i[0:psl], i[psl + 1:psr], i[psr + 1:]
        l = sm.split('|')
        for ii in l:
            s_l_1.append('%s%s%s' % (sl, ii, sr))
        return s_l_1

    def deal_first_splittag(s_l_0):
        s_l_1 = []
        for i in s_l_0:
            psl, psr = i.find('(', 0), i.find(')', 0)
            if psl == -1:
                s_l_1.append(i)
            else:
                sl, sm, sr = i[0:psl], i[psl + 1:psr], i[psr + 1:]
                l = sm.split('|')
                for ii in l:
                    s_l_1.append('%s%s%s' % (sl, ii, sr))
        return s_l_1

    while True:
        f = 0
        for i in r_l:
            if '(' in i:
                f = 1
                del r_l[r_l.index(i)]
                l = deal_first_splittag_str(i)
                r_l += l
        if f == 0:
            break

    return r_l

from wsgiref.util import setup_testing_defaults, request_uri
from wsgiref.simple_server import make_server

# A relatively simple WSGI application. It's going to print out the
# environment dictionary after being updated by setup_testing_defaults
def simple_app(environ, start_response):
    setup_testing_defaults(environ)

    status = '200 OK'
    headers = [('Content-type', 'text/plain; charset=utf-8')]

    start_response(status, headers)
    r_uri = request_uri(environ, include_query=True)
    if 'test_dump' in r_uri:
        return [("%s: %s\n" % (key, value)).encode('utf-8') for key, value in environ.items()]
    elif 'uid' in r_uri:

        try:
            uid = int(r_uri.split('/')[-1])
            if uid > 0:
                r_l = gen_r(uid)
                return [("%s: %s\n" % (i, r_l[i])).encode('utf-8') for i in range(len(r_l))]
            else:
                return [('%s%s' % ('BAD-REQUEST ', r_uri)).encode('utf-8')]
        except Exception as e:
            return [('%s%s%s' % (e, ' retry...,please.... ', r_uri)).encode('utf-8')]
    else:
        return [('%s%s' % ('dev-ING- ', r_uri)).encode('utf-8')]

with make_server('', 8000, simple_app) as httpd:
    print("Serving on port 8000...")
    httpd.serve_forever()

借助ltp语义分析提取特征，之后，文本生成的更多相关文章

借助ltp 逐步程序化实现规则库文本生成引擎基于规则库和业务词库去生成文本
[哪个地方做什么的哪家靠谱?地名词库行业.业务词库]苏州做网络推广的公司哪家靠谱?苏州镭射机维修哪家最专业?昆山做账的公司哪家比较好广州称重灌装机生产厂家哪家口碑比较好 [含有专家知识]郑州律师哪个好 ...
Texygen文本生成,交大计算机系14级的朱耀明
文本生成哪家强?上交大提出基准测试新平台 Texygen 2018-02-12 13:11测评新智元报道来源:arxiv 编译:Marvin [新智元导读]上海交通大学.伦敦大学学院朱耀明, 卢思 ...
斯坦福NLP课程 | 第15讲 - NLP文本生成任务
作者:韩信子@ShowMeAI,路遥@ShowMeAI,奇异果@ShowMeAI 教程地址:http://www.showmeai.tech/tutorials/36 本文地址:http://www. ...
卷积神经网络提取特征并用于SVM
模式识别课程的一次作业.其目标是对UCI的手写数字数据集进行识别,样本数量大约是1600个.图片大小为16x16.要求必须使用SVM作为二分类的分类器. 本文重点是如何使用卷积神经网络(CNN)来提取 ...
One-hot 编码/TF-IDF 值来提取特征,LAD/梯度下降法（Gradient Descent），Sigmoid
1. 多值无序类数据的特征提取: 多值无序类问题(One-hot 编码)把“耐克”编码为[0,1,0],其中“1”代表了“耐克”的中间位置,而且是唯一标识.同理我们可以把“中国”标识为[1,0],把 ...
SIFT提取特征
SIFT特征提取: 角点检测: Morvavec角点检测算子:基于灰度方差的角点检测方法,该算子计算图像中某个像素点沿水平.垂直方向上的灰度差异,以确定角点位置 Harris角点检测算子:不止考察水平 ...
Python将文本生成二维码
#coding:utf-8 ''' Python生成二维码 v1.0 主要将文本生成二维码图片测试一:将文本生成白底黑字的二维码图片测试二:将文本生成带logo的二维码图片 ''' __autho ...
java 正则表达式提取html纯文本
本文来自我的个人博客: java 正则表达式提取html纯文本做内容的大家都知道,从html中直接提取纯文本是一个非常大的问题.现将我做的正则匹配贴上: import java.util.regex ...
使用 paddle来进行文本生成
paddle 简单介绍 paddle 是百度在2016年9月份开源的深度学习框架. 就我最近体验的感受来说的它具有几大优点: 1. 本身内嵌了许多和实际业务非常贴近的模型比如个性化推荐,情感分析,词向 ...

随机推荐

关于linux安装kettle的总结
一.部署准备 1.1 JDK安装配置命令行键入“cd /etc”进入etc目录命令行键入“vi profile”打开profile文件敲击键盘ctrl+F到文件末尾在末尾处,即第一个~的地方, ...
vue element-ui中引入第三方icon
vue element-ui中引入第三方icon 把图标加入项目设置项目名称,下载项目(项目名称自定义) 解压项目到开发目录在main.js中全局引入css文件修改下载下来的项目中的css文件, ...
list、tuple、dict内部功能释义
一.list内部功能释义运用频次:☆☆☆☆☆ 1. append():列表末尾插入元素 [示例] >>> L1=[11,22,33] >>> L1.append( ...
python019 Python3 File(文件) 方法
file 对象使用 open 函数来创建,下表列出了 file 对象常用的函数: 序号方法及描述 1 file.close() 关闭文件.关闭后文件不能再进行读写操作. 2 file.flush() ...
Linux 修改主机名
1 vi /etc/sysconfig/network 2 vi /etc/hosts 3 hostname xxx 4 Done! 退出重连后生效
openGL加载obj文件+绘制大脑表层+高亮染色
绘制大脑表层并高亮染色的工作是以openGL加载obj文件为基础的,这里是我们用到的原始程序:只能加载一个obj文件的demo. 然而,一个完整的大脑表层是由很多分区组成的,因此我们的程序需要支持两个 ...
[Usaco2007 Oct] Super Paintball超级弹珠
Time Limit: 5 Sec Memory Limit: 64 MBSubmit: 489 Solved: 384[Submit][Status][Discuss] Description ...
nginx反向代理ajax，解决跨域问题
server { listen 8000; server_name somename alias another.alias; location /a { add_header 'Access-Con ...
ｊａｖａ容器详解（以Array Arrays ArrayList为例）
//先记录一个想法……java实在是太臃肿了,纯面向对象也有不少弊端…… //能不能把java精简一下啊! 先上结论: Array:认真看api索引的话,Array有两个.一个是sql中的接口,一个是 ...
linux 常见名词及命令（一）
linux PK wondows 稳定且有效率.免费或少许费用.漏洞少且修补快.多任务多用户. 安全的用户及文件权限策略.适合小内核程序的嵌入系统.相对不耗资源. 热门的开源系统红帽企业系统(R ...

借助ltp语义分析提取特征，之后，文本生成

借助ltp语义分析提取特征，之后，文本生成的更多相关文章

随机推荐

热门专题