借助ltp语义分析提取特征，之后，文本生成

"""
地点-哪里有做-业务-的(正规|靠谱)-公司？
地点-做-业务-的(正规|靠谱)-公司(有哪些？|的联系方式是什么？|哪家口碑好值得信赖？)
地点-做-业务-(怎么能省钱？|费用是多少？|需要注意什么？|有哪些流程？)
地点-业务-(靠谱吗？到底怎样？)
地点-(最好的|靠谱的)业务-是哪家？
"""
p, b = '深圳市', ['广告设计', '网络推广']

ltp_model = ['地点-哪里有做-业务-的(正规|靠谱)-公司？', '地点-做-业务-的(正规|靠谱)-公司(有哪些|的联系方式是什么|哪家口碑好值得信赖)？',
             '地点-做-业务-(怎么能省钱|费用是多少|需要注意什么|有哪些流程|靠谱吗|到底怎样)？', '地点-(最好的|靠谱的)业务-是哪家？']
r_l = []
for s in ltp_model:
    s = s.replace('地点', p).replace('-', '')
    for i in b:
        r_l.append(s.replace('业务', i))

def deal_first_splittag_str(i):
    s_l_1 = []
    psl, psr = i.find('(', 0), i.find(')', 0)
    sl, sm, sr = i[0:psl], i[psl + 1:psr], i[psr + 1:]
    l = sm.split('|')
    for ii in l:
        s_l_1.append('%s%s%s' % (sl, ii, sr))
    return s_l_1

def deal_first_splittag(s_l_0):
    s_l_1 = []
    for i in s_l_0:
        psl, psr = i.find('(', 0), i.find(')', 0)
        if psl == -1:
            s_l_1.append(i)
        else:
            sl, sm, sr = i[0:psl], i[psl + 1:psr], i[psr + 1:]
            l = sm.split('|')
            for ii in l:
                s_l_1.append('%s%s%s' % (sl, ii, sr))
    return s_l_1

while True:
    f = 0
    for i in r_l:
        if '(' in i:
            f = 1
            del r_l[r_l.index(i)]
            l = deal_first_splittag_str(i)
            r_l += l
    if f == 0:
        break

d = 9

def gen_r(uid):
    from pymongo import MongoClient

    def select_to_dic(k, collection_name,
                      database=MongoClient("mongodb://192.168.2.50:27017/", username='admin', password='admin')[
                          "personas_test"], where={}, fields={}):
        collection, r = database[collection_name], {}
        if fields == {}:
            cursor = collection.find(where)
        else:
            cursor = collection.find(where, fields)
        try:
            for doc in cursor:
                r[doc[k]] = doc
        finally:
            cursor.close()
        return r

    uid = int(uid)
    user_info = select_to_dic('_id', 'Analyse_user',
                              fields={'city': 1, 'city': 1, 'province': 1, 'core_keyword': 1, 'extract_keyword': 1,
                                      'biz': 1},
                              where={'uid': uid})
    if user_info == {}:
        return ['uid not in db']
    for k in user_info:
        d = user_info[k]
        p = '%s%s' % (d['province'], d['city'])
        b = d['core_keyword'] + d['extract_keyword'] + d['biz']
        b = [i for i in set(b)]

    """
    地点-哪里有做-业务-的(正规|靠谱)-公司？
    地点-做-业务-的(正规|靠谱)-公司(有哪些？|的联系方式是什么？|哪家口碑好值得信赖？)
    地点-做-业务-(怎么能省钱？|费用是多少？|需要注意什么？|有哪些流程？)
    地点-业务-(靠谱吗？到底怎样？)
    地点-(最好的|靠谱的)业务-是哪家？
    """
    # p, b = '深圳市', ['广告设计', '网络推广']

    ltp_model = ['地点-哪里有做-业务-的(正规|靠谱)-公司？', '地点-做-业务-的(正规|靠谱)-公司(有哪些|的联系方式是什么|哪家口碑好值得信赖)？',
                 '地点-做-业务-(怎么能省钱|费用是多少|需要注意什么|有哪些流程|靠谱吗|到底怎样)？', '地点-(最好的|靠谱的)业务-是哪家？']
    r_l = []
    for s in ltp_model:
        s = s.replace('地点', p).replace('-', '')
        for i in b:
            r_l.append(s.replace('业务', i))

    def deal_first_splittag_str(i):
        s_l_1 = []
        psl, psr = i.find('(', 0), i.find(')', 0)
        sl, sm, sr = i[0:psl], i[psl + 1:psr], i[psr + 1:]
        l = sm.split('|')
        for ii in l:
            s_l_1.append('%s%s%s' % (sl, ii, sr))
        return s_l_1

    def deal_first_splittag(s_l_0):
        s_l_1 = []
        for i in s_l_0:
            psl, psr = i.find('(', 0), i.find(')', 0)
            if psl == -1:
                s_l_1.append(i)
            else:
                sl, sm, sr = i[0:psl], i[psl + 1:psr], i[psr + 1:]
                l = sm.split('|')
                for ii in l:
                    s_l_1.append('%s%s%s' % (sl, ii, sr))
        return s_l_1

    while True:
        f = 0
        for i in r_l:
            if '(' in i:
                f = 1
                del r_l[r_l.index(i)]
                l = deal_first_splittag_str(i)
                r_l += l
        if f == 0:
            break

    return r_l

from wsgiref.util import setup_testing_defaults, request_uri
from wsgiref.simple_server import make_server

# A relatively simple WSGI application. It's going to print out the
# environment dictionary after being updated by setup_testing_defaults
def simple_app(environ, start_response):
    setup_testing_defaults(environ)

    status = '200 OK'
    headers = [('Content-type', 'text/plain; charset=utf-8')]

    start_response(status, headers)
    r_uri = request_uri(environ, include_query=True)
    if 'test_dump' in r_uri:
        return [("%s: %s\n" % (key, value)).encode('utf-8') for key, value in environ.items()]
    elif 'uid' in r_uri:

        try:
            uid = int(r_uri.split('/')[-1])
            if uid > 0:
                r_l = gen_r(uid)
                return [("%s: %s\n" % (i, r_l[i])).encode('utf-8') for i in range(len(r_l))]
            else:
                return [('%s%s' % ('BAD-REQUEST ', r_uri)).encode('utf-8')]
        except Exception as e:
            return [('%s%s%s' % (e, ' retry...,please.... ', r_uri)).encode('utf-8')]
    else:
        return [('%s%s' % ('dev-ING- ', r_uri)).encode('utf-8')]

with make_server('', 8000, simple_app) as httpd:
    print("Serving on port 8000...")
    httpd.serve_forever()

借助ltp语义分析提取特征，之后，文本生成的更多相关文章

借助ltp 逐步程序化实现规则库文本生成引擎基于规则库和业务词库去生成文本
[哪个地方做什么的哪家靠谱?地名词库行业.业务词库]苏州做网络推广的公司哪家靠谱?苏州镭射机维修哪家最专业?昆山做账的公司哪家比较好广州称重灌装机生产厂家哪家口碑比较好 [含有专家知识]郑州律师哪个好 ...
Texygen文本生成,交大计算机系14级的朱耀明
文本生成哪家强?上交大提出基准测试新平台 Texygen 2018-02-12 13:11测评新智元报道来源:arxiv 编译:Marvin [新智元导读]上海交通大学.伦敦大学学院朱耀明, 卢思 ...
斯坦福NLP课程 | 第15讲 - NLP文本生成任务
作者:韩信子@ShowMeAI,路遥@ShowMeAI,奇异果@ShowMeAI 教程地址:http://www.showmeai.tech/tutorials/36 本文地址:http://www. ...
卷积神经网络提取特征并用于SVM
模式识别课程的一次作业.其目标是对UCI的手写数字数据集进行识别,样本数量大约是1600个.图片大小为16x16.要求必须使用SVM作为二分类的分类器. 本文重点是如何使用卷积神经网络(CNN)来提取 ...
One-hot 编码/TF-IDF 值来提取特征,LAD/梯度下降法（Gradient Descent），Sigmoid
1. 多值无序类数据的特征提取: 多值无序类问题(One-hot 编码)把“耐克”编码为[0,1,0],其中“1”代表了“耐克”的中间位置,而且是唯一标识.同理我们可以把“中国”标识为[1,0],把 ...
SIFT提取特征
SIFT特征提取: 角点检测: Morvavec角点检测算子:基于灰度方差的角点检测方法,该算子计算图像中某个像素点沿水平.垂直方向上的灰度差异,以确定角点位置 Harris角点检测算子:不止考察水平 ...
Python将文本生成二维码
#coding:utf-8 ''' Python生成二维码 v1.0 主要将文本生成二维码图片测试一:将文本生成白底黑字的二维码图片测试二:将文本生成带logo的二维码图片 ''' __autho ...
java 正则表达式提取html纯文本
本文来自我的个人博客: java 正则表达式提取html纯文本做内容的大家都知道,从html中直接提取纯文本是一个非常大的问题.现将我做的正则匹配贴上: import java.util.regex ...
使用 paddle来进行文本生成
paddle 简单介绍 paddle 是百度在2016年9月份开源的深度学习框架. 就我最近体验的感受来说的它具有几大优点: 1. 本身内嵌了许多和实际业务非常贴近的模型比如个性化推荐,情感分析,词向 ...

随机推荐

教你轻松在React Native中使用自定义iconfont
在react-native项目中我们一般使用到 react-native-vector-icons(这里不介绍如何使用react-native-vector-icons按照官方文档即可)但是当reac ...
LeetCode（18）4Sum
题目 Given an array S of n integers, are there elements a, b, c, and d in S such that a + b + c + d = ...
杭电 1241 Oil Deposits （很好的dfs）
Description The GeoSurvComp geologic survey company is responsible for detecting underground oil dep ...
Centos 虚拟机和宿主机文件共享
我虚拟机下安装的是一个命令行式的centos ,想要把虚拟机里面的源文件移到宿主机上.于是我就想着搞一个文件共享. 网上有很多办法,比如Samba .ftp之类的.我选择了vmware自带的文件共享功 ...
MyBatis 3 分页
利用MyBatis 3进行分页,选定的数据库表c_province,有3列,id列,provinceid列,province列,用Oracle数据库.首先建立一个对应的实体类,Province有3个属 ...
遇到的Ajax相关问题
poj3207：Ikki's Story IV-Panda's Trick【2-sat tarjan】
题目大意:圆盘上顺次安放0, 1, 2, …, n – 1的点,每次给出两个点需要连边,可以选择在圆盘的正面连边或在圆盘的反面连边,问是否存在一种方案使得所有连线不相交? 思路:本问题可以等价成:圆盘 ...
【SPOJ694&705】Distinct Substrings（后缀数组）
题意:求一个字符串的不相同的子串个数 n<=1000 思路:这是一道论文题 ..]of longint; n,i,m,ans,v,cas:longint; ch:ansistring; proc ...
如何评价ionic和react native？
Q:对于开发hybird app首选哪个好?是ionic还是react native?如何评价ionic和react native? A: 我看好React系,React系以正确地姿势,专注地做了正确 ...
[Bzoj1015][JSOI2008]星球大战starwar（并查集）（离线处理）
1015: [JSOI2008]星球大战starwar Time Limit: 3 Sec Memory Limit: 162 MBSubmit: 6849 Solved: 3204[Submit ...

借助ltp语义分析提取特征，之后，文本生成

借助ltp语义分析提取特征，之后，文本生成的更多相关文章

随机推荐

热门专题