前言:前两篇转载别人的精彩文章,自己也总结一下吧!

最近又开始用起py,是为什么呢?

自己要做一个文本相似度匹配程序,大致思路就是两个文档,一个是试题,一个是材料,我将试题按每题分割出来,再将每题的内容与材料中进行文本相似度匹配。

所以先首先要做的是将试题把每道题作为一个字符串切割开来,存放到字典中。

程序入下:

# -*- coding:utf-8 -*-
import re #正则模块
f = open('test.txt','r')
s = f.read()
s1 = s.split('工作人员考试')#一级切割,把每套题分割开来
print len(s1)
r1 = re.split('(\d{1,3}\.)',s1[0])#用正则按比如"1.","11.","170."把每套题中的题亩切割开来
for i in r1:
print i
f.close() #关闭文件

文本内容:

一、判断題(正确的选A,错误的选B,涂在答题卡的相应位置:每题1分,共20分)
1. 沟通仅仅是两个或两个以上的人之间的意思传送。()
2. 扁平型组织的控制跨度要小些。 ()
3. 企业人员素质普遍偏高,对领导的意图能很好地意会,则适合采取集权管理。()
4. 决策的关键是目标,没有目标就没有决策。 ()
5. 头脑风暴法是为了保证群体决策的创造性,提高决策质量,改善群体决策而发展起来。()
6. 优秀领导者不仅依靠合法的地位所赋予他的职权,而且能以个人的才能、魄力和威望来促使他人努力工作。 ()

输出结果:

Python 2.7.10 (default, May 23 2015, 09:40:32) [MSC v.1500 32 bit (Intel)] on win32
Type "copyright", "credits" or "license()" for more information.
>>> ================================ RESTART ================================
>>>
13
2016年4月16日重庆市綦江区事业单位公开招聘
一、判断題(正确的选A,错误的选B,涂在答题卡的相应位置:每题1分,共20分) 1.
沟通仅仅是两个或两个以上的人之间的意思传送。() 2.
扁平型组织的控制跨度要小些。 () 3.
企业人员素质普遍偏高,对领导的意图能很好地意会,则适合采取集权管理。() 4.
决策的关键是目标,没有目标就没有决策。 () 5.
头脑风暴法是为了保证群体决策的创造性,提高决策质量,改善群体决策而发展起来。() 6.
优秀领导者不仅依靠合法的地位所赋予他的职权,而且能以个人的才能、魄力和威望来促使他人努力工作。 ()

最后说明一下:
re.split('(\d{1,3}\.)',s1[0])#这里若去掉括号,则分割符号不会被保留

输出结果如下:

>>> ================================ RESTART ================================
>>>
13
2016年4月16日重庆市綦江区事业单位公开招聘
一、判断題(正确的选A,错误的选B,涂在答题卡的相应位置:每题1分,共20分) 沟通仅仅是两个或两个以上的人之间的意思传送。() 扁平型组织的控制跨度要小些。 () 企业人员素质普遍偏高,对领导的意图能很好地意会,则适合采取集权管理。() 决策的关键是目标,没有目标就没有决策。 () 头脑风暴法是为了保证群体决策的创造性,提高决策质量,改善群体决策而发展起来。() 优秀领导者不仅依靠合法的地位所赋予他的职权,而且能以个人的才能、魄力和威望来促使他人努力工作。 ()

前两篇转载别人的精彩文章,自己也总结一下python split的用法吧!的更多相关文章

  1. aspx页面调用发送邮件验证码(结合前两篇)

    <%@ Page Language="C#" AutoEventWireup="true" CodeFile="Default3.aspx.cs ...

  2. SpringMvc支持Ajax概述【见前两篇随笔--详述前后数据互通】

    1.原生javaWeb:不再用 1).导入GSON: 2).返回的数据用GSON转成json 3).写出去: 2.SpringMVC快速的完成ajax功能? 导包 jackson-annotation ...

  3. wp-query调用前几篇文章的方法

    ---恢复内容开始--- 利用强大的wp-query函数调用指定分类下的前几篇文章,下面的代码表示调用的是分类ID4下的前两篇文章. <?php $cunt_wenzhen = array('c ...

  4. 用mvc模式,整理前两次的代码并增加登陆注册

    简单的servlet连接mysql数据库 使用mvc的登录注册 commons-dbutils-1.6 mysql-connector-java-5.1.40-bin c3p0-0.9.5.2 mch ...

  5. 《转载-两篇很好的文章整合》Android中自定义控件

    两篇很好的文章,有相互借鉴的地方,整合到一起收藏 分别转载自:http://blog.csdn.net/xu_fu/article/details/7829721 http://www.cnblogs ...

  6. 两篇文章带你走入.NET Core 世界:CentOS+Kestrel+Ngnix 虚拟机先走一遍(一)

    背景: 上一篇:ASP.Net Core on Linux (CentOS7)共享第三方依赖库部署 已经交待了背景,这篇就省下背景了. 折腾的过程分两步: 第一步是:本机跑虚拟机部署试一下: 第二步是 ...

  7. 两篇很好的EPG相关文章

    两篇很好的EPG相关文章 原文地址:http://blog.sina.com.cn/s/blog_53220cef0100pi8j.html 1 基于DVB-SI的数字有线电视机顶盒节目指南的设计实现 ...

  8. 关于DataTable的两篇基础文章

    DataTable有的时候还是很有用的.记录两篇不错的文章,当字典 1.http://blog.csdn.net/imagse/article/details/3085870 2.https://ms ...

  9. jq最新前三篇文章高亮显示

    /*---------最新前三篇文章高亮显示-------------*/ function latest(){ var color_arr=new Array( "blue", ...

随机推荐

  1. Java集合之ArrayList源码分析

    1.简介 List在数据结构中表现为是线性表的方式,其元素以线性方式存储,集合中允许存放重复的对象,List接口主要的实现类有ArrayList和LinkedList.Java中分别提供了这两种结构的 ...

  2. 使用Windows2003创建AD服务器 - 进阶者系列 - 学习者系列文章

    Windows 2003的AD功能不是很强,但是还是提供了不错的功能.下面简要介绍下Windows 2003的AD配置说明. 1.  从添加删除Windows组件安装AD功能项 2.  完成安装.这里 ...

  3. 通过js实现在页面中添加音乐

    代码如下!兼容IE // JavaScript Document function autoPlay(){//自动播放 var myAuto = document.getElementById('my ...

  4. JS定时跳转URL并输出剩余秒数

    1. [代码][JavaScript]代码 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 <scrip ...

  5. Back to High School Physics - UVa10071

    欢迎访问我的新博客:http://www.milkcu.com/blog/ 原文地址:http://www.milkcu.com/blog/archives/uva10071.html 题目描述 Pr ...

  6. linux下的中文编码问题

    很多linux的初学者都会碰到这样一个问题:把windows下的文档拷到linux系统,会出现乱码!其实这涉及到中文编码的问题.linux系统默认的是统一码(utf8).而如果你的文件是big5,显然 ...

  7. Redis一些命令总结

      链接操作相关的命令 quit:关闭连接(connection) auth:简单密码认证 持久化 save:将数据同步保存到磁盘 bgsave:将数据异步保存到磁盘 lastsave:返回上次成功将 ...

  8. JavaWEB开发国际化

    1.国际化开发概述 )软件的国际化:软件开发时,要使它能同时应对世界不同地区和国家的访问,并针对不同地区和国家的访问,提供相应的.符合来访者阅读习惯的页面或数据. )国际化又称为 i18n:inter ...

  9. Getting Started with Core Data

    Getting Started with Core Data Getting Started with Core Data Coreframework支持创建对象模型封装你的应用数据和逻辑满足MVC设 ...

  10. 公众平台Bee.WeiXin

    微信公众平台Bee.WeiXin开发介绍 阅读目录 开始 预览 配置项说明 调用链方式的应答 理解调用链上下文 自定义MVC响应 总结 我们来看一下如何通过Bee.WeiXin开发微信公众平台.关于微 ...