词频统计-------------web版本

要求：把程序迁移到web平台，通过用户上传TXT的方式接收文件。建议(但不强制要求)保留并维护Console版本，有利于测试。

在页面上设置上传的控件,然后在servlet中接受，得到的是一个字节流，然后转化为字符型在原有代码中进行统计。

jsp页面的代码如下

<%@ page language="java" contentType="text/html; charset=utf-8"

    pageEncoding="utf-8"%>

<!DOCTYPE html PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN" "http://www.w3.org/TR/html4/loose.dtd">

<html>

<head>

<meta http-equiv="Content-Type" content="text/html; charset=utf-8">

<title>Insert title here</title>

</head>

<body>

 <table>

     <tr>

         <td>

             <form action="server/CountWordServlet" method="post" enctype="multipart/form-data">

             请上传要统计的文件<input type="file" name="sourceFile"/>

                     <input type="submit" value="上传">

             </form>

         </td>

     </tr>

 </table>

</body>

</html>

展示结果的页面如下

<%@page import="com.server.servlet.Word"%>

<%@page import="java.util.ArrayList"%>

<%@ page language="java" contentType="text/html; charset=utf-8"

    pageEncoding="utf-8"%>

<!DOCTYPE html PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN" "http://www.w3.org/TR/html4/loose.dtd">

<html>

<head>

<meta http-equiv="Content-Type" content="text/html; charset=utf-8">

<%ArrayList<Word> list=(ArrayList<Word>)request.getAttribute("list"); %>

<title>Insert title here</title>

</head>

<body>

 <table>

             <%

             if(list!=null&&list.size()!=0){

                 %>

                 <tr> <td>单词</td><td>数量</td> </tr>

                 <%

                 for(int i=0;i<list.size();i++){

                      String word=((Word)list.get(i)).getWord();

                      int num=((Word)list.get(i)).getNum();

                      %><tr>

                          <td><%=word%></td>

                          <td><%=num%></td>

                      </tr>

                      <%

                  }

             }else{  %>

                 <td>此文件没有单词或者文件不存在</td>

         <%     }

          %>

 </table>

</body>

</html>

servle中的代码如下

public class CountWordServlet extends HttpServlet {

    private static final long serialVersionUID = 1L;

    protected void doPost(HttpServletRequest request, HttpServletResponse response) throws ServletException, IOException {

        try {

        request.setCharacterEncoding("utf-8");

        ArrayList<Word> list=new ArrayList<>();

        DiskFileItemFactory factory=new DiskFileItemFactory();

        ServletFileUpload upload=new ServletFileUpload(factory);

            FileItemIterator iterator=upload.getItemIterator(request);

            while(iterator.hasNext()){

                InputStream input=iterator.next().openStream();

                WordCountFreq wcf=new WordCountFreq();

                list=(ArrayList<Word>) wcf.sortAndOutput(input);

                request.setAttribute("list", list);

            }

        } catch (FileUploadException e) {

            e.printStackTrace();

        }

        System.out.println("成功了！");

        response.setContentType("text/html;charset=utf-8");

          request.getRequestDispatcher("/show.jsp").forward(request, response);

    }

}

然后将统计过程的关键方法sortAndOutput（）展示如下

public List<Word> sortAndOutput(InputStream input) throws IOException {

        BufferedInputStream bis=new BufferedInputStream(input);

        byte [] buf = new byte[1024];

        int len = -1;

     String temp = "";

        String lastWord = "";

        while((len = bis.read(buf)) != -1) {

            //将读取到的字节数据转化为字符串打印出来

            String str = new String(buf,0,len);

             temp = "";

            temp += lastWord;

            for (int i = 0; i < str.length(); i++) {

                temp += str.charAt(i);

            }

            lastWord = "";

            if (Character.isLetter(str.charAt(str.length()-1))) {

                int j, t;

                for (j = str.length() - 1, t = 0; Character.isLetter(str.charAt(j)); j--, t++);

                temp = temp.substring(0, temp.length() - t);

                for (int k = j + 1; k < str.length(); k++) {

                    lastWord += str.charAt(k);

                }

            }

            root = generateCharTree(temp);

        }

示例如下

在没做web版本之前，只是传入文件的路径进行处理。改为web版本之后将遇见的一点小困难是要将字节流转化为字符进行处理，经过查询也很快就解决了。

ssh:git@git.coding.net:muziliquan/GUIVersion.git

git:git://git.coding.net/muziliquan/GUIVersion.git

词频统计-------------web版本的更多相关文章

Java实现的词频统计——Web迁移
本次将原本控制台工程迁移到了web工程上,依旧保留原本控制台的版本. 需求: 1.把程序迁移到web平台,通过用户上传TXT的方式接收文件: 2.在页面上给出链接 (如果有封皮.作者.字数.页数等信息 ...
java词频统计——web版支持
需求概要: 1.把程序迁移到web平台,通过用户上传TXT的方式接收文件. 2.用户直接输入要统计的文本,服务器返回结果 3.在页面上给出链接 (如果有封皮.作者.字数.页数等信息更佳)或表格,展示经 ...
词频统计Web工程
本次将原本控制台工程迁移到了web工程上.. 需求: 1.把程序迁移到web平台,通过用户上传TXT的方式接收文件: 2.在页面上给出链接 (如果有封皮.作者.字数.页数等信息更佳)或表格,展示经典英 ...
个人项目----词频统计WEB(部分功能)
需求分析 1.使用web上传txt文件,对上传的txt进行词频统计. 2.将统计后的结果输出到web页面,力求界面优美. 3.在界面上展示所给url的文章词频统计,力求界面优美. 3.将每个单词同四. ...
词频统计web
<%@ page language="java" import="java.util.*" pageEncoding="utf-8"% ...
Hadoop之词频统计小实验
声明: 1)本文由我原创撰写,转载时请注明出处,侵权必究. 2)本小实验工作环境为Ubuntu操作系统,hadoop1-2-1,jdk1.8.0. 3)统计词频工作在单节点的伪分布上,至于真正实 ...
python瓦登尔湖词频统计
#瓦登尔湖词频统计: import string path = 'D:/python3/Walden.txt' with open(path,'r',encoding= 'utf-8') as tex ...
c#词频统计命令行程序
这里将用c#写一个关于词频统计的命令行程序. 预计时间分配:输入处理3h.词条排序打印2h.测试3h. 实际时间分配:输入处理1h.词条排序打印2h.测试3h.程序改进优化6h. 下面将讲解程序的完成 ...
java词频统计——改进后的单元测试
测试项目博客文章地址:[http://www.cnblogs.com/jx8zjs/p/5862269.html] 工程地址:https://coding.net/u/jx8zjs/p/wordCo ...

随机推荐

浅谈ASP.Net ProcessPostData方法
其实这两次方法做的都是同一件事儿,让我们来看下图片中的代码,唯一的区别就是两次传入的参数不一样,一个是postData集合和Page_Load加载前的标记,另一个是leftoverPostData集合 ...
设计模式：中介者模式（Mediator）
定义:用一个中介对象来封装一系列对象的交互.中介者使各个对象不需要显示地相互作用,从而耦合松散,而且可以独立的改变他们之间的交互. 结构图: Mediator类,抽象中介者类 abstract ...
SQLSERVER 表名数据库名作为变量必须使用动态SQL(源自网络)
动态语句基本语法: 1 :普通SQL语句可以用exec执行 Select * from tableName exec('select * from tableName') exec sp_execut ...
linux关机
init 0; init是所有进程的祖先﹐它的进程号始终为1﹐所以发送TERM信号给init会终止所有的用户进程﹑守护进程等.shutdown 就是使用这种机制.init定义了8个运行级别(runle ...
imx6 MFG TOOL 分析
之前分析过mfgtool的内容,最近从官网下载,返现新版的mfgtool工具将imx6各种版本的linux/android都使用一个工具进行烧录.所以从新分析一下. 新版与旧版的一个区别是烧写使用的u ...
c# 并行运算
c# 并行运算 1. Parallel.INVOKE() 看实例: private static Stopwatch watch = new Stopwatch(); private static v ...
No mapping found for HTTP request with URI [] in DispatcherServlet with name 'appServlet'
项目是使用SpringMVC (1)在浏览器中访问,后台总报错: No mapping found for HTTP request with URI [] in DispatcherServlet ...
如何在 Linux 中清除缓存（Cache）
如何在 Linux 中清除缓存(Cache) 方法一: http://mp.weixin.qq.com/s?__biz=MjM5ODAzODgyMQ==&am ...
2.TCP_IP互联线缆_TCP_UDP报文抓包详解
TCP_IP互联线缆_TCP_UDP报文抓包详解 2.1网线标准直通线交叉线异种设备互联使用直通线同种设备互联使用交叉线 TCP和UDP 端口寻址 TCP数据格式 TCP三次握手 UDP数据格 ...
mysql中文乱码问题
1.mysql客户端在插入中文字符的时候可能出现乱码问题. 原因: 要解决字符集的问题,首先要知道现在的系统.数据库.表.客户端等使用什么样的字符集,以及系统支持什么字符集等. 2.我百度了好多,说 ...

词频统计-------------web版本

词频统计-------------web版本的更多相关文章

随机推荐

热门专题