Perl-统计文本中各个单词出现的次数（NVDIA2019笔试）

1、原题

2、perl脚本

print "================ Method 1=====================\n";

open IN,'<','anna-karenina.txt';

while(<IN>){

        chomp;

        $line = $_;

        $line =~ s/[ \. , ? ! ; : ' " ( ) { }  \[ \]]/ /g; #句号，逗号等统一改为空格

        #print("$line\n");

        @words = split(/\s+/,$line);

        foreach $word (@words){

                $counts{lc($word)}++;  #将出现的单词存入hash表

        }

};

foreach $word (sort keys %counts) {

        print "$word,$counts{$word}\n";  #打印出单词出现的个数

}

close IN;

print "================ Method 2=====================\n";

open IN,'<','anna-karenina.txt';

while (my $line = <IN>)

{

        #map{$words{$_}++;} $line =~ /(\w+)/g   # 与下面的语句等效

        #print($line =~ /(\w+)/g);

        foreach ($line =~ /(\w+)/g){   # 对单词进行匹配

                #print("$_\n");

                $words{lc($_)}++;

        }

}

for (sort keys(%words))

{

    print "$_: $words{$_}\n";

}

3、结果

1）测试文本

All happy families resemble one another; every unhappy family is unhappy in its own way.

All was confusion in the house of Oblonskys. happy? happy: [happy] {happy} "happy" 'happy'

2）输出

================ Method =====================

all,

another,

confusion,

every,

families,

family,

happy,

house,

in,

is,

its,

oblonskys,

of,

one,

own,

resemble,

the,

unhappy,

was,

way,

================ Method =====================

all:

another:

confusion:

every:

families:

family:

happy:

house:

in:

is:

its:

oblonskys:

of:

one:

own:

resemble:

the:

unhappy:

was:

way:

4、涉及的知识点

1）对多个项目进行替换可以使用方括号：

　　$line =~ s/[ \. , ? ! ; : ' " ( ) { } \[ \]]/ /g; #句号，逗号等统一改为空格

2）将单词小写lc，用哈希计数

　　$counts{lc($word)}++; #将出现的单词存入hash表

3）访问哈希整体%，访问哈希键值keys %，排序sort

　　sort keys %counts

4）方法2使用 $line =~ /(\w+)/g 直接将文本中的单词转换成列表

Perl-统计文本中各个单词出现的次数（NVDIA2019笔试）的更多相关文章

python统计文本中每个单词出现的次数
.python统计文本中每个单词出现的次数: #coding=utf-8 __author__ = 'zcg' import collections import os with open('abc. ...
Linux统计文本中某个字符串出现的次数
常用的有如下两种方式: 1.VIM 用vim打开文件,然后输入: :%s/hello//gn 如下图: 图中的例子就是统计文本中"hello"字符串出现的次数说明: %s/pat ...
Python的 counter内置函数，统计文本中的单词数量
counter是 colletions内的一个类可以理解为一个简单的计数 import collections str1=['a','a','b','d'] m=collections.Counte ...
Hadoop 统计文件中某个单词出现的次数
如文件word.txt内容如下: what is you name? my name is zhang san. 要求统计word.txt中出现“is”的次数? 代码如下: PerWordMapper ...
【面试题总结】1、统计字符串中某个单词出现的次数(1-C++实现)
[解决方法一]C++ map解决一.map中的find函数: 用于查找map中是否包含某个关键字条目,传入的参数是要查找的key,最后返回一个迭代器,如果没有找到,则返回的迭代器等于end()返回的 ...
java统计文本中单词出现的个数
package com.java_Test; import java.io.File; import java.util.HashMap; import java.util.Iterator; imp ...
python练习：一行搞定-统计一句话中每个单词出现的个数
一行搞定-统计一句话中每个单词出现的个数 >>> s'i am a boy a bood boy a bad boy' 方式一:>>> dict([(i,s.spl ...
HashMap 统计一个字符串中每个单词出现的次数
HashMap 统计一个字符串中每个单词出现的次数 import java.util.HashMap; import java.util.Map; public class Test { public ...
Python3求英文文档中每个单词出现的次数并排序
[本文出自天外归云的博客园] 题目要求: 1.统计英文文档中每个单词出现的次数. 2.统计结果先按次数降序排序,再按单词首字母降序排序. 3.需要考虑大文件的读取. 我的解法如下: import ch ...

随机推荐

Angular 从入坑到挖坑 - Angular 使用入门
一.Overview angular 入坑记录的笔记第一篇,完成开发环境的搭建,以及如何通过 angular cli 来创建第一个 angular 应用.入坑一个多星期,通过学习官方文档以及手摸手的按 ...
POJ_3627_贪心
题目描述: 给你N个数和一个总和,要求求出最少个数的数相加大于等于这个总和. 思路: 很简单的贪心,先排序,从大到小加一次,比较一次,直到符合条件. 我用了优先队列,运行时间好像多了一倍= = #in ...
Codeforces_711_A
http://codeforces.com/problemset/problem/711/A 忙了一天没做题,做到水题,我这水平也只能做水题了= = ! #include<iostream> ...
WeChall_Enlightment (Encoding)
解题: 刚开始一看这题就蒙逼了,完全没思路,过了几天后再仔细去想想,应该是二进制的ascii码,但是原来的三张图虽然都是8的倍数,但完全转换不成有用的东西,题目的意思能否找到光,百度了一下关于三原色的 ...
Codeforces 1087B Div Times Mod(数学+暴力)
题意: 求(x div k) * (x mod k) = n的最小解x,保证有解 1<=n<=1e6, k<=1000,1s 思路: 注意到k的范围是1e3, 1<=x mod ...
Markdown编写接口文档模版
接口名称 1) 请求地址 https://apis.cnblogs.com/user/info?a=xx&b=xx 2) 调用方式:HTTP GET 3) 接口描述: 接口描述详情 4) 请求 ...
php 安装 event 和 libevent 扩展
这里使用的是php7.0.24 ,php是yum安装的一.安装event扩展用yum无法安装event扩展手动安装 php 必须要开启 sockets 功能,需要安装php的socket扩展,才 ...
Apache 安装静态编译动态编译
2014-09-19 09:53 (分类:Linux) 排名第一的web服务器. (linux环境:CentOS release 6.5 (Final)) 安装出错:如下 configure: err ...
JMeter-命令行模式压测
前言使用非GUI模式,即命令行模式运行jmeter测试脚本能够大大缩减系统资源,今天跟小伙伴们讲一下JMeter如何在命令行模式进行压测吧! 一:配置好JDK和JMeter的环境变量(过程略) 二: ...
getElementsByTagName得到的对象
今天练习使用DOM创建html元素,想通过getElementsByTagName("body")获得body对象,然后建立和新创建的元素的关系,如下图: 其实,getElemen ...

Perl-统计文本中各个单词出现的次数（NVDIA2019笔试）

Perl-统计文本中各个单词出现的次数（NVDIA2019笔试）的更多相关文章

随机推荐

热门专题