#!/usr/bin/env perl

# Copyright 2018 Jarvan Wang

if (@ARGV != 1) {

#print STDERR "Usage: keyword_summarize.pl text utt2dur\n";

print STDERR "Usage: keyword_summarize.pl <data>\n";

exit(1);

}

my $text_file="$ARGV[0]/text";

my $utt2dur_file="$ARGV[0]/utt2dur";

unless(-e $text_file && -e $utt2dur_file )

{

print STDERR "$text_file or $utt2dur_file does not exist!";

exit(1);

}

my %text_hash;

my %dur_hash;

my %sumdur_hash;

my %count_hash;

# read text

open(TEXT,$text_file);

while(<TEXT>){

my $temp=$_;

chomp $temp;

@line=split(/ /,$temp,2);

$text_hash{$line[0]}=$line[1];

}

# read utt2dur

open(DUR,$utt2dur_file);

while(<DUR>){

my $temp=$_;

chomp $temp;

@line=split(/ /,$temp,2);

$dur_hash{$line[0]}=$line[1];

}

# summarize text duration

for my $key (keys %text_hash)

{

$sumdur_hash{$text_hash{$key}}+=$dur_hash{$key};

$count_hash{$text_hash{$key}}+=1;

}

#for my $key (sort keys %sumdur_hash) {

#printf("文本@语句数@秒@小时\n");

printf("文本@语句数@小时\n");

my $count_sum,$sec_sum,$hour_sum;

foreach my $key (sort { $sumdur_hash{$a} <=> $sumdur_hash{$b} or $a cmp $b } keys %sumdur_hash)

{

my $value=sprintf("%.2f",$sumdur_hash{$key});

$count_sum+=$count_hash{$key};

$sec_sum+=$value;

$hour_sum+=$value/3600;

if($value>1000)

{

#printf("%s@%d@%.2f@%.2f\n",$key,$count_hash{$key},$value,$value/3600);

printf("%s@%d@%.2f\n",$key,$count_hash{$key},$value/3600);

}

}

#printf("总和@%d@%.2f@%.2f\n",$count_sum,$sec_sum,$hour_sum);

printf("总和@%d@%.2f\n",$count_sum,$hour_sum);

 

data_summarize.pl data目录文本时长汇总脚本的更多相关文章

  1. web自动化时,sendkeys输入长文本时浏览器响应慢或错误时处理

    在做某个测试时,要在文本框中输入大量的文本,文件内容如下: "-----BEGIN CERTIFICATE-----\nMIIBozCCAQwCAQEwDQYJKoZIhvcNAQEFBQA ...

  2. 解决真机调试时Eclipse DDMS上打不开/data目录的问题

    一般真机调试时DDMS里面的File Explorer是不能打开/data 目录的,不过也很容易解决. 1.首先手机要root.这个很简单,网上一大堆资料和软件. 2.仅仅root之后还不行,下载一个 ...

  3. vba根据部门分别汇总不同部门下的人员不同培训内容的时长总计,多条件求和

    Option Explicit Sub yy() Dim d, arr, s$, i&, m&, w$ Set d = CreateObject("Scripting.Dic ...

  4. JS的video获取时长,出现问题汇总

    <video id="my_video_1" controls="controls" style=" width: 700px; height: ...

  5. js读写Cookie问题(Cookie存储时长、Cookie存储域)汇总

    在采集网站用户行为数据/使用js对用户行为做交互时,经常会使用到Cookie,了解Js Cookie的读写,以及一些细节,非常重要.   什么是Cookie 所谓Cookie,只是一条极为短小的信息, ...

  6. docker部署postgresql时,data目录不生效的问题探究

    今天用docker部署postgresql,用的是官方的镜像.结果挂载完 /var/lib/postgresql/data目录后,和容器里的目录其实并没有挂载成功. 母机上的目录并没有成功挂载到容器里 ...

  7. 使用mediainfo工具统计每个视频文件(媒体文件)播放时长

    需求 1.运营那边需要统计大量视频文件的播放时长,并汇总记录到excel表中,问我有什么方法搞定 这边搜索了很多统计媒体文件时长的,主要有以下几种 1.使用java获取 2.使用python获取 3. ...

  8. 获取音、视频时长(NAudio,Shell32,FFmpeg)

    参考网址:https://blog.csdn.net/u013810234/article/details/57471780 以下为本次测试用到的音.视频格式: audio :”.wav;.mp3;. ...

  9. Android开发 获取视频中的信息(例如预览图或视频时长) MediaMetadataRetriever媒体元数据检索器

    前言 在Android里获取视频的信息主要依靠MediaMetadataRetriever实现 获取最佳视频预览图 所谓的最佳就是MediaMetadataRetriever自己计算的 /** * 获 ...

随机推荐

  1. Python基础之字典

    字典初识 字典的认识 首先,我们来认识一下字典: # 定义一个字典 user_dict = {"name": "zhangsan", "age&quo ...

  2. koa-ueditor上传图片到七牛

    问题描述:服务器系统架构采用的是koa(并非koa2),客户端富文本编辑器采用的是百度的ueditor控件.现在需要ueditor支持将图片直接上传到七牛云. 前提:百度的ueditor需要在本地配置 ...

  3. redis 安装时候遇到 jemalloc 问题记录

    https://www.cnblogs.com/lovemdx/p/3199886.html https://blog.csdn.net/yfkiss/article/details/7035579 ...

  4. Python爬虫爬取网页图片

    没想到python是如此强大,令人着迷,以前看见图片总是一张一张复制粘贴,现在好了,学会python就可以用程序将一张张图片,保存下来. 今天逛贴吧看见好多美图,可是图片有点多,不想一张一张地复制粘贴 ...

  5. Command "python setup.py egg_info" failed with error code 1 in C:\Users\w5659\AppData\Local\Temp\pip-install-t7uomu4r\xa dmin\

    Error msg: C:\Users\w5659>pip install xadmin Collecting xadmin Using cached https://files.pythonh ...

  6. 求导程序编写(oo-java编程)

    本单元的任务为求导. 即将一个含自变量x的多项式F求导成为另外一个含自变量x的多项式f.使得 dF/dx = f 为降低我们的难度,这个任务被分解成了三个阶段: (1)对幂函数进行求导(不允许嵌套) ...

  7. Photoshop给草坡上的人物加上大气的霞光

    <点小图查看大图> 最终效果 1.打开原图素材大图,创建可选颜色调整图层,对红色.黄色.黑色进行调整,参数设置如图1 - 3,效果如图4.这一步减少图片中的红色,并给暗部增加蓝色. < ...

  8. [代码]解析nodejs的require,吃豆人的故事

    最近在项目中需要对nodejs的require关键字做解析,并且替换require里的路径.一开始我希望nodejs既然作为脚本语言,内核提供一个官方的parser库应该是一个稳定可靠又灵活的渠道,然 ...

  9. beanshell断言模版

    if("${createTime_1}".equals("${createTime_2}")){ Failure = false; FailureMessage ...

  10. React Native & app demos

    React Native & app demos https://github.com/ReactNativeNews/React-Native-Apps https://github.com ...