“《编程珠玑》(第2版)第2章”:C题(查找变位词,排序)
C题是这样子的:
给定一个英语字典,找出其中的所有变位词集合。例如,“pots”、“stop”和“tops”互为变位词,因为每一个单词都可以通过改变其他单词中字母的顺序来得到。
下段分析摘自该书(P16):
解决这个问题的许多方法都出奇地低效和复杂。任何一种考虑单词中所有字母的排列的方法都注定了要失败。单词“cholecystoduodenostomy”有22!种排列,少量的乘法运算表明22!约等于1.124*10^21。即使假设以闪电一样的速度百亿分之一秒执行一种排列,这也要消耗1.1*10^9秒。经验法则“pi秒就是一个纳世纪”(见7.1节)指出1.1*10^9秒是数十年。而比较所有单词对的任何方法在我的机器上运行至少要花费一整夜的时间——在我使用的字典里大约230 000个单词,而即使是一个简单的变位词比较也将至少1微秒的时间,因此,总时间估算起来就是:
230 000单词 * 230 000比较/单词 * 1微秒/比较 = 52 900*10^6微秒=52 900秒,约等于14.7小时。
对于该问题,上述的方法很明显不可采取的,那有什么更好的方法吗?
作者在书中提到了一个更为高效的算法:基于排序的标识。这种方法是对单词内的字母进行排序,从而使得同一个变位词类中的单词具有标准型。
这种方法的核心就在于,对于每一个输入的单词,我们都会对其单词内的字母进行排序,使得其具有一个标准型。如pots,排完序后就是opst。另外,stop、tops的标准型也都是opst,因此可以将这三个单词归类到标准型opst下。适宜实现这种数据结构的是map类型,即关键字“标准型”对应着一堆有相同标准型的单词。至于单词内排序,直接借助sort函数即可。
下边我个人实现的程序,与作者提供的程序不一样(主要是采用的数据结构不一样):
#include<iostream>
#include <string>
#include <algorithm>
#include <fstream>
#include <map>
#include <vector>
using namespace std; int main()
{
ifstream rfile("words.txt", ios::in);
if (!rfile)
{
cout << "The file can not be opened!" << endl;
exit();
} // core session
string line;
map<string, vector<string> > seqWords;
while (getline(rfile, line))
{
string tempStr = line;
sort(line.begin(), line.end()); map<string, vector<string> >::iterator itr = seqWords.find(line);
if (itr == seqWords.end())
{
vector<string> tmpVec;
tmpVec.push_back(tempStr);
seqWords.insert(pair<string, vector<string> >(line, tmpVec));
}
else
{
seqWords[line].push_back(tempStr);
}
} // print all the elments in seqWords
cout << "************************************************" << endl;
map<string, vector<string> >::iterator itrMap = seqWords.begin();
for (; itrMap != seqWords.end(); itrMap++)
{
cout << itrMap->first << ": " << endl;
vector<string> tempVec = itrMap->second;
vector<string>::iterator itrVec = tempVec.begin();
for (; itrVec != tempVec.end(); itrVec++)
{
cout << *itrVec << " ";
}
cout << endl << endl;
}
cout << "************************************************" << endl; return ;
}
程序输入文件words.txt为:
pans
pots
opt
snap
stop
tops
程序输出如下:

“《编程珠玑》(第2版)第2章”:C题(查找变位词,排序)的更多相关文章
- 《编程珠玑(第2版)》【PDF】下载
<编程珠玑(第2版)>[PDF]下载链接: https://u253469.pipipan.com/fs/253469-230382225 内容简介 书的内容围绕程序设计人员面对的一系列实 ...
- java编程思想第四版第十一章习题
第一题 package net.mindview.holding.test1; import java.util.ArrayList; import java.util.List; /** * 沙鼠 ...
- java编程思想第四版第六章总结
1. 代码重构 为什么f要代码重构 第一次代码不一定是完美的, 总会发现更优雅的写法. 代码重构需要考虑的问题 类库的修改不会破坏客户端程序员的代码. 源程序方便扩展和优化 2. 包 创建一个独一无二 ...
- Java编程思想第四版*第七章*个人练习
欢迎加群:239063848 成团的笔记:该组仅用于技术共享和交流,问题和答案公布 潘基聊天.禁止广告.禁止招聘-- 练习1:(2)创建一个简单的类.第二个类中,将一个引用定义为第一个类的对象.运用惰 ...
- java编程思想第四版第五章习题
创建一个类, 它包含一个未初始化的String引用.验证该引用被Java初始化成了null package net.mindview.initialization; public class Test ...
- java编程思想第四版第六章习题
(略) (略) 创建两个包:debug和debugoff,他们都包含一个相同的类,该类有一个debug()方法,第一个版本显示发送给控制台的String参数,而第二版本什么也不做,使用静态import ...
- java编程思想 第四版 第六章 个人练习
欢迎加群:239063848 进群须知:本群仅用于技术分享与交流.问题公布与解答 禁止闲聊.非诚勿扰 练习1:(1)在某个包中创建一个类,在这个类所处的包的外部创建该类的一个实例. import mi ...
- java编程思想第四版第9章
练习3: public class MainTest { public static void main(String args[]){ Bcycle b=new Bcycle(); b.print( ...
- Java编程思想第四版 *第五章 个人练习
练习3:(1)创建一个带默认构造器(即无參构造器)的类.在构造器中打印一条消息.为这个类创建一个对象.P116 public class Test{ public Test(){ System.out ...
随机推荐
- android studio的快捷键设置的和eclispe一样
最近安装了android studio,但是习惯了使用eclispe的快捷键,所以我也把android studio的快捷键设置的和eclipse一样. 具体如下: 1.快捷键 Android Stu ...
- Android Multimedia框架总结(十二)CodeC部分之OMXCodec与OMX事件回调流程
转载请把头部出处链接和尾部二维码一起转载,本文出自逆流的鱼yuiop:http://blog.csdn.net/hejjunlin/article/details/52629449 前言:上篇文中分析 ...
- 剑指offer面试题6 重建二叉树(java)
注:(1)java中树的构建 (2)构建子树时可以直接利用Arrays.copyOfRange(preorder, from, to),这个方法是左开右闭的 package com.xsf.SordF ...
- Android系统剪切板
Android系统剪贴板 复制字符串到系统剪切板 /** * 复制文本到剪切板 * * @param text * @return */ @SuppressWarnings("depreca ...
- MacOS的菜单状态栏App添加饼型进度
猴子原创,欢迎转载.转载请注明: 转载自Cocos2Der-CSDN,谢谢! 原文地址: http://blog.csdn.net/cocos2der/article/details/52075418 ...
- 学习TensorFlow,多层卷积神经网络
一.网络结构 二.代码 from tensorflow.examples.tutorials.mnist import input_data mnist = input_data.read_data_ ...
- Java-IO之BufferedOutputStream(缓冲输出流)
BufferedOutputStream是缓冲输出流,继承于FilterOutputStream,作用是为另外一个输出流提供换从功能. 主要函数列表: BufferedOutputStream(Out ...
- JAVA DOM4j解析XML数据到自定义javabean
我们获取xml中的数据,一般以面向对象的思想去处理这些数据.因此,我们需要自定义类来封装解析出来的数据,以方便我们操作这些数据. 自定义的java类,称为javabean. 自定义Contact类代码 ...
- Android官方网站
http://wear.techbrood.com/sdk/installing/index.html?pkg=tools
- [Ext.Net]TreePanel+gridPanel实例
@小花要完整例子,尝试一下图文并茂,力求完整. gridPanel TreePanel.JPG (27.49 KB, 下载次数: 16) 下载附件 保存到相册 2013-1-6 11:24 上 ...