C题是这样子的:

  给定一个英语字典,找出其中的所有变位词集合。例如,“pots”、“stop”和“tops”互为变位词,因为每一个单词都可以通过改变其他单词中字母的顺序来得到。

  下段分析摘自该书(P16):

  解决这个问题的许多方法都出奇地低效和复杂。任何一种考虑单词中所有字母的排列的方法都注定了要失败。单词“cholecystoduodenostomy”有22!种排列,少量的乘法运算表明22!约等于1.124*10^21。即使假设以闪电一样的速度百亿分之一秒执行一种排列,这也要消耗1.1*10^9秒。经验法则“pi秒就是一个纳世纪”(见7.1节)指出1.1*10^9秒是数十年。而比较所有单词对的任何方法在我的机器上运行至少要花费一整夜的时间——在我使用的字典里大约230 000个单词,而即使是一个简单的变位词比较也将至少1微秒的时间,因此,总时间估算起来就是:

  230 000单词 * 230 000比较/单词 * 1微秒/比较 = 52 900*10^6微秒=52 900秒,约等于14.7小时。

  对于该问题,上述的方法很明显不可采取的,那有什么更好的方法吗?

  作者在书中提到了一个更为高效的算法:基于排序的标识。这种方法是对单词内的字母进行排序,从而使得同一个变位词类中的单词具有标准型。

  这种方法的核心就在于,对于每一个输入的单词,我们都会对其单词内的字母进行排序,使得其具有一个标准型。如pots,排完序后就是opst。另外,stop、tops的标准型也都是opst,因此可以将这三个单词归类到标准型opst下。适宜实现这种数据结构的是map类型,即关键字“标准型”对应着一堆有相同标准型的单词。至于单词内排序,直接借助sort函数即可。

  下边我个人实现的程序,与作者提供的程序不一样(主要是采用的数据结构不一样):

 #include<iostream>
#include <string>
#include <algorithm>
#include <fstream>
#include <map>
#include <vector>
using namespace std; int main()
{
ifstream rfile("words.txt", ios::in);
if (!rfile)
{
cout << "The file can not be opened!" << endl;
exit();
} // core session
string line;
map<string, vector<string> > seqWords;
while (getline(rfile, line))
{
string tempStr = line;
sort(line.begin(), line.end()); map<string, vector<string> >::iterator itr = seqWords.find(line);
if (itr == seqWords.end())
{
vector<string> tmpVec;
tmpVec.push_back(tempStr);
seqWords.insert(pair<string, vector<string> >(line, tmpVec));
}
else
{
seqWords[line].push_back(tempStr);
}
} // print all the elments in seqWords
cout << "************************************************" << endl;
map<string, vector<string> >::iterator itrMap = seqWords.begin();
for (; itrMap != seqWords.end(); itrMap++)
{
cout << itrMap->first << ": " << endl;
vector<string> tempVec = itrMap->second;
vector<string>::iterator itrVec = tempVec.begin();
for (; itrVec != tempVec.end(); itrVec++)
{
cout << *itrVec << " ";
}
cout << endl << endl;
}
cout << "************************************************" << endl; return ;
}

  程序输入文件words.txt为:

 pans
pots
opt
snap
stop
tops

  程序输出如下:

  

“《编程珠玑》(第2版)第2章”:C题(查找变位词,排序)的更多相关文章

  1. 《编程珠玑(第2版)》【PDF】下载

    <编程珠玑(第2版)>[PDF]下载链接: https://u253469.pipipan.com/fs/253469-230382225 内容简介 书的内容围绕程序设计人员面对的一系列实 ...

  2. java编程思想第四版第十一章习题

    第一题 package net.mindview.holding.test1; import java.util.ArrayList; import java.util.List; /** * 沙鼠 ...

  3. java编程思想第四版第六章总结

    1. 代码重构 为什么f要代码重构 第一次代码不一定是完美的, 总会发现更优雅的写法. 代码重构需要考虑的问题 类库的修改不会破坏客户端程序员的代码. 源程序方便扩展和优化 2. 包 创建一个独一无二 ...

  4. Java编程思想第四版*第七章*个人练习

    欢迎加群:239063848 成团的笔记:该组仅用于技术共享和交流,问题和答案公布 潘基聊天.禁止广告.禁止招聘-- 练习1:(2)创建一个简单的类.第二个类中,将一个引用定义为第一个类的对象.运用惰 ...

  5. java编程思想第四版第五章习题

    创建一个类, 它包含一个未初始化的String引用.验证该引用被Java初始化成了null package net.mindview.initialization; public class Test ...

  6. java编程思想第四版第六章习题

    (略) (略) 创建两个包:debug和debugoff,他们都包含一个相同的类,该类有一个debug()方法,第一个版本显示发送给控制台的String参数,而第二版本什么也不做,使用静态import ...

  7. java编程思想 第四版 第六章 个人练习

    欢迎加群:239063848 进群须知:本群仅用于技术分享与交流.问题公布与解答 禁止闲聊.非诚勿扰 练习1:(1)在某个包中创建一个类,在这个类所处的包的外部创建该类的一个实例. import mi ...

  8. java编程思想第四版第9章

    练习3: public class MainTest { public static void main(String args[]){ Bcycle b=new Bcycle(); b.print( ...

  9. Java编程思想第四版 *第五章 个人练习

    练习3:(1)创建一个带默认构造器(即无參构造器)的类.在构造器中打印一条消息.为这个类创建一个对象.P116 public class Test{ public Test(){ System.out ...

随机推荐

  1. CCSpriteBatchNode中存放元素的一点理解

    该对象只能包含基于CCSprite的对象,并且该要求适用于一切子孙对象.即加入CCSpriteBatchNode的任何对象都必须是CCSprite或其子类. 比如CCSpriteBatchNode包含 ...

  2. C/C++的mem函数和strcpy函数的区别和应用

    mem系列函数是面试的时候常考的知识点,我们需要熟练掌握这三个函数的原理和代码实现,要能准确无误的写出代码. memcpy.memset和memset三个函数在使用过程中,均需包含以下头文件: //在 ...

  3. 【移动开发】SparseArray替代HashMap

    SparseArray是android里为<Interger,Object>这样的Hashmap而专门写的class,目的是提高效率,其核心是折半查找函数(binarySearch). p ...

  4. Java基础---Java---正则表达式-----匹配、切割、替换、获取等方法

    正则表达式:符合一定规则的表达式 作用:用于专门操作字符串 特点:用于一些特定的符号来表示一些代码操作,这样就简化书写,主要是学习一些特殊符号的使用 好处:可以简化对字符串的复杂操作. 弊端:符号定义 ...

  5. Servlet3.0注解@WebInitParam和@WebServlet

    在以前的servlet中我们初始化一些参数都是配置在web.xml中的,自从servlet3.0之后给我们提供了注解@WebServlet和@WebInitParam,@WebServlet是用来配置 ...

  6. 安卓AsyncTack详解

    我们知道安卓中的UI线程不是线程安全的,即不能在UI线程中进行耗时操作,所以我们通常的做法是开启一个子线程来进行耗时操作,然后将处理后的结果运用Handler机制传递给UI线程,在UI线程中根据处理后 ...

  7. UNIX网络编程——使用select 实现套接字I/O超时

    下面程序包含read_timeout.write_timeout.accept_timeout.connect_timeout 四个函数封装: /* read_timeout - 读超时检测函数,不含 ...

  8. iOS中崩溃调试的使用和技巧总结 韩俊强的博客

    每日更新关注:http://weibo.com/hanjunqiang  新浪微博 在iOS开发调试过程中以及上线之后,程序经常会出现崩溃的问题.简单的崩溃还好说,复杂的崩溃就需要我们通过解析Cras ...

  9. python类:magic魔术方法

    http://blog.csdn.net/pipisorry/article/details/50708812 魔术方法是面向对象Python语言中的一切.它们是你可以自定义并添加"魔法&q ...

  10. MySQL 数据库开发的 36 条军规

    MySQL 数据库开发的 36 条军规 写在前面的话: 总是在灾难发生后,才想起容灾的重要性: 总是在吃过亏后,才记得曾经有人提醒过. (一)核心军规 (1)不在数据库做运算:cpu计算务必移至业务层 ...