准备

书名数据库的阵列表示

关键字

algebra

application

elementary

linear

matrix

theory

table { margin: auto }

B1. Applied Linear Algebra
B2. Elementary Linear Algebra
B3. Elementary Linear Algebra with Applications
B4. Linear Algebra and Its Applications
B5. Linear Algebra with Applications
B6. Matrix Algebra with Applications
B7. Matrix Theory

编写代码

原本是准备了500本txt小说作为数据库书目的，如果这样就得自己在确定关键词，和把这500本小说名通过关键词组成一个数据库阵列，而且对于中文来说，还得考虑编码问题和文件操作问题，真要这样，从我个人能力来估计，费老大功夫还不一定实现，所以干脆简单点，直接照着线代书上的阵列抄了^_。

关键词库

unsigned char *key_database[]={

    "algebra",\

    "application",\

    "elementary",\

    "linear",\

    "matrix",\

    "theory"

};

书目库

unsigned char B1[]="Applied Linear Algebra";

unsigned char B2[]="Elementary Linear Algebra";

unsigned char B3[]="Elementary Linear Algebra with Applications";

unsigned char B4[]="Linear Algebra and Its Applications";

unsigned char B5[]="Linear Algebra with Applications";

unsigned char B6[]="Matrix Algebra with Applications";

unsigned char B7[]="Matrix Theory";

unsigned char *book_database[]={B1,B2,B3,B4,B5,B6,B7};

数据库阵列

unsigned char database_matrix[7][6]={\

    1,1,0,1,0,0,\

    1,0,1,1,0,0,\

    1,1,1,1,0,0,\

    1,1,0,1,0,0,\

    1,1,0,1,0,0,\

    1,1,0,0,1,0,\

    0,0,0,0,1,1

};

要做这个实验之前，首先得确定数据库阵列，行代表书名中包含的关键词的向量，1表示包含，0表示不包含。而我们要做的就是把搜索向量与行向量比较，并且统计出现关键词的次数，然后包含次数多的书靠前显示。

main.c

#include <stdio.h>

#include <stdlib.h>

#include "init_db.h"      //初始化数据库头文件

#include <string.h>

#define CASE_SENSITIVE 0   //区分大小写

#define CASE_INSENSITIVE 1 //不区分大小写

void str_all_lowercase(unsigned char *str);//字符串小写化函数

char str_cmp_sensitive(unsigned char str1[],unsigned char str2[],unsigned char options);//可选区分比较字符串函数

void keywords_to_vector(char argc,char *argv[],unsigned char *key_vector);//关键词转搜索向量函数

void search_database(unsigned char key_vector[],unsigned char res_vector[]);//搜索数据库函数

void sort_search_res(unsigned char res_vector[],unsigned char sort_res_vector[]);//排列搜索结果函数

void main(int argc,char *argv[]){//参数：搜索关键词

    char book_count=0,i,j;

    unsigned char key_vector[KEYWORD_NUM]={0};//关键词向量->搜索向量

    unsigned char res_vector[BOOK_NUM]={0};//结果向量

    unsigned char sort_res_vector[BOOK_NUM]={0};//排序的位置向量

    if(argc>=2){

        keywords_to_vector(argc,argv,key_vector);//获取搜索向量

        search_database(key_vector,res_vector);//得到结果向量

        for(i=0;i<BOOK_NUM;i++) sort_res_vector[i]=i;//生成位置向量

        sort_search_res(res_vector,sort_res_vector);//对结果向量进行排序，使得符合搜索的书名靠前

        for(i=0;i<BOOK_NUM;i++){

            if(res_vector[i]!=0){

                book_count++;

                printf("book%d:%s---%d\n",i+1,book_database[sort_res_vector[i]],res_vector[i]);

            }

        }

        printf("%d books found in total\n",book_count);

    }

    else{

        printf("no arguments\n");

    }

}

关键词转搜索向量函数

void keywords_to_vector(char argc,char *argv[],unsigned char *key_vector){

    char *tmp,i,j;

    for(i=1;i<argc;i++){

        tmp=argv[i];

        for(j=0;j<KEYWORD_NUM;j++){

            key_vector[j]=((0==str_cmp_sensitive(tmp,key_database[j],1))?1:key_vector[j]);

        }

    }

}

搜索数据库函数

void search_database(unsigned char key_vector[],unsigned char res_vector[]){

    unsigned char i,j;

    unsigned char *tmp;

    for(i=0;i<BOOK_NUM;i++){

        tmp=database_matrix[i];

        for(j=0;j<KEYWORD_NUM;j++){

            res_vector[i]+=((tmp[j]==key_vector[j])?tmp[j]:0);

        }

    }

}

排列搜索结果函数

void sort_search_res(unsigned char res_vector[],unsigned char sort_res_vector[]){

    unsigned char i,j,tmp;

    for(i=0;i<BOOK_NUM;i++){

        for(j=BOOK_NUM-1;j>i;j--){

            if(res_vector[j]>res_vector[j-1]){

                tmp=res_vector[j-1];

                res_vector[j-1]=res_vector[j];

                res_vector[j]=tmp;

                tmp=sort_res_vector[j-1];

                sort_res_vector[j-1]=sort_res_vector[j];

                sort_res_vector[j]=tmp;

            }

        }

    }

}

调试过程

低级错误

在函数str_all_lowercase中有两处低级错误一个是数组的位移变量i没有做++操作导致死循环在那里，然后在判断是否大写的时候用的是逻辑或||运算，而正确的是逻辑与&&运算。
逻辑错误

在函数keywords_to_vector中的

key_vector[j]=((0==str_cmp_sensitive(tmp,key_database[j],1))?1:key_vector[j]); 这里

原本我是这样写的

key_vector[j]=((0==str_cmp_sensitive(tmp,key_database[j],1))?1:0;

这就导致把我每一次对比关键词的时候都会破坏上一次比较的结果，所以把0改为key_vector[j]后就可以保持上一次结果不变。

在函数search_database中的

res_vector[i]+=((tmp[j]==key_vector[j])?tmp[j]:0);

原本我是这样写的

res_vector[i]+=((tmp[j]==key_vector[j])?1:0);

这就导致只要我的搜索向量和数据库阵列比较结果一致时就会在结果向量上加一，这就导致同为0时，即书名不包含的关键词，同时搜索向量也不包含时，结果向量还要加1，所以最后把1改为tmp[j]，即可当同时不包含关键词时结果向量加的是0。

运行结果

小结

其实这样的实验老早就想要做了，我说这样的实验是指，把数学应用通过编程的手段来表达的实验，或者更深一层次，我想用编程来学习数学，像是线代，微积分这些。老实说，我数学真的是垃圾，匆匆20+年，感觉连门把手都够不着，很急，非常急，急出心理变态了，急出生理病变了，老子tmd什么时候能进入数学的殿堂，什么时候能tmd玩弄数学于股掌之间，tmd什么时候能会应用数学啊，啊啊啊。我现在只能另辟蹊径，寻找一些应用的机会，除了这样，我无计可施，因为我无法面对深奥的书本，无法面对难懂的公式，更无法面对乱入的定理和结论。我也想造原子弹，我也想玩加速器，我也tmd想搞量子力学和人工智能，还tmd想如果给关二爷上香有用的话，那我铁定天天给毕达哥拉斯磕头，我甚至还tmd想长生不老，能让我等到打一针就能智商300的药，梦一场就能贯通古今的觉，如果有人做这样的实验，请立即叫上我，我也这能通过这种方式了，真卑微啊，这样一想我还真是一个彻彻底底的，真真切切的变态啊，哎，艹了，就当是一个渣人的本愿吧。

简单的关键词查找实验（基于C语言）的更多相关文章

实验报告系列：实验一 HTML语言的简单网页制作
实验一 HTML语言的简单网页制作一.实验目的: 1．掌握常用的HTML语言标记: 2．利用文本编辑器建立HTML文档,制作简单网页. 3．学习将其它格式的文档转换成HTML格式的文档二.实验内容 ...
Kcptun 是一个非常简单和快速的，基于KCP 协议的UDP 隧道，它可以将TCP 流转换为KCP+UDP 流
本博客曾经发布了通过 Finalspeed 加速 Shadowsocks 的教程,大家普遍反映能达到一个非常不错的速度.Finalspeed 虽好,就是内存占用稍高,不适合服务器内存本来就小的用户:而 ...
selenium2自动化测试实战--基于Python语言
自动化测试基础一. 软件测试分类 1.1 根据项目流程阶段划分软件测试 1.1.1 单元测试单元测试(或模块测试)是对程序中的单个子程序或具有独立功能的代码段进行测试的过程. 1.1.2 集成测试 ...
关于《selenium2自动测试实战--基于Python语言》
关于本书的类型: 首先在我看来技术书分为两类,一类是“思想”,一类是“操作手册”. 对于思想类的书,一般作者有很多年经验积累,这类书需要细读与品位.高手读了会深有体会,豁然开朗.新手读了不止所云,甚至 ...
Gogs - 基于 Go 语言的自助 Git 服务
Gogs(Go Git Service) 是一个基于 Go 语言的自助 Git 服务.Gogs 的目标是打造一个最简单.最快速和最轻松的方式搭建自助 Git 服务.使用 Go 语言开发使得 Gogs ...
Ggoogle Protocol Buffer的使用 (基于C++语言)
首先说明的是Protocol Buffle是灵活高效的.它的一个很好的优点(很重要的,我认为)就是后向兼容性--当我们扩展了了.proto文件后,我们照样可以用它来读取之前生成的文件. 之前已经写了关 ...
基于python语言的tensorflow的‘端到端’的字符型验证码识别源码整理(github源码分享)
基于python语言的tensorflow的‘端到端’的字符型验证码识别 1 Abstract 验证码(CAPTCHA)的诞生本身是为了自动区分自然人和机器人的一套公开方法, 但是近几年的 ...
基于R语言的时间序列指数模型
时间序列: (或称动态数列)是指将同一统计指标的数值按其发生的时间先后顺序排列而成的数列.时间序列分析的主要目的是根据已有的历史数据对未来进行预测.(百度百科) 主要考虑的因素: 1.长期趋势(Lon ...
JFinal -基于Java 语言的MVC极速 web 开发框架
JFinal概述 JFinal 是基于Java 语言的极速 web 开发框架,其核心设计目标是开发迅速.代码量少.学习简单.功能强大.轻量级.易扩展.Restful.在拥有Java语言所有优势的同时再 ...
基于VB语言对SolidWorks参数化设计的二次开发
0 引言随着数字信息化进程的快速推进,如今三维CAD技术在越来越多的企业当中得到运用.为了降低在设计生产中的成本,缩短设计周期,增强企业竞争力,三维参数化技术随之应声,它凭借更贴近现代概念的设计以及 ...

随机推荐

基于APIView&ModelSerializer写接口
目录基于APIView&ModelSerializer写接口一.首先准备前提工作 1.模型代码 2.路由代码 3.视图代码二.继承Serializer序列化定制字段的三种方法 1.通过s ...
MongoDB Compass的安装及使用图文说明（非常详细）
1.下载 MongoDB Compass 预编译二进制包下载地址:https://www.mongodb.com/try/download/compass 2.安装 MongoDB Compass 的 ...
合肥光源纵向震荡数据源相关PV
中控室束测界面上加上了BCM部分,看下面截图,可以发现里面的两张二维图像内容还是蛮丰富的,我想其数据很值得大家研究研究,现把相关PV公布给大家,感兴趣的可以通过这两幅图的数据计算出更多的物理量,比如每 ...
软件设计师考试备考之UML
UML 统一建模语言是面向对象软件的标准化建模语言. 事务结构事务 UML模型中的名称,它们通常是模型的静态部分,描述概念或物理元素图形表示: 行为事务 UML模型中的动态部分.它们是模型中的动词 ...
JumpServer(v2.28.6) 堡垒机常见问题
JumpServer 各组件查询日志方法 # 默认持久化目录 /data/jumpserver ls -al /data/jumpserver/core/logs ls -al /data/jumps ...
ArcGIS Pro SDK 003 如何调用Toolbox
1.如何调用普通的Tool ArcGIS中的Toolbox非常强大,做二次开发的时候,必不可少的会调用,在ArcObjects SDK中,每个Tool都会有自定义的类对应,例如栅格转矢量数据,定义在E ...
P6329 【模板】点分树 | 震波
\(\text{Solution}\) 点分树就是将点分治过程中的重心连成一棵虚树对点分树子树信息的记录,就是点分治处理每个重心时需要的信息这样就可以留下点分治的过程,支持多次修改和查询点分树树 ...
使用IDM从Google 云端硬盘链接上下载超大文件
1.将原始文件以快捷方式存放到自己的网盘中. 2.进入自己的网盘,找到存放好的目标文件快捷方式,点击右键,选择下载. 3.如果电脑上IDM且浏览器装有IDM插件,会弹出下载框,点击下载即可. 4.然后 ...
log 函数
什么是对数对数用 log 符号来表示.根据底数的不同,log 可以变换成 lg.ln.lg 是以 10 为底的对数,ln 是以 e 为底的对数. logax=y,是一个以 a 为底,x 为真数的对数 ...
PostgreSQL大表count方法总结及优化探讨
PostgreSQL的MVCC是直接在原表通过增加新tuple来实现的,决定了它在大结果集count的时候性能不会太理想,因为需要对大结果集做可见性判断将会是一项繁重的工作,比如下面这种SQL: se ...

简单的关键词查找实验（基于C语言）

准备

编写代码

调试过程

运行结果

小结

简单的关键词查找实验（基于C语言）的更多相关文章

随机推荐

热门专题