poj2778 DNA Sequence(AC自动机+矩阵快速幂）

Description

It's well known that DNA Sequence is a sequence only contains A, C, T and G, and it's very useful to analyze a segment of DNA Sequence，For example, if a animal's DNA sequence contains segment ATC then it may mean that the animal may have a genetic disease.
Until now scientists have found several those segments, the problem is how many kinds of DNA sequences of a species don't contain those segments.

Suppose that DNA sequences of a species is a sequence that consist of A, C, T and G，and the length of sequences is a given integer n.

Input

First line contains two integer m (0 <= m <= 10), n (1 <= n <=2000000000). Here, m is the number of genetic disease segment, and n is the length of sequences.

Next m lines each line contain a DNA genetic disease segment, and length of these segments is not larger than 10.

Output

An integer, the number of DNA sequences, mod 100000.

Sample Input

4 3

AT

AC

AG

AA

Sample Output

题意：给你m个长度不超过10的字符串，每个字符串只有'A','T','C','G'这四种，现在让你用这四种字符拼成n个字符，问有多少种拼凑的方案，使得新的字符串不包含前面m个字符串。

思路：可以先构造m个字符串的trie图，然后把树上含有一个字符串尾节点的节点价值val标为1，其他都为0，那么对于每一个节点出边都有4条，如果我们把边看做走的下一步，那么题目就转变成在图上走n步，不能走到危险节点（即某个字符串的尾节点，也是节点val值为0的点），然后我们就想到了邻接矩阵A，用a[i][j]表示节点i和j间的边的条数，那么A的n次就是从一个点到另一个点走n步的方案数。

写代码的时候有一点要注意，如果AT中的T是危险节点，那么trie树中的CCATC的T也是危险节点，也要标记val=1,这一步在bfs的时候实现，加上这一句：" if(val[fail[x]]) val[x]=1;"

#include<iostream>

#include<stdio.h>

#include<stdlib.h>

#include<string.h>

#include<math.h>

#include<vector>

#include<map>

#include<set>

#include<queue>

#include<stack>

#include<string>

#include<algorithm>

using namespace std;

typedef long long ll;

#define inf 99999999

#define pi acos(-1.0)

#define maxnode 510000

#define MOD 100000

char s[100];

int num[1006];

struct trie{

    ll sz,root,val[maxnode],next[maxnode][4],fail[maxnode];

    int q[1111111];

    void init(){

        int i;

        sz=root=0;

        val[0]=0;

        for(i=0;i<4;i++){

            next[root][i]=-1;

        }

    }

    int idx(char c){

        if(c=='A')return 0;

        if(c=='C')return 1;

        if(c=='T')return 2;

        if(c=='G')return 3;

    }

    void charu(char *s){

        ll i,j,u=0;

        ll len=strlen(s);

        for(i=0;i<len;i++){

            int c=idx(s[i]);

            if(next[u][c]==-1){

                sz++;

                val[sz]=0;

                next[u][c]=sz;

                u=next[u][c];

                for(j=0;j<4;j++){

                    next[u][j]=-1;

                }

            }

            else{

                u=next[u][c];

            }

        }

        val[u]=1;

    }

    void build(){

        int i,j;

        int front,rear;

        front=1;rear=0;

        for(i=0;i<4;i++){

            if(next[root][i]==-1 ){

                next[root][i]=root;

            }

            else{

                fail[next[root][i] ]=root;

                rear++;

                q[rear]=next[root][i];

            }

        }

        while(front<=rear){

            int x=q[front];

            if(val[fail[x]])        //!!!!!这里非常重要，如果一个节点的fail节点的val值存在(即以当前节点为尾节点的前缀的后缀是某一个字符串，那么该节点和fail指针指的节点一样也是危险节点)

                val[x]=1;

            front++;

            for(i=0;i<4;i++){

                if(next[x][i]==-1){

                    next[x][i]=next[fail[x] ][i];

                }

                else{

                    fail[next[x][i] ]=next[fail[x] ][i];

                    rear++;

                    q[rear]=next[x][i];

                }

            }

        }

    }

}ac;

struct matrix{

    ll n,m,i;

    ll data[105][105];

    void init_danwei(){

        for(i=0;i<n;i++){

            data[i][i]=1;

        }

    }

};

matrix multi(matrix &a,matrix &b){

    ll i,j,k;

    matrix temp;

    temp.n=a.n;

    temp.m=b.m;

    for(i=0;i<temp.n;i++){

        for(j=0;j<temp.m;j++){

            temp.data[i][j]=0;

        }

    }

    for(i=0;i<a.n;i++){

        for(k=0;k<a.m;k++){

            if(a.data[i][k]>0){

                for(j=0;j<b.m;j++){

                    temp.data[i][j]=(temp.data[i][j]+(a.data[i][k]*b.data[k][j])%MOD )%MOD;

                }

            }

        }

    }

    return temp;

}

matrix fast_mod(matrix &a,ll n){

    matrix ans;

    ans.n=a.n;

    ans.m=a.m;

    memset(ans.data,0,sizeof(ans.data));

    ans.init_danwei();

    while(n>0){

        if(n&1)ans=multi(ans,a);

        a=multi(a,a);

        n>>=1;

    }

    return ans;

}

int main()

{

    ll n,m,i,j;

    while(scanf("%lld%lld",&m,&n)!=EOF)

    {

        ac.init();

        for(i=1;i<=m;i++){

            scanf("%s",s);

            ac.charu(s);

        }

        ac.build();

        matrix a;

        a.n=a.m=ac.sz+1;

        memset(a.data,0,sizeof(a.data));

        for(i=0;i<=ac.sz;i++){

            for(j=0;j<4;j++){

                if(ac.val[ac.next[i][j] ]==0 ){

                    a.data[i][ac.next[i][j] ]++;

                }

            }

        }

        matrix cnt;

        cnt=fast_mod(a,n);

        ll sum=0;

        for(i=0;i<=cnt.n;i++){

            sum=(sum+cnt.data[0][i])%MOD;

        }

        printf("%lld\n",sum);

    }

    return 0;

}

poj2778 DNA Sequence(AC自动机+矩阵快速幂）的更多相关文章

[poj2778]DNA Sequence(AC自动机+矩阵快速幂)
题意:有m种DNA序列是有疾病的,问有多少种长度为n的DNA序列不包含任何一种有疾病的DNA序列.(仅含A,T,C,G四个字符) 解题关键:AC自动机,实际上就是一个状态转移图,注意能少取模就少取模, ...
poj 2778 DNA Sequence ac自动机+矩阵快速幂
链接:http://poj.org/problem?id=2778 题意:给定不超过10串,每串长度不超过10的灾难基因:问在之后给定的长度不超过2e9的基因长度中不包含灾难基因的基因有多少中? DN ...
poj2778DNA Sequence (AC自动机+矩阵快速幂)
转载请注明出处: http://www.cnblogs.com/fraud/ ——by fraud DNA Sequence Time Limit: 1000MS Memory ...
POJ2778 DNA Sequence(AC自动机矩阵)
先使用AC自动机求得状态转移关系,再建立矩阵,mat[i][j]表示一步可从i到j且i,j节点均非终止字符的方案数,则此矩阵的n次方表示n步从i,到j的方法数. #include<cstdio& ...
POJ2778 DNA Sequence（AC自动机+矩阵快速幂）
题目给m个病毒串,问不包含病毒串的长度n的DNA片段有几个. 感觉这题好神,看了好久的题解. 所有病毒串构造一个AC自动机,这个AC自动机可以看作一张有向图,图上的每个顶点就是Trie树上的结点,每个 ...
POJ 2778 DNA Sequence （ac自动机+矩阵快速幂）
DNA Sequence Description It's well known that DNA Sequence is a sequence only contains A, C, T and G ...
DNA Sequence POJ - 2778 AC自动机 && 矩阵快速幂
It's well known that DNA Sequence is a sequence only contains A, C, T and G, and it's very useful to ...
POJ 2778 DNA Sequence（AC自动机 + 矩阵快速幂）题解
题意:给出m个模式串,要求你构造长度为n(n <= 2000000000)的主串,主串不包含模式串,问这样的主串有几个思路:因为要不包含模式串,显然又是ac自动机.因为n很大,所以用dp不太好 ...
POJ2778(SummerTrainingDay10-B AC自动机+矩阵快速幂)
DNA Sequence Time Limit: 1000MS Memory Limit: 65536K Total Submissions: 17160 Accepted: 6616 Des ...

随机推荐

PAT甲级练习 1087 All Roads Lead to Rome (30分) 字符串hash + dijkstra
题目分析: 这题我在写的时候在PTA提交能过但是在牛客网就WA了一个点,先写一下思路留个坑这题的简单来说就是需要找一条最短路->最开心->点最少(平均幸福指数自然就高了),由于本题给出的 ...
Python模块化编程与装饰器
Python的模块化编程我们首先以一个例子来介绍模块化编程的应用场景,有这样一个名为requirements.py的python3文件,其中两个函数的作用是分别以不同的顺序来打印一个字符串: # r ...
ps -eo 用户自定义格式显示
[root@ma ~]# ps -eo pid,ucomm|head -3 PID COMMAND 1 init 2 kthreadd[root@ma ~]# ps axu|head -3USER P ...
2019 Eclipse的下载与安装教程
Eclipse 是一个开放源代码的.基于Java的可扩展开发平台,可以免费下载使用. 首先我们先进入这个软件的官网:https://www.eclipse.org/ 点击这个网页download下载: ...
o_direct刷新方式和文件系统支持Direct i/o
若让innodb使用o_direct刷新方式,文件系统支持Direct i/o 是非常重要的.为啥
【Oracle】11G 11.2.0.4 RAC环境打补丁
一.准备工作 1,数据库环境操作系统版本 : RedHat 7.2 x64 数据库版本 : Oracle 11.2.0.4 x64 RAC Grid : 11.2 ...
集成 12 种协议、可于 USBC 端口的快充协议芯片IP2188
1. 特性支持 12 种 USB 端口快充协议支持 USB TypeC PD2.0/PD3.0/PPS DFP 协议支持多种充电协议(QC3.0/QC2.0,FCP,SCP, AFC,MT ...
NOIP2020 T2 字符串匹配题解
首先考虑O(n^3)的暴力怎么写. 显然,可以枚举字符串\(A\)+\(B\)的右端点,左端点显然是1,暴力判断是否能与后面的字符构成循环节,对于满足 \(k*(A+B)+C=\) 整个字符串\((k ...
【9k字+】第二篇：进阶：掌握 Redis 的一些进阶操作（Linux环境）
九 Redis 常用配置文件详解能够合理的查看,以及理解修改配置文件,能帮助我们更好的使用 Redis,下面按照 Redis 配置文件的顺序依次往下讲 1k 和 1kb,1m 和 1mb .1g 和 ...
1.Spring的基本应用
1.1概述 1.1.1 Spring是什么 Spring一个轻量级的框架,以IOC(控制反转)和AOP(面向切面编程)为内核,Spring在表现层提供了Spring MVC的框架整和功能,在业务逻辑层 ...

poj2778 DNA Sequence(AC自动机+矩阵快速幂）

poj2778 DNA Sequence(AC自动机+矩阵快速幂）的更多相关文章

随机推荐

热门专题