动态规划法(三)——最长公共子序列

时间:2022-05-03
本文章向大家介绍动态规划法(三)——最长公共子序列,主要内容包括问题描述、定理、数据结构、算法思路、2. 根据s数组求得最长公共子序列、代码实现、2. 根据s数组求得最长公共子序列、图示、基本概念、基础应用、原理机制和需要注意的事项等,并结合实例形式分析了其使用技巧,希望通过本文能帮助到大家理解应用这部分内容。

问题描述

给定两个序列,求出它们的最长公共子序列。 如:序列X={a,b,c,b,d,a,b},Y={b,d,c,a,b,a},则X和Y的最长公共子序列为{b,c,b,a}

  • 子序列:子序列为原序列的一个子集,并不要求连续,但要求子序列中元素的顺序和原序列元素的顺序一致。

定理

设两个序列分别是X={x1,x2……,xm},Y={y1,y2……,yn},它们的最长公共子序列为Z={z1,z2,……,zk}。

  1. 若xm=yn,则先求Xm-1和Yn-1的最长公共子序列,再在其尾部加上xm即可得Xm和Yn的最长公共子序列。
  2. 若xm!=yn,则必须分别求Xm、Yn-1和Xm-1、Yn的最长公共子序列,其中较长者就是Xm和Yn的最长公共子序列。

数据结构

  • c[i][j]: 用来记录Xi和Yj的最长公共子序列的长度。
  • s[i][j]: 用来标识Xi和Yi的最长公共子序列是由哪种情况得来:c[i][j-1]、c[i-1][j]、c[i][j]+1。 该数组能还原出最长公共子序列。

算法思路

1. 生成c数组和s数组所有元素

  1. 将c数组的第0行、第0列初始化为0;
  2. 从c数组的第一行、第一列开始,依次从左向右、从上到下填充元素值: a)若x[i]==y[j],则c[i][j]=c[i-1][j-1]+1,s[i][j]=1; b)若x[i]!=y[j],则分别计算c[i][j-1]、c[i-1][j],将大的那个作为c[i][j];并且,如果c[i-1][j]>=c[i][j-1],则s[i][j]=2;如果c[i-1][j]< c[i][j-1],则s[i][j]=3;

2. 根据s数组求得最长公共子序列

代码实现

private int[][] c;
private int[][] s;

1. 生成c数组和s数组所有元素

void LCSLength(String a, String b){
    // x和y的最前端分别加上0
    char[] x = ("0"+a).toCharArray();
    char[] y = ("0"+b).toCharArray();

    c = new int[x.length][y.length];
    s = new int[x.length][y.length];

    // 初始化c、s
    for( int i=0; i<x.length; i++ ){
        c[i][0] = 0;
    }
    for( int i=0; i<y.length; i++ ){
        c[0][i] = 0;
    }

    // 从上到下、从左到右填充c、s数组
    for( int i=1; i<x.length; i++ ){
        for( int j=1; j<y.length; j++ ){
            if( x[i]==y[j] ){
                c[i][j] = c[i-1][j-1]+1;
                s[i][j] = 1;
            }
            else if ( c[i-1][j] >= c[i][j-1] ){
                c[i][j] = c[i-1][j];
                s[i][j] = 2;
            }
            else {
                c[i][j] = c[i][j-1];
                s[i][j] = 3;
            }
        }
    }
}

2. 根据s数组求得最长公共子序列

StringBuilder sb = new StringBuilder();

void CLCS( int i, int j ){
    if ( i==0 || j==0 ) return;
    if ( s[i][j]==1 ) {
        CLCS( i-1,j-1 );
        sb.append( x[i] ); // 为了让公共子序列正序输出,因此需要在递归调用之后将x[i]添加至sb
    }
    else if ( s[i][j]==2 ){
        CLCS( i-1,j );
    }
    else {
        CLCS( i,j-1 );
    }
}

图示

  • 初始化c和s数组,将第0行、第0列都设为0:
  • 从第一行、第一列开始,依次从左到右、从上到下填充c和s数组:
  • 当c和s都填充完毕后,就可以根据s数组找到最长公共子序列 从s数组最右下角的元素开始: a)若s[i][j]==1,则找到一个字符,并继续比较左上角的元素; b)若s[i][j]==2,则继续比较上方的元素; c)s[i][j]==3,则继续比较左侧的元素。 d)直到i==0或j==0为止。