最长公共子串/序列问题

时间:2022-07-23
本文章向大家介绍最长公共子串/序列问题,主要内容包括其使用实例、应用技巧、基本知识点总结和需要注意事项,具有一定的参考价值,需要的朋友可以参考一下。

子串必须是连续的,子序列可以是非连续的。这两个问题属于经典的dp问题。

最长公共子串

给两个整数数组 A 和 B ,返回两个数组中公共的、长度最长的子数组的长度。

示例:

输入:
A: [1,2,3,2,1]
B: [3,2,1,4,7]
输出:3
解释:
长度最长的公共子数组是 [3, 2, 1] 。


提示:

1 <= len(A), len(B) <= 1000
0 <= A[i], B[i] < 100

动态规划问题最简单的做法,求啥设啥。

    public int findLength(int[] A, int[] B) {
        int M = A.length, N = B.length;
        int ans = 0;
        // dp[i][j] 表示A以i - 1结尾 B以j - 1结尾的最长公共子串的长度
        int[][] dp = new int[M + 1][N + 1]; 
        for(int i = 1; i <= M; i++){
            for(int j = 1; j <= N; j++){
                if(A[i - 1] == B[j - 1]){
                    dp[i][j] = dp[i - 1][j - 1] + 1;
                    ans = Math.max(ans, dp[i][j]);
                }
            }
        }
        return ans;
    }

最长公共子序列

给定两个字符串 text1 和 text2,返回这两个字符串的最长公共子序列的长度。

一个字符串的 子序列 是指这样一个新的字符串:它是由原字符串在不改变字符的相对顺序的情况下删除某些字符(也可以不删除任何字符)后组成的新字符串。 例如,”ace” 是 “abcde” 的子序列,但 “aec” 不是 “abcde” 的子序列。两个字符串的「公共子序列」是这两个字符串所共同拥有的子序列。

若这两个字符串没有公共子序列,则返回 0。

示例 1:

输入:text1 = "abcde", text2 = "ace" 
输出:3  
解释:最长公共子序列是 "ace",它的长度为 3。
示例 2:

输入:text1 = "abc", text2 = "abc"
输出:3
解释:最长公共子序列是 "abc",它的长度为 3。
示例 3:

输入:text1 = "abc", text2 = "def"
输出:0
解释:两个字符串没有公共子序列,返回 0。


提示:

1 <= text1.length <= 1000
1 <= text2.length <= 1000
输入的字符串只含有小写英文字符。

来源:力扣(LeetCode)
链接:https://leetcode-cn.com/problems/longest-common-subsequence
著作权归领扣网络所有。商业转载请联系官方授权,非商业转载请注明出处。

举例说明,

假设text1和text2都到了最后的位置
text1 = "abcde“, 
text2 = "ace"
发现text1[4] == textt2[2],此时结果等于"abcd“和"ac”的最长子串长度 + 1.

假设text1和text2都到了最后的位置
text1 = "abcd“, 
text2 = "ace"
text1[3] != text2[2] , 则选择"abc“和"ace"的公共子串与"abcd“和"ac"的公共子串中的最大的

baseline:

dp[i][j] = 0 quad i,j=0

代码如下:

    public int longestCommonSubsequence(String text1, String text2) {
        int M = text1.length();
        int N = text2.length();
        // dp[i][j]  text1以i - 1结尾 text2以j - 1结尾的最长公共子序列
        int[][] dp = new int[M + 1][N + 1];
        for(int i = 1; i <= M; i++){
            for(int j = 1; j <= N; j++){
                if(text1.charAt(i - 1) == text2.charAt(j - 1)){
                    dp[i][j] = dp[i - 1][j - 1] + 1;
                }else{
                    dp[i][j] = Math.max(dp[i][j - 1], dp[i - 1][j]);
                }
            }
        }
        return dp[M][N];
    }

最长公共子序列的一个应用。

两个字符串的删除操作(leetcode583)

给定两个单词 word1word2*,找到使得 *word1word2 相同所需的最小步数,每步可以删除任意一个字符串中的一个字符。

示例:

输入: "sea", "eat"
输出: 2
解释: 第一步将"sea"变为"ea",第二步将"eat"变为"ea"

我们发现最后删除之后剩下的不就是两字符串的公共子串嘛。因此可以直接用这两单词长度分别减去公共子串长度再求和即可解决。

    public int minDistance(String text1, String text2) {
        int M = text1.length();
        int N = text2.length();
        // dp[i][j]  text1以i - 1结尾 text2以j - 1结尾的最长公共子序列
        int[][] dp = new int[M + 1][N + 1];
        for(int i = 1; i <= M; i++){
            for(int j = 1; j <= N; j++){
                if(text1.charAt(i - 1) == text2.charAt(j - 1)){
                    dp[i][j] = dp[i - 1][j - 1] + 1;
                }else{
                    dp[i][j] = Math.max(dp[i][j - 1], dp[i - 1][j]);
                }
            }
        }
        return M + N - 2 * dp[M][N];
    }