深入谈谈二分查找变形的难点

时间:2022-07-23
本文章向大家介绍深入谈谈二分查找变形的难点,主要内容包括其使用实例、应用技巧、基本知识点总结和需要注意事项,具有一定的参考价值,需要的朋友可以参考一下。

昨天我们简短地谈了谈二分查找的变形,其实都是很简单的转换,不费力,主要是为了抛砖引玉,让大家明白二分查找的题目的特点,从而引出今天的讨论:会给一个排序好的数组,然后在这之中去寻找符合条件的元素。

事情起源于我前些日子面试遇到的算法题(现在开发面试遇到的算法题真是越来越多了,开发框架可以来了学,但算法一定要强的架势,大家平时有空的话还是做做题玩玩),题目是这样的: 假设按照升序排序的数组在预先未知的某个点上进行了旋转。( 例如,数组 [0,1,2,4,5,6,7] 可能变为 [4,5,6,7,0,1,2] )。搜索一个给定的目标值,如果数组中存在这个目标值,则返回它的索引,否则返回 -1 。你可以假设数组中不存在重复的元素。你的算法时间复杂度必须是 O(log n) 级别。

快速扫一下题意,我们已经锁定排序好找出这两个关键字了,再加上复杂度要求在O(log n)级别,暗示得很明显了,尽管它花里胡哨地来了个旋转,我的直觉也告诉我先尝试往二分查找上套。

来吧,那我们就来看看,怎样才能让题目回到我们熟悉的二分查找系列。主要的障碍在于它排序好之后又进行了旋转,让本来的排序不那么直观了。我们得想办法,如果有序了我们想找某个元素就很简单了。这时候我们可以发现,总存在一个点,让旋转后的数组在那一点前后两段还是有序的!那我们随便从中间切一半,总有一半是完全递增的。

我们先计算出中值middle,然后我们比较一下在start跟在middle的两个点,我们有两个选择:

  1. arr[start] <= arr[middle],那这部分是递增的。
  2. 不然的话后半部分是递增的。

一旦我们知道哪部分是排序好的,我们就可以缩短范围了:

  1. 用目标值比较arr[start]跟[middle],我们就可以判断目标值在不在这部分里面,如果在的话就可以丢弃第二部分了。
  2. 否则的话我们丢弃第一部分,在第二部分里面去找。

反正数组里没有重复,我们每次都可以丢掉一半,如果数组里面有重复这边判断就要复杂一些了,我们稍后再看有重复的版本,现在先继续看。只要一直找到有序的部分,查找就不是难事。

public static int search(int[] arr, int key) {
        int start = 0, end = arr.length - 1;
        while (start <= end) {
            int mid = start + (end - start) / 2;
            if (arr[mid] == key)
                return mid;

            if (arr[start] <= arr[mid]) { // 左边升序
                if (key >= arr[start] && key < arr[mid]) {
                    end = mid - 1;
                } else { //key > arr[mid]
                    start = mid + 1;
                }
            } else { // 右边升序  
                if (key > arr[mid] && key <= arr[end]) {
                    start = mid + 1;
                } else {
                    end = mid - 1;
                }
            }
        }

        // 找不到
        return -1;
    }

看吧,一开始的直觉果然是对的,这题目最后还是我们熟悉的二分查找,时间复杂度也维持在了O(log n)。这也是我之前强调的,大家刷题的时候多按类型来做,总结出题目的规律,万变不离其宗,虽然我们不可能把所有的题目都做完,但是我们会找规律啊。就像排序好的数组找某个元素会让我们联系到二分查找,在我们的记忆里就把他们形成一个强关联,我们发现一种类型的套路之后,我们再遇到类似问题就可以给自己一个大致方向,引导自己往正确的路上走。

现在再来看看刚才埋下的坑,如果数组里有重复元素会怎么样?上面的方法就不好使了,如果某一时刻start,middle,end的值都一样的,我们没办法判断某个部分是不是升序了。

那这时候该怎么办,不用想的太复杂,我们的障碍主要来自于三个值相等,那如果start,middle,end指的这个值不是我们要找的,那我们直接跳过就好了,跳过他们等这三个位置值不想等了,我们的思路不就又跟之前一样了吗?

public static int search(int[] arr, int key) {
        int start = 0, end = arr.length - 1;
        while (start <= end) {
            int mid = start + (end - start) / 2;
            if (arr[mid] == key)
                return mid;

            // 跟上边解法区别就在这个判断,可能在start,middle,end三个位置值相等,这时候我们不知道选哪边
            // 我们可以选择两边都跳过,如果key != arr[mid]的话
            if ((arr[start] == arr[mid]) && (arr[end] == arr[mid])) {
                ++start;
                --end;
            } else if (arr[start] <= arr[mid]) { // 左边升序
                if (key >= arr[start] && key < arr[mid]) {
                    end = mid - 1;
                } else {
                    start = mid + 1;
                }
            } else { // 右边升序
                if (key > arr[mid] && key <= arr[end]) {
                    start = mid + 1;
                } else {
                    end = mid - 1;
                }
            }
        }

        // 找不到
        return -1;
    }

好啦,最后总结一下,大家应该都发现了二分查找题目想要变复杂基本上都在排序好的数组上做文章,而且一般还会强调是一个排序好的数组做了什么什么转换。相信大家以后看到这类题目都知道该怎么思考了,Happy coding~