Oracle 12c PDB迁移及ORA-00600错误分析和解决(r10笔记第72天)

时间:2022-05-04
本文章向大家介绍Oracle 12c PDB迁移及ORA-00600错误分析和解决(r10笔记第72天),主要内容包括其使用实例、应用技巧、基本知识点总结和需要注意事项,具有一定的参考价值,需要的朋友可以参考一下。

最近迁移一台测试环境,准备整合到12c的PDB,常规的思路是用Datapump导出导入,对于数据较大的环境来说这个时间会比较长,为此自己也尝试先升级这个测试库,然后加入到CDB中去。

升级的过程就不多说了,其实对于大多数常规的业务来说,本身不是难点。

把升级后的NON-CDB加入到CDB中,基本是下面的思路,先把数据启动到只读模式,然后到处一个配置文件,加载到CDB的重要地方就是使用这个配置文件。先做检查。

sqlplus / as sysdba
SQL> select name, CDB from v$database;
NAME      CDB
--------- ---
TESTDB    YES

SET SERVEROUTPUT ON
DECLARE
compatible CONSTANT VARCHAR2(3) :=
CASE DBMS_PDB.CHECK_PLUG_COMPATIBILITY(
pdb_descr_file => '/tmp/ncdb12c_actvdb.xml',
pdb_name => 'NCDB12C')
WHEN TRUE THEN 'YES'
ELSE 'NO'
END;
BEGIN
DBMS_OUTPUT.PUT_LINE(compatible);
END;
/

NO
PL/SQL procedure successfully completed.

仔细一看这个地方竟然输出了NO,对于这种情况需要查看下面的数据字典来得到更多的信息。

select name,cause,type,message,status from PDB_PLUG_IN_VIOLATIONS where name='NCDB12C';

比如会有下面的信息:

NAME       CAUSE                          TYPE      MESSAGE                                            STATUS
---------- ------------------------------ --------- -------------------------------------------------- ---------
NCDB12C    Parameter                      WARNING   CDB parameter optimizer_index_caching mismatch:    PENDING
                                                    Previous 90 Current 0
NCDB12C    Parameter                      WARNING   CDB parameter pga_aggregate_target mismatch:       PENDING
                                                    Previous 788M Current 6440M
NCDB12C    SQL patch error                ERROR     (PSU bundle patch 160719 (Database Patch Set       PENDING
                                                    Update : 12.1.0.2.160719 (23054246)): APPLY
                                                    SUCCESS):  with status  in the PDB.

警告的信息没有大的影响,关键就在于ERROR

但是这个地方我就比较奇怪了,使用opatch lsinventory查看,补丁是有的。而且其他的数据库已经都部署多套了。这个为什么就抛出了这个问题呢。

为了尽快修复这个问题,我打开生成的配置文件,把SQL Patch的这一段信息删除了,然后再次运行上面的检查脚本就没有问题了。

SQL> @a.sql

YES
PL/SQL procedure successfully completed.

基本的准备工作做完了,也算是有惊又险。

我们创建PDB,注意文件路径的映射。

SQL> CREATE PLUGGABLE DATABASE actvdb  using '/tmp/ncdb12c_actvdb.xml'
        copy file_name_convert=('/U01/app/oracle/oradata/actvdb','/home/U01/app/oracle/oradata/testdb/pdb/actvdb');
Pluggable database created.

这个过程时间会持续稍长一些,不过因为是在本地,所以影响不大,创建好之后,尝试open这个PDB,发现不大对劲。

SQL> alter pluggable database actvdb open; Warning: PDB altered with errors.

检查这个PDB的状态,发现是受限的会话连接。

SQL> show pdbs;
    CON_ID CON_NAME                       OPEN MODE  RESTRICTED
---------- ------------------------------ ---------- ----------
         2 PDB$SEED                       READ ONLY  NO
      。。。
         8 ACTVDB                         READ WRITE YES

突然醒悟,还有一个重要的脚本没跑,那就是

@$ORACLE_HOME/rdbms/admin/noncdb_to_pdb.sql

一遍感叹粗心大意,一边赶紧运行脚本。

运行的过程中查看PDB的状态是MIGRATE

SQL> SQL> show pdbs
    CON_ID CON_NAME                       OPEN MODE  RESTRICTED
---------- ------------------------------ ---------- ----------
         2 PDB$SEED                       READ ONLY  NO
        。。。
         8 ACTVDB                         MIGRATE    YES

但是让我有些意外的是这个脚本执行失败了,而且抛出了ORA-00600的错误。

SQL> DECLARE
  2     threads pls_integer := &&1;
  3  BEGIN
  4     utl_recomp.recomp_parallel(threads);
  5  END;
  6  /
DECLARE
*
ERROR at line 1:
ORA-04045: errors during recompilation/revalidation of SYS.DBMS_QOPATCH
ORA-00600: internal error code, arguments: [kql_tab_diana:new dep],
[0x4C7382A68], [0x7F97536569A0], [1], [2], [], [], [], [], [], [], []
ORA-06512: at "SYS.DBMS_UTILITY", line 1294
ORA-06512: at line 1

因为也不大确定这个的影响范围,查看PDB的状态,发现是受限的会话连接。

SQL> show pdbs;
    CON_ID CON_NAME                       OPEN MODE  RESTRICTED
---------- ------------------------------ ---------- ----------
         2 PDB$SEED                       READ ONLY  NO
        。。。
         8 ACTVDB                         READ WRITE YES

尝试反复启停,还是同样的错误,眼看升级迁移的时间越来越紧,尽管是测试环境,还是不能麻痹大意。

对于这个问题,真是让我一头雾水,查看MOS也没有找到直接的解答,而查看OTN的问答,发现有些朋友也确实碰到了。有人找到了根上,那就是编译一个包的时候会抛出ORA-00600的错误。

我试了下,确实如此。

SQL> ALTER PACKAGE "SYS"."DBMS_QOPATCH" COMPILE BODY REUSE SETTINGS ;
ALTER PACKAGE "SYS"."DBMS_QOPATCH" COMPILE BODY REUSE SETTINGS
*
ERROR at line 1:
ORA-00600: internal error code, arguments: [kql_tab_diana:new dep],
[0x149CF37C0], [0x7F9BEA79DBD0], [1], [2], [], [], [], [], [], [], []

有些人尝试重新创建编译这个包,我在本地尝试,发现还是抛出了ORA-00600的错误。

SQL> @?/rdbms/admin/prvtqopi.plb
Session altered.
CREATE OR REPLACE PACKAGE BODY DBMS_QOPATCH wrapped
*
ERROR at line 1:
ORA-00600: internal error code, arguments: [kql_tab_diana:new dep],
[0x149CF37C0], [0x7F9BEAB683B8], [1], [2], [], [], [], [], [], [], []

这个问题越发严峻,而我似乎只能找到一个有些相关的bug

Bug 20981713 : ORA-600 [KQL_TAB_DIANA:NEW DEP] DURING NONCDB_TO_PDB.SQL 过了一会儿之后,我再次尝试停库,然后重新启动,发现竟然可以了。

当然我的内心是忐忑的,我深深知道很可能这个库再停了之后就无法正常open了。

但是应用的连接能够正常进来,也算是躲过了一劫,而马上我就发现这个问题不是一般的纠结。因为我碰到了另外一个棘手的问题,那就是主库虽然可以正常open了,忽略了里面的警告,但是备库的这个PDB却偏偏无法正常open到read only状态。

SQL> alter pluggable database all open;
alter pluggable database all open
*
ERROR at line 1:
ORA-01109: database not open

对于灾备而言,这是极为严重,而且不合格的。但是问题的原因是什么呢。

为了进一步实验,我在备库开启了snapshot Standby,这样备库可读可写,就能够模拟测试了,但是我发现问题是接二连三。

马上发现这个PDB在open的时候报出了其它的ORA-00600错误。

Errors in file /home/U01/app/oracle/diag/rdbms/testdb2/testdb/trace/testdb_p005_24365.trc  (incident=140313) (PDBNAME=ACTVDB):
ORA-00600: internal error code, arguments: [kqlobjlod-no-result-from-proc$], [1403], [888], [], [], [], [], [], [], [], [], []
Incident details in: /home/U01/app/oracle/diag/rdbms/testdb2/testdb/incident/incdir_140313/testdb_p005_24365_i140313.trc
Use ADRCI or Support Workbench to package the incident.
See Note 411.1 at My Oracle Support for error and packaging details. 

查看MOS 找到了文章,但是还是没有解决的方法。

ORA-600 [kqlobjlod-no-result-from-proc$] (Doc ID 1613402.1)

在查看了不少的文章之后,隐隐发现是在这个Patch上。

因为我在Snapshot Standby中测试了下面的命令,发现似乎容器的Patch没有生效。

$  ./datapatch -verbose
....
Installing patches...
Patch installation complete.  Total patches installed: 7

所以在做了一个艰难的决定之后,我决定在主库重新给这个PDB部署Patch,然后运行noncdb_to_pdb.sql

但是这样做的风险就是这个PDB如果还是无法正常open,很可能的情况就是受限的会话连接,这样的话我只能重新修复了,为此我花了些时间做了一个完整的逻辑备份,然后开始尝试修复。

再次运行noncdb_to_pdb.sql的脚本。

SQL> alter session set container=actvdb;
Session altered.
SQL> @$ORACLE_HOME/rdbms/admin/noncdb_to_pdb.sql

看到上次抛出ORA-00600的地方会快就顺利完成了,心里总算松了口气。然后尝试open的时候发现这次抛出了SQLPatch的Error

我在主库端$ORACLE_HOME/OPatch下运行dbpach -verbose 短暂的等待之后,可以看到PDB已经部署了新的补丁。

Current state of SQL patches:
Bundle series PSU:
  ID 160719 in the binary registry and ID 160719 in PDB ACTVDB

然后重启PDB,就恢复了正常。

SQL> alter session set container=actvdb;
Session altered.
SQL> shutdown immediate
Pluggable Database closed.
SQL> startup
Pluggable Database opened.
SQL> show pdbs;
    CON_ID CON_NAME                       OPEN MODE  RESTRICTED
---------- ------------------------------ ---------- ----------
         8 ACTVDB                         READ WRITE NO

而这个问题在备库就立竿见影,再次尝试启动备库的PDB。

使用alter pluggable database all open就没有问题了。

SQL> show pdbs;
    CON_ID CON_NAME                       OPEN MODE  RESTRICTED
---------- ------------------------------ ---------- ----------
         2 PDB$SEED                       READ ONLY  NO
        。。。
         8 ACTVDB                         READ ONLY  NO

SQL> select open_mode from v$database;
OPEN_MODE
--------------------
READ ONLY WITH APPLY   

这个问题总算告一段落,而对于SQL Patch也有了更深一层的理解。