数据库rowid
① 教你删除Oracle数据库中重复没用的数据
在对数据库进行操作过程中我们可能会碰到这种情况 表中的数据可能重复出现 使我们对数据库的操作过程中带来很多的不便 那么怎么删除这些重复没有用的数据呢?
重复数据删除技术可以提供更大的备份容量 实现更长时间的数据保留 还能实现备份数据的持续验证 进步数据恢复服务水平 方便实现数据容灾等 重复的数据可能有这样两种情况 第一种时表中只有某些字段一样 第二种是两行记录完全一样 Oracle数据库重复数据删除技术有如下优势 更大的备份容量 数据能得到持续验证 有更高的数据恢复服务水平 方便实现备份数据的容灾
一 删除部分字段重复数据
先来谈谈如何查询重复的数据吧
下面语句可以查询出那些数据是重复的
select 字段 字段 count(*) from 表名 group by 字段 字段 having count(*) >
将上面的>号改为=号就可以查询出没有重复的数据了
想要删除这些重复的数据 可以使用下面语句进行删除
delete from 表名 a where 字段 字段 in
(select 字段 字段 count(*) from 表名 group by 字段 字段 having count(*) > )
上面的语句非常简单 就是将查询到的数据删除掉 不过这种删除执行的效率非常低 对于大数据量来说 可能会将数据库吊死 所以我建议先将查询到的重复的数据插入到一个暂时表中 然后对进行删除 这样 执行删除的时候就不用再进行一次查询了 如下
create TABLE 暂时表 AS
(select 字段 字段 count(*) from 表名 group by 字段 字段 having count(*) > )
上面这句话就是建立了暂时表 并将查询到的数据插入其中
下面就可以进行这样的删除操作了
delete from 表名 a where 字段 字段 in (select 字段 字段 from 暂时表);
这种先建暂时表再进行删除的操作要比直接用一条语句进行删除要高效得多
这个时候 大家可能会跳出来说 什么?你叫我们执行这种语句 那不是把所有重复的全都删除吗?而我们想保留重复数据中最新的一条记录啊!大家不要急 下面我就讲一下如何进行这种操作
在oracle中 有个隐藏了自动rowid 里面给每条记录一个唯一的rowid 我们假如想保留最新的一条记录
我们就可以利用这个字段 保留重复数据中rowid最大的一条记录就可以了
下面是查询重复数据的一个例子
以下是引用片段 selecta rowid a *from表名awherea rowid!=(selectmax(b rowid)from表名bwherea 字段 =b 字段 anda 字段 =b 字段 )
下面我就来讲解一下 上面括号中的语句是查询出重复数据中rowid最大的一条记录
而外面就是查询出除了rowid最大之外的其他重复的数据了
由此 我们要删除重复数据 只保留最新的一条数据 就可以这样写了
deletefrom表名awherea rowid!=(selectmax(b rowid)from表名bwherea 字段 =b 字段 anda 字段 =b 字段 )
随便说一下 上面语句的执行效率是很低的 可以考虑建立暂时表 讲需要判定重复的字段 rowid插入暂时表中 然后删除的时候在进行比较
createtable暂时表asselecta 字段 a 字段 MAX(a ROWID)dataidfrom正式表aGROUPBYa 字段 a 字段 ;deletefrom表名awherea rowid!=(selectb dataidfrom暂时表bwherea 字段 =b 字段 anda 字段 =b 字段 );mit;
二 完全删除重复记录
对于表中两行记录完全一样的情况 可以用下面语句获取到去掉重复数据后的记录
select distinct * from 表名
可以将查询的记录放到暂时表中 然后再将原来的表记录删除 最初将暂时表的数据导回原来的表中 如下
createTABLE暂时表AS(selectdistinct*from表名);truncatetable正式表; 注 原先由于笔误写成了droptable正式表; 现在已经改正过来insertinto正式表(select*from暂时表);droptable暂时表;
假如想删除一个表的重复数据 可以先建一个暂时表 将去掉重复数据后的数据导入到暂时表 然后在从暂时表将数据导入正式表中 如下
insertINTOt_table_bakselectdistinct*fromt_table;
三 怎样快速删除oracle数据库
最快的方法就进入注册表 在运行 里输入regedit
依次展开HKEY_LOCAL_MACHINE SOFARE
找到ORACLE节点 删除
然后删除ORACLE数据文件 安装的时候选的路径
lishixin/Article/program/Oracle/201311/18677
② 在ORACLE数据库中什么叫伪列
伪列的数据是由ORACLE进行维护和管理的,用户不能对这个列修改,只能查看。
所有的伪列要得到值必须要显式的指定。
最常用的两个伪列:rownum和rowid。
1、
ROWNUM(迅模行号):是在查询操作时由亩码缓ORACLE为每一行记录自动生成的一个编号。
每一次查询ROWNUM都会重新生成。(查询的结果中Oracle给你增加的一个编号,根据结果来重新生成)
rownum永远按照默认的顺序生成。(不受order by的影响)
rownum只能使用 <、 <= ,不能使用 > 、>= 符号,原因是:Oracle是基于行的数据库,行号永远是从1开始,即必须有第一行,才有第二行。
2、
ROWID(记录编号):是表的伪列,是用来唯一标识表中的一条记录,并且间接给出了表行的物理位置,定位表行最快的方式。
主键:标识唯一的一条业务数据的标识。主键是模好给业务给用户用的。不是给数据库用的。
记录编号rowid:标识唯一的一条数据的。主要是给数据库用的。类似UUID。
③ Oracle索引的索引的分类
在关系数据库中,每一行都由一个行唯一标识RowID。RowID包括该行所在的文件、在文件中的块数和块中的行号。索引中包含一个索引条目,每一个索引条目都有一个键值和一个RowID,其中键值可以是一列或者多列的组合。(一)索引按存储方法分类,可以分为2类:B*树索引和位图索引。(1)B*树索引的存储结构类似书的索引结构,有分支和叶两种类型的存储数据块,分支块相当于书的大目录,叶块相当于索引到的具体的书页。Oracle用B*树机制存储索引条目,以保证用最短路径访问键值。默认情况下大多使用B*树索引,该索引就是通常所见的唯一索引、逆序索引。(2)位图索引存储主要用于节省空间,减少oracle对数据块的访问。它采用位图偏移方式来与表的行ID号对应,采用位图索引一般是重复值太多的表字段。位图索引之所以在实际密集型OLTP(联机事物处理)中用的比较少,是因为OLTP会对表进行大量的删除、修改、新建操作。Oracle每次进行操作都会对要操作的数据块加锁。以防止多人操作容易产生的数据库锁等待甚至死锁现象。在OLAP(联机分析处理)中应用位图有优势,因为OLAP中大部分是对数据库的查询操作,而且一般采用数据仓库技术,所以大量数据采用位图索引节省空间比较明显。当创建表的命令中包含有唯一性关键字时,不能创建位图索引,创建全局分区索引时也不能用位图索引。(二)索引按功能和索引对象分还有以下类型。(1)唯一索引意味着不会有两行记录相同的索引键值。唯一索引表中的记录没有RowID,不能再对其建立其他索引。在oracle10g中,要建立唯一索引,必须在表中设置主关键字,建立了唯一索引的表只按照该唯一索引结构排序。(2)非唯一索引不对索引列的值进行唯一性限制。(3)分区索引是指索引可以分散地存在于多个不同的表空间中,其优点是可以提高数据查询的效率。(4)未排序索引也称为正向索引。Oracle10g数据库中的行是按升序排序的,创建索引时不必指定对其排序而使用默认的顺序。(5)逆序索引也称反向索引。该索引同样保持列按顺序排列,但是颠倒已索引的每列的字节。(6)基于函数的索引是指索引中的一列或者多列是一个函数或者表达式,索引根据函数或表达式计算索引列的值。可以将基于函数的索引建立创建成位图索引。另外,按照索引所包含的列数可以把索引分为单列索引和复合索引。索引列只有一列的索引为单列索引,对多列同时索引称为复合索引。
④ 数据库中的十种数据类型都是什么
Character 数据类型
Character 数据类型用来存储字母数字型数据。当你在oracle 中定义一个character 数据时,通常需要制定字段的长度,它是该字段的最大长度。ORACLE提供以下几种character 数据类型:
CHAR() CHAR数据类型是一种有固定长度和最大长度的字符串。存储在数据类型为CHAR字段中的数据将以空格的形式补到最大长度。长度定义在1——2000字节之间。
当你创建一个CHAR型字段,数据库将保证在这个字段中的所有数据是定义长度,如果某个数据比定义长度短,那么将用空格在数据的右边补到定义长度。如果长度大于定义长度将会触发错误信息。
VARCHAR() varchar型数据是varchar2型数据的快照。
VARCHAR2() varchar2数据类型是一种可变长度的、有最大长度的字母数字型数据。Varchar2类型的字段长度可以达到4000字节,Varchar2类型的变量长度可以达到32676字节。
一个空的varchar2(2000)字段和一个空的varchar2(2)字段所占用的空间是一样的。
NCHAR() 和 NVARCHAR2() NCHAR() 和 NVARCHAR2()数据类型分别与CHAR() 和 VARCHAR2()类型是相同的,只不过它们用来存储NLS(National Language Support)数据。
LONG LONG 数据类型是一个遗留下来的而且在将来不会被支持的数据类型。它将被LOB(Large Object)数据类型所代替。
比较规则 Varchar2和char数据类型根据尾部的空格有不同的比较规则。对Char型数据,尾部的空格将被忽略掉,对于Varchar2型数据尾部带空格的数据排序比没有空格的要大些。比如:
Char 型数据: ‘YO’=‘YO ’
Varchar2型数据: ‘YO’<’YO ’
Numberic 数据类型
Numberic 数据类型用来存储负的和正的整数、分数和浮点型数据,范围在-1*10-103 和9.999…99*10125之间,有38位的精确度。标识一个数据超出这个范围时就会出错。
Number(
,) Number数据类型存储一个有p位精确度的s位等级的数据。
DATE 数据类型
DATE 数据类型用来存储日期和时间格式的数据。这种格式可以转换为其他格式的数据去浏览,而且它有专门的函数和属性用来控制和计算。以下的几种信息都包含在DATE数据类型中:
Century
Year
Month
Day
Hour
Minute
Second
LOB 数据类型
LOB(Large Object) 数据类型存储非结构化数据,比如二进制文件,图形文件,或其他外部文件。LOB 可以存储到4G字节大小。数据可以存储到数据库中也可以存储到外部数据文件中。LOB数据的控制通过DBMS_LOB 包实现。BLOB, NCLOB, 和CLOB 数据可以存储到不同的表空间中,BFILE存储在服务器上的外部文件中。LOB数据类型有以下几种:
BLOB: 二进制数据
CLOB: 字符型数据
BFILE: 二进制文件
其他数据类型
ROWID ROWID 数据类型是ORACLE数据表中的一个伪列,它是数据表中每行数据内在的唯一的标识。
⑤ Oracle数据库中什么字段类型能保存'0'字符
目前Oracle 数据库大概有26个字段类型,大体分为六类,分别是字符串类型、数字数据类型、日期时间数据类型、大型对象(LOB)数据类型、RAW和LONG RAW数据类型、ROWID和UROWID数据类型。当然Oracle还提供用户自定义的数据类型,但在我这篇不做讨论。
字符串类型
Char
char数据类型存储固定长度的字符值。一个CHAR数据类型可以包括1到2000个字符。如果对CHAR没有明确地说明长度,它的默认长度则设置为1。 如果对某个CHAR类型变量赋值,其长度小于规定的长度,那么Oracle自动用空格填充。
注意:如果给了一个比固定长度更长的值,其尾部带有空格,则空格会被删除到固定的长度。如果值太大Oracle会返回一个错误,
Varchar
用于保存变长的字符串数据。其中最大字节长度由(size)指定。每行长度可变,最大长度为每行4000字节。设置长度(size)前需考虑字符集为单字节或多字节。
注意:varchar是被废弃的类型,oracle目前都推荐使用varchar2。虽然varchar也可以用,但不确保未来的版本是否还支持
Varchar2
用于保存变长的字符串数据。其中最大字节长度由(size)指定。每行长度可变,最大长度为每行4000字节。设置长度(size)前需考虑字符集为单字节或多字节。由于VARCHAR2数据类型只存储为该列所赋的字符(不加空格),所以VARCHAR2需要的存储空间比CHAR数据类型要小。
区别:varchar2把所有字符都占两字节处理(一般情况下),varchar只对汉字和全角等字符占两字节,数字,英文字符等都是一个字节;VARCHAR2把空串等同于null处理,而varchar仍按照空串处理;大部分情况下建议使用varchar2类型,可以保证更好的兼容性。
Nchar
Unicode数据类型,根据字符集而定的固定长度字符串,最大长度2000bytes。
Nvarchar2
Unicode数据类型,根据字符集而定的可变长度字符串,最大长度4000bytes。
Long
可变长字符列,最大长度限制为2GB,用于不需要作字符串搜索的长串数据。
说明:此类型是一个遗留下来的而且将来不会被支持的数据类型,逐渐被BLOB,CLOB,NCLOB等大的数据类型所取代。
数字类型
Number
NUMBER数据类型精度可以高达38位,它有两个限定符,如:column NUMBER(precision,scale)。precision表示数字中的有效位。如果没有指定precision的话,Oracle将使用38 作为精度。scale表示小数点右边的位数,scale默认设置为0。如果把scale设成负数,Oracle将把该数字取舍到小数点左边的指定位数。
Decimal
Oracle只是在语法上支持decimal类型,但是在底层实际上它就是number类型,支持decimal类型是为了能把数据从Oracle数据库移到其他数据库中。
Float
FLOAT类型也是NUMBER的子类型。其格式Float(n),数 n 指示位的精度,可以存储的值的数目。N 值的范围可以从1 到 126。若要从二进制转换为十进制的精度,请将n 乘以 0.30103。要从十进制转换为二进制的精度,请用 3.32193乘小数精度。126 位二进制精度的最大值是大约相当于 38 位小数精度。
BINARY_FLOAT
BINARY_FLOAT 是一种 32 位,单精度浮点数字数据类型。每个 BINARY_FLOAT 值需要5 字节存储空间,其中 1字节用于存储数据值的长度。支持 NUMBER 数据类型所提供的基本功能。但采用二进制精度,而NUMBER 采用十进制精度。因此能够提供更快的数学运算速度,且能减少占用的存储空间。
BINARY_DOUBLE
BINARY_DOUBLE 是一种 64 位,双精度浮点数字数据类型。每个 BINARY_DOUBLE 值需要9 字节存储空间,其中1 字节用于存储数据值的长度。支持 NUMBER 数据类型所提供的基本功能。但采用二进制精度,而NUMBER 采用十进制精度。因此能够提供更快的数学运算速度,且能减少占用的存储空间。
日期数据类型
Date
ORACLE最常用的日期类型,它可以保存日期和时间,常用日期处理都可以采用这种类型。DATE表示的日期范围可以是公元前4712年1月1日至公元9999年12月31日。
date类型在数据库中的存储固定为7个字节, 第1字节:世纪+100、 第2字节:年、第3字节:月、第4字节:天、第5字节:小时+1、第6字节:分+1、第7字节:秒+1。
Timestamp
ORACLE常用的日期类型,它与date的区别是不仅可以保存日期和时间,还能保存小数秒,小数位数可以指定为0-9,默认为6位,所以最高精度 可以到ns(纳秒),数据库内部用7或者11个字节存储,如果精度为0,则用7字节存储,与date类型功能相同,如果精度大于0则用11字节存储。第1字节:世纪+100、第2字节:年、第3字节:月、第4字节:天、 第5字节:小时+1、第6字节:分+1、第7字节:秒+1、 第8-11字节:纳秒,采用4个字节存储,内部运算类型为整形
注:TIMESTAMP日期类型如果与数值进行加减运算会自动转换为DATE型,也就是说小数秒会自动去除。
TIMESTAMP WITH TIME ZONE
对TIMESTAMP进行了扩展,用于存储时区。时间戳以及时区位移值,其中fractional_seconds_precision是数字在第二日期时间字段的小数部分数字的所有值。可接受的值是0到9。默认是6。默认格式是确定明确的NLS_DATE_FORMAT参数或隐式的NLS_TERRITORY参数。大小固定为13字节。此数据类型包含日期时间字段YEAR,MONTH,日,小时,分钟,秒TIMEZONE_HOUR和TIMEZONE_MINUTE。它有一个明确的分数秒和时区。
TIMESTAMP WITH LOCAL TIME ZONE
所有的TIMESTAMP WITH TIME ZONE值,但下列情况除外:数据标准化数据库的时区时,存储在数据库中。当数据被检索,用户可以看到在会话时区中的数据。
默认格式是确定明确的NLS_DATE_FORMAT参数或隐式的NLS_TERRITORY参数。的大小不同的7至11个字节,取决于精度。
INTERVAL YEAR TO MONTH
存储期间年数和月的时间,其中year_precision是数字的年份日期时间字段的数量。可接受的值是0到9。默认是2。大小固定为5个字节。
INTERVAL DAY TO SECOND
其格式为:INTERVAL DAY [(day_precision)] TO SECOND [(fractional_seconds)],是存储一段时间以天,小时,分钟和秒,其中day_precision是数字在DAY日期时间字段的最大数量。可接受的值是0到9。默认是2。fractional_seconds_precision是数字中的第二个字段的小数部分的数量。可接受的值是0到9。默认是6。大小固定为11个字节。
INTERVAL YEAR TO MONTH
Oracle语法:INTERVAL YEAR [(year_precision )] TO MONTH,用来表示一段时间差, 只精确到年和月. year_precision是数字年的时间段,接受的值为0到9。默认值是2。大小固定为5个字节。
大型对象(LOB)数据类型
Clob
最大4G,存储单字节字符型数据。适用于存储超长文本。
Nclob
最大4G,存储多字节国家字符型数据。适用于存储超长文本。
Blob
最大4G,存储二进制数据。适用于存储图像、视频、音频等。
BFile
最大长度是4GB,在数据库外部保存的大型二进制对象文件,最大长度是4GB。这种外部的LOB类型,通过数据库记录变化情况,但是数据的具体保存是在数据库外部进行的。 Oracle 可以读取、查询BFILE,但是不能写入,不参与事务。
RAW和LONG RAW数据类型
RAW
raw(n)格式,其中n=1 to 2000,可变长二进制数据,在具体定义字段的时候必须指明最大长度n,Oracle 用这种格式来保存较小的图形文件或带格式的文本文件,如Miceosoft Word文档。raw是一种较老的数据类型,将来会逐渐被BLOB、CLOB、NCLOB等大的对象数据类型所取代。
LONG RAW
最大长度是2GB。可变长二进制数据,最大长度是2GB。Oracle 用这种格式来保存较大的图形文件或带格式的文本文件,如Miceosoft Word文档,以及音频、视频等非文本文件。在同一张表中不能同时有long类型和long raw类型,long raw也是一种较老的数据类型,将来会逐渐被BLOB、CLOB、NCLOB等大的对象数据类型所取代。
ROWID和UROWID数据类型
Rowid
ROWID为该表行的唯一标识,是一个伪列,可以用在SELECT中,但不可以用INSERT, UPDATE来修改该值。ROWID列,Oracle使用ROWID列来建立内部索引。你可以引用ROWID的值,但ROWID并不存放在数据库中,你可以创建一个表包含ROWID数据类型。但Oracle不保证该值是合法的rowids。用户必须确保该rowid值是真实合法的。
Urowid
UROWID支持逻辑和物理的rowids,列UROWID类型可以存储各种rowids, 从8.1以后的Oracle才有UROWID类型,它也可以用来保存以前的ROWID类型数据信息。
特殊数据类型
Xmltype
XMLType是Oracle从9i开始特有的数据类型,是一个继承了Blob的强大存在,可以用来存储xml并提供了相当多的操作函数,用来直接读取xml文档和管理节点。理论上可以保存2G大小的数据。作为XML数据的特殊存储类型。Xmltype提供了适合的保存、检索和操作的支持。
Xmlindex
XMLIndex 索引可用于 SQL/XML 函数 XMLExists()、XMLTable() 和 XMLQuery(),而且它在查询的任何部分都有效;它并不限于用在 WHERE 子句中。而您可能用于 XML 数据的其他任何索引都无法做到这一点。
XMLIndex 因此可提高对 SELECT 列表数据和 FROM 列表数据的访问速度,对 XML 片段提取尤为有用。基于函数的索引和 CTXXPath 索引。您无需预先了解将在查询中使用的XPath 表达式。XMLIndex 完全是通用的,而基于函数的索引则不同。可将 XMLIndex 索引用于基于 XML 模式或非基于模式的数据。它可用于二进制 XML 和非结构化存储模型。B 树索引仅适用于以对象关系方式存储(结构化存储)的基于模式的数据;它对于存储在二进制XML 或CLOB 实例中的基于 XML 模式的数据效率低下。可使用 XMLIndex 索引通过 XPath 表达式进行搜索,这些表达式的目标是集合(即文档中出现多次的节点)。而函数索引则不然。