2022年江苏理工学院计算机科学与技术专业《数据库原理》科目期末
试卷B(有答案)
一、填空题
1、采用关系模型的逻辑结构设计的任务是将E-R图转换成一组______,并进行______处理。 2、设某数据库中有作者表(作者号,城市)和出版商表(出版商号,城市),请补全如下查询语句,使该查询语句能查询作者和出版商所在的全部不重复的城市。SELECT城市FROM作者表_____
SELECT城市FROM出版商表;
3、关系数据库中基于数学的两类运算是______________和______________。
4、DBMS的完整性控制机制应具备三个功能:定义功能,即______;检查功能,即______;最后若发现用户的操作请求使数据违背了完整性约束条件,则采取一定的动作来保证数据的完整性。
5、主题在数据仓库中由一系列实现。一个主题之下表的划分可按______、______数据所属时间段进行划分,主题在数据仓库中可用______方式进行存储,如果主题存储量大,为了提高处理效率可采用______方式进行存储。
6、完整性约束条件作用的对象有属性、______和______三种。
7、在SELECT命令中,______子句用于选择满足给定条件的元组,使用______子句可按指定列的值分组,同时使用______子句可提取满足条件的组。
8、设某数据库中有商品表(商品号,商品名,商品类别,价格)。现要创建一个视图,该视图包含全部商品类别及每类商品的平均价格。请补全如下语句: CREATE VIEW V1(商品类别,平均价格)AS SELECT商品类别,_____FROM商品表GROUP BY商品类别;
9、已知系(系编号,系名称,系主任,电话,地点)和学生(学号,姓名,性别,入学日期,专业,系编号)两个关系,系关系的主码是______________,系关系的外码是______________,学生关系的主码是______________,外码是______________。
10、SQL Server中数据完整性包括______、______和______。
二、判断题
11、可以用UNION将两个查询结果合并为一个查询结果。( ) 12、投影操作是对关系表进行水平方向的分割。( ) 13、一个数据表只能有一个唯一索引。( )
14、关系中任何一列的属性取值是不可再分的数据项,可取自不同域中的数据。( ) 15、数据库的数据项之间无联系,记录之间存在联系。( ) 16、关系是一张二维表。( )
17、在SELECT语句中,需要对分组情况满足的条件进行判断时,应使用WHERE子句。( )
18、等值连接与自然连接是同一个概念。( ) 19、文件系统的缺点是数据不能长期存储。( ) 20、数据库模式和实例是一回事。( )
21、在一个关系中,不同的列可以对应同一个域,但必须具有不同的列名。( ) 22、在数据表中,空值表示不确定。( )
23、在SQL中,ALTERTABLE语句中MODIFY用于修改字段的类型和长度等,ADD用于添加新的字段。( )
24、并发执行的所有事务均遵守两段锁协议,则对这些事务的任何并发调度策略都是可串行化的。( )
25、可串行化的调度一定遵守两段锁协议。( )
三、选择题
26、设关系R(A,B,C)和S(B,C,D),下列各关系代数表达式不成立的是( )。 A.R÷S
B.πB(R)∪πB(S) C.R∩S D.R⋈S
27、用于数据库恢复的重要文件是( )。
A.数据库文件B.索引文件 C.日志文件 D.备注文件
28、设计性能较优的关系模式称为规范化,规范化主要的理论依据是( )。A.关系规范化理论B.关系运算理论 C.关系代数理论D.数理逻辑
29、关于DBMS的查询处理器,叙述错误的是( )。
A.处理的目标是先将应用程序表示的查询转换为执行策略(关系代数) B.通过执行用低级语言表达的策略来获取所需要的数据
C.查询处理分为分解(分析和验证)、优化、代码生成和代码执行
D.处理的目标是先将应用程序表示的查询转换为执行策略(E-R 概念模型)
30、根据系统所提供的存取路径,选择合理的存取策略,这种优化方式称为( A.物理优化 B.代数优化 C.规则优化D.代价估算优化
31、下列哪个函数能将一个表达式从一种数据类型改变为另一种数据类型?( A.COUNT(*) B.COUNT(*) C.CONVERT(*)D.AVG(*)
)。 )32、设E是关系代数表达式,F是选取条件表达式,并且只涉及A1,…,An属性,则有( )。
A.бF(πA1,…,An(E))≡πA1,…,An(бF(E)) B.бF(πA1,…,An(E))≡πA1,…,An(E) C.бF(πA1,…,An(E))≡πA1(бF(E))
D.πA1,…,An(бF(E))≡πA1,…,An(бF(πA1,…,An,B1,…,Bm(E)))
33、如表,因为( )属性使它不能成为关系。 表
A.项目经理 B.项目成员 C.项目名称D.项目号 34、信息是有价值的,信息的价值与( )有关。 A.正确性、及时性、完整性、开放性和可靠性 B.正确性、及时性、完整性和可靠性 C.正确性、完整性、开放性和可靠性 D.正确性、及时性、完整性和开放性
35、关于查询优化问题,下列说法错误的是( )。
A.将频繁地向数据库发送的某条查询语句用存储过程来代替,可以提高查询效率 B.为经常出现在查询条件中的属性建立索引,可以提高查询效率 C.先执行表连接条件,后执行查询条件,有利于提高查询效率
D.将频繁访问的视图物化并进行维护,有利于提高查询效率
36、数据字典是数据库管理系统的重要组成部分,其中存储的各类信息通常由( )。 A.数据库管理员维护 B.程序员维护
C.数据库管理系统维护 D.一般用户维护
37、关于“死锁”,下列说法中正确的是( )。 A.死锁是操作系统中的问题,数据库操作中不存在
B.在数据库操作中防止死锁的方法是禁止两个用户同时操作数据库 C.当两个用户竞争相同资源时不会发生死锁 D.只有出现并发操作时,才有可能出现死锁
38、保护数据库,防止未经授权或不合法的使用造成的数据泄漏、非法更改或破坏。这是指数据的( )。
A.安全性 B.完整性 C.并发控制 D.恢复 39、数据仓库的数据具有4个基本特征,以下错误是指( )。 A.面向主题的 B.集成的 C.不可更新的 D.不随时间变化的
40、OLAP的核心是( )。 A.对用户的快速响应
B.互操作性 C.数据分析 D.以上都不是
四、简答题
41、DBS中有哪些类型的故障?哪些故障破坏了数据库?哪些故障未破坏数据库,但使其中某些数据变得不正确?
42、定义并理解下列术语,说明它们之间的联系与区别: (1)域,笛卡儿积,关系,元组,属性; (2)主码,候选码,外码; (3)关系模式,关系,关系数据库。
43、简述E-R模型、层次模型、网状模型、关系模型和面向对象模型各有哪些优缺点?
44、什么是大数据,简述大数据的分类与基本特征。
45、并发操作可能会产生哪几类数据不一致?用什么方法能避免各种小致的情况?
五、综合题
46、图是有关学生(student)和学习(study)信息的对象联系图。其中,
coursename表示课程名,grade表示成绩,study的city表示求学地,university表示大学,sno表示学号,sname表示姓名,student的 city表示籍贯。 (1) 试解释这个对象联系图。
(2) 试用ORDB的定义语言定义这个数据库。
(3) 试用ORDB的查询语言,分别写出下列查询的SELECT语句: ①检索每个学生的学习课程和成绩。
②检索至少有一门课程的求学地与出生地在同一城市的学生学号和姓名。 (4) 试用ODMG C++ODL定义这个数据库。 学生和学习信息的对象联系图
47、某单位想举行一个小型的联谊会,关系Male记录注册的男宾信息,关系Female记录注册的女宾信息。建立一个断言,将来宾的人数在50人以内。
48、使用嵌入式SQL对学生-课程数据库中的表完成下述功能:
(1) 查询某一门课程的信息。要查询的课程由用户在程序运行过程中指定,放
在主变量中。
(2) 查询选修某一门课程的选课信息,要查询的课程号由用户在程序运行过程
中指定,放在主变量中,然后根据用户的要求修改其中某些记录的成绩字段。
参
一、填空题
1、【答案】关系模式;规范化 2、【答案】EXCEPT
【解析】EXCEPT语句的作用是查询两个数据表中除“公共”数据以外的数据信息,即查询两个数据表中的“除外”数据信息。使用EXCEPT运算符可以实现集合差操作,从左查询中返回右查询没有找到的所有非重复值。 3、【答案】关系代数;关系演算
4、【答案】提供定义完整性约束条件机制;检查用户发出的操作请求是否违背完整性约束条件
5、【答案】数据表;数据的综合;数据库;关系数据库 6、【答案】关系;元组
7、【答案】WHERE;GROUP BY;HAVING 8、【答案】AVG(价格)
【解析】SQL中,AVG(字段名)函数用来计算一组记录中某个字段值的平均值。 9、【答案】系编号;无;学号;系编号
10、【答案】域完整性;实体完整性;参照完整性
二、判断题
11、【答案】对 12、【答案】错 13、【答案】错 14、【答案】错
15、【答案】错 16、【答案】对 17、【答案】错 18、【答案】错 19、【答案】错 20、【答案】错 21、【答案】对 22、【答案】对 23、【答案】错 24、【答案】对 25、【答案】错
三、选择题
26、【答案】C
【解析】R∩S运算也要求R和S具有相同的属性。 27、【答案】C
【解析】用于数据库恢复的重要文件是日志文件和后援副本。 28、【答案】A
【解析】关系数据理论,即关系规范化理论是进行数据库逻辑结构设计的有力工具,通过它,可以判断数据库的逻辑结构设计是否优良,并可以对一个不好的逻辑设计进行改造以使它变得好起来。 29、【答案】D
【解析】DBMS的查询处理器处理的目标是将应用程序表示的查询转换为正确有效的、用低级语言表达的执行策略(关系代数),并通过执行该策略来获取所需要的数据。查询处理通常分为分解(分析和验证)、优化、代码生成和代码执行四个阶段。 30、【答案】A
【解析】物理优化是根据数据字典中的存取路径、数据的存储分布以及聚簇情况等信息来选择低层的存取路径。 31、【答案】C
【解析】CONVERT函数能将某种数据类型的表达式显式转换为另一种数据类型。其他3个都是聚集函数,COUNT( )的功能是统计一列中值的个数;COUNT(*)统计元组个数;AVG( )计算一列值的平均值(此列必须是数值型)。此外,SQL语言中还提供了另一个数据类型转换函数CAST,这两个函数均能将表达式值转换为指定的数据类型,CONVERT可以指定长度,而CAST不能指定长度。 32、A
33、【答案】B
【解析】1NF是关系必须满足的最低要求,没有满足1NF就不称为关系。1NF要求每一个数据项都必须是不可再分的原子数据项。上述“项目”表中,项目成员不是原子数据项,因此,该“项目”表不满足1NF,该表不是关系。 34、【答案】B
【解析】信息的特征体现在它的正确性、及时性、完整性、开放性和可靠性。正确的、及时的、完整的和可靠的信息才具有意义和价值,但是信息是否开放与价值的高低并不成正比,有些保密的或科技机密是极具价值的。 35、【答案】C
【解析】优化查询常见的方法包括:用存储过程代替频繁向数据库发送的查询语句;为经常出现在查询条件中的属性建立索引并创建和维护频繁访问的物化视图;处理含有表连接的查询时应先执行查询条件再进行表连接。 36、【答案】A
【解析】数据字典通常由数据库管理员维护,是一种用户可以访问的记录数据库和应用程序源数据的目录。 37、【答案】D
【解析】不仅操作系统中有死锁问题,数据库系统中也同样存在死锁问题,死锁是在并发操作时上锁不当而出现的。 38、【答案】A
【解析】数据安全性是指防止未经授权或不合法的用户使用数据库。 39、【答案】D
【解析】数据仓库是随时间而变化的,传统的关系数据库系统比较适合处理格式化的数据,能够较好的满足商业商务处理的需求。稳定的数据以只读格式保存,且不随时间改变。 40、【答案】C
【解析】OLAP具有共享信息的快速分析的特征。
四、简答题
41、答:(1)数据库系统中的故障主要有:事务故障、系统故障、介质故障。(2)破坏了数据库的故障是介质故障;未破坏数据库,但使其中某些数据变得不正确的故障是事务故障和系统故障。
42、答:(1)域,笛卡尔积,关系,元组,属性 ①域:一组具有相同数据类型的值的集合。
②笛卡儿积:两个分别为n目和m目的关系R和S的笛卡尔积是一个n +m列的元组的集合。
③关系:在域D1,D2,…,Dn上笛卡尔积D1×D2×…×Dn的子集称为关系,表示为R(D1,D2,…,Dn)。
④元组:关系中的每个元素是关系中的元组。
⑤属性:关系也是一个二维表,表的每行对应一个元组,表的每列对应一个域。由于域可以相同,为了加以区分,必须对每列起一个名字,称为属性。 (2)主码,候选码,外部码
①候选码:关系中能惟一标识一个元组的某一属性组。 ②主码:若一个关系有多个候选码,则选定其中一个为主码。
③外部码:设F是基本关系R的一个或一组属性,但不是关系R的码,如果F与基本关系S的主码Ks相对应,则称F是基本关系R的外部码,简称外码。 (3)关系模式,关系,关系数据库
①关系模式:关系的描述称为关系模式,它可以形式化地表示为: R(U,D,Dom,F),其中R为关系名,U为组成该关系的属性名集合,D为属性组U中属性所来自的域,Dom为属性向域的映射集合,F为属性间数据的依赖关系集合。
②关系:在域D1,D2,…,Dn上笛卡尔积D1×D2×…×Dn的子集称为关系,表示为R(D1,D2,…,Dn)。关系是关系模式在某一时刻的状态或内容。关系模式是静态的、稳定的,而关系是动态的、随时间不断变化的,因为关系操作在不断地更新着数据库中的数据。
③关系数据库:关系数据库有型和值之分。关系数据库的型也称为关系数据库模式,是对关系数据库的描述,它包括若干域的定义以及在这些域上定义的若干关系模式。关系数据库的值是这些关系模式在某一时刻对应的关系的集合,通常就称为关系数据库。
43、答:(1)E-R模型的优缺点
①优点:接近于人的思维,容易理解;与计算机无关,用户容易接受。其缺点是:只能说明实体间语义的联系,不能进一步说明详细的数据结构。层次模型的优点是:结构清晰,表示各结点之间联系的方式简单;容易表示如“家族关系”等现实世界的层次结构的事物及其之间的联系。
②缺点:不能表示两个以上实体型之间的复杂联系和实体型之间的多对多联系;严格的层次顺序使数据插入和删除操作变得复杂,如父结点的删除导致子结点的删除。 (2) 网状模型的优缺点
①优点:能够表示实体之间的多种复杂联系;具有良好的性能,存取效率高。
②缺点:网状模型比较复杂,需要程序员熟悉数据库的逻辑结构;在重新组织数据库时容易失去数据性。 (3) 关系模型的优缺点
①优点:使用表的概念,简单直观;直接表示实体之间的多对多联系:具有更好的数据性;具有坚实的理论基础。 ②缺点:关系模型的连接等操作开销较大,需要较高性能计算机的支持。
(4) 面向对象模型的优缺点
①优点:能够完整描述现实世界的数据结构,具有丰富的表达能力,能表达嵌套、递归的数据结构。
②缺点:涉及的知识面较广,用户较难理解。
44、答:(1)定义
大数据是指无法在可容忍的时间内用现有IT技术和软硬件工具对其进行感知、获取、管理、处理和服务的数据集合。
专家给出的定义:大数据通常被认为是PB(103TB)或EB(1EB= 106TB)或更高数量级的数据,包括结构化的、半结构化的和非结构化的数据。其规模或复杂程度超出了传统数据库和软件技术所能管理和处理的数据集范围。 (2)分类
①海量交易数据(企业OLTP应用)
海量交易数据的应用特点是数据海量、读写操作比较简单、访问和更新频繁、一次交易的数据量大大,但要求支持事务ACID特性。对数据的完整性及安全性要求高,必须保证强一致性。
②海量交互数据(社交网、传感器、全球定位系统、Web信息)海量交互数据的应用特点是实时交互性强,但不要求支持事务特性。其数据的典型特点是类型多样异构、不完备、噪音大、数据增长快,不要求具有强一致性。 ③海量处理数据(企业OLAP应用)
海量处理数据的应用特点是面向海量数据分析,计算复杂,往往涉及多次迭代完成,追求数据分析的高效率,但不要求支持事务特性。(3)大数据的特征 ①巨量
大数据的首要特征是数据量巨大,而且在持续、急剧地膨胀。 ②多样
大数据的多样性通常是指异构的数据类型、不同的数据表示和语释。 ③快变
大数据的快变性也称为实时性,一方面指数据到达的速度很快,另一方而指能够进行处理的时间很短,或者要求响应速度很快,即实时响应。 ④价值
大数据的价值是潜在的、巨大的。大数据不仅具有经济价值和产业价值,还具有科学价值。这是大数据最重要的特点,也是大数据的魅力所在。
45、答:(1)并发操作带来的数据不一致性包括三类:丢失修改、不可重复读和读“脏”数据。
①丢失修改。两个事务T1和T2读入同一数据并修改,T2提交的结果破坏了T1提交的结果,导致T1的修改被丢失。
②不可重复读。不可重复读是指事务T1读取数据后,事务T2执行更新操作,使T1无法再现前一次读取结果。
③读“脏”数据。读“脏”数据是指事务T1修改某一数据,并将其写回磁盘,事务T2读取同一数据后,T1由于某种原因被撤销,这时T1已修改过的数据恢复原值,T2读到的数据就与数据库中的数据不一致,则T2读到的数据就为“脏”数据,即不正确的数据。 (2)产生上述三类数据不一致性的主要原因是并发操作破坏了事务的隔离性。并发控制就是要用正确的方式调度并发操作,使一个用户事务的执行不受其他事务的干扰,从而避免造成数据的不一致性。
五、综合题
46、答:(1)对象student包含学号、姓名、籍贯等属性,对象study包含成绩、课程名、求学地和大学等属性。student和study间联系为1:n。 (2) 使用ORDB定义这个数据库如下:
(3) 对应的ORDB的查询语句如下:
对应的ORDB的查询语句如下:
(4) 使用ODMG C++ODL定义这个数据库的语句如下:
47、答:
48、答:
(1)
(2)