目录

数据库系统基本概念

数据、数据库、数据库管理系统、数据库系统的基本概念及相关内容;

数据管理技术的发展过程;

数据库系统阶段的特点;

数据独立性的含义;

数据模型的定义;

概念模型、逻辑模型,概念模型向关系模型转换的原则+常见的数据模型如层次模型、网状模型和关系模型等的优缺点;

数据库系统的体系结构,三级模式结构和二级映象功能。

数据库系统的组成。

关系模型的三个组成部分及各部分所包括的主要内容+关系的三类完整性约束的概念;

关系代数及其运算规则,5种基本关系运算;关系演算语言的特点;

数据库系统基本概念

数据、数据库、数据库管理系统、数据库系统的基本概念及相关内容;
  • 数据:描述事物的符号记录

  • 数据库(DB):长期存储在计算机内,有组织的、可共享的大量数据的集合

    • 按一定数据模型组织、描述和存储

    • 具有较小的冗余度,较大的数据独立性和易扩展性

    • 为各种用户所共享

总结:数据库的数据具有永久存储有组织可共享三个基本特点

  • 数据库管理系统(DBMS):是位于用户和操作系统之间的一层数据管理软件

    • 数据定义功能:数据库管理系统提供数据定义语言(DDL),用户可以通过该语言方便对数据库的数据对象的组成和结构进行定义

    • 数据组织、存储和管理的功能

    • 数据操纵功能:提供数据操纵语言(DML),用户可以通过这个语言操纵数据,实现对数据的基本操作

    • 数据库的事物管理和运行管理:保证数据的安全性、完整性、多用户对数据的并发使用及发生故障后的系统恢复

    • 数据库的建立和维护功能:数据库的转储、恢复功能,数据库的重组织功能和性能监视、分析功能等

  • 数据库系统(DBS):由数据库、数据库管理系统(及其应用开发工具)、应用程序和数据库管理员(DBA)组成的存储、管理、处理和维护数据的系统

    • 有时会称数据库系统为数据库

数据管理技术的发展过程;
  • 人工管理阶段

    • 计算机主要用于科学计算:不会将数据长期保存

    • 软件没有操作系统,没有管理数据的专门的软件:数据需要有应用程序自己设计、说明和管理,没有相应的软件系统负责数据的管理工作

    • 数据处理方式是批处理

    • 外存只有卡片、磁带,没有直接存取的磁盘等存储设备

    • 数据不会共享:程序和程序之间存在大量的冗余数据,多个应用程序涉及相同的数据必须自己定义,无法相互利用、参照

    • 数据不具有独立性:必须依赖应用程序,一旦数据的逻辑结构或者物理结构发生改变之后,相应程序必须进行修改

  • 文件系统阶段

    • 硬件方面:已存在磁盘、磁鼓等直接用于存取存储的设备→数据可以长期保存

    • 软件方面:操作系统已经有了专门的数据管理软件,一般称为文件系统→有专门的软件及文件系统进行数据管理,文件系统把数据组成相互独立的数据文件,实现记录内的结构性

    • 处理方式:批处理,可以进行联机实时处理

    • 缺点:

      • 数据共享性差,冗余度大

      • 数据独立性差

  • 数据库系统阶段

    • 数据量急剧增长

    • 多种应用、多种语言互相覆盖地共享数据集合的要求越来越强烈

    • 软件开发和维护的成本越来越高

数据库系统阶段的特点;
  • 数据结构化:数据库系统实现整体数据的结构化,这是数据库的主要特征之一,也是数据库系统与文件系统的本质区别

  • 数据的共享性高、冗余度低且易扩充

  • 数据独立性高

    • 物理独立性:用户的应用程序与数据库中的数据的物理存储是相互独立的

    • 逻辑独立性:用户的应用程序与数据库的逻辑结构是相互独立的

  • 数据由数据库管理系统统一管理和控制

    • 数据的安全性保护:指保护数据以防止不合法使用造成的数据泄密和破坏

    • 数据的完整性检查:指数据的正确性、有效性、相容性

    • 并发控制

    • 数据库恢复

数据库系统的出现使信息系统从以加工数据的程序为中心转向围绕共享的数据库为中心的新阶段

数据独立性的含义;
  • 数据独立性:是借助数据库管理系统的一个显著优点,是由数据库管理系统提供的二级映像功能来保证,可以将数据的定义从程序中分离出去,减少了应用程序的维护和修改

    • 物理独立性:用户的应用程序与数据库中的数据的物理存储是相互独立的→数据物理存储改变时应用程序不用改变

    • 逻辑独立性:用户的应用程序与数据库的逻辑结构是相互独立的→数据的逻辑结构改变时用户程序也不会改变

数据模型的定义;
  • 数据模型:是一种模型,对现实世界数据特征的抽象→描述数据、组织数据和对数据进行操作的。数据模型是数据库系统的核心和基础

    • 能比较真实地模拟现实世界

    • 容易为人所理解

    • 便于在计算机上实现

  • 数据库系统开发中根据不同情况将模型分为两种

    • 第一类

      • 概念模型(信息模型)

    • 第二类

      • 逻辑模型:层次模型、网状模型、关系模型、面向对象数据模型…..

      • 物理模型:对数据最底层的抽象,描述数据在系统内部的表示方法和存取方法,是面向计算机系统的

概念模型、逻辑模型,概念模型向关系模型转换的原则+常见的数据模型如层次模型、网状模型和关系模型等的优缺点;
  • 概念模型:现实世界→机械世界,用于信息世界(主要涉及实体、属性、码、实体型、实体集、联系)的建模

    • 表示方法:实体-联系方法(E-R方法/E-R模型)

  • 数据模型

    • 组成要素:数据结构、数据操作、数据的完整性约束

    • 常用数据模型:层次模型、网状模型、关系模型、面向对象模型、对象关系数据模型、半结构化数据模型

      • 层次模型:数据库系统采用层次模型作为数据的组织方式有且仅有

        • 有且只有一个结点没有双亲结点,这个结点为根结点

        • 根以外的其他结点有且仅有一个双亲结点

        • 优缺点:

          • 简单清晰

          • 查询效率高

          • 良好的完整性支持

          • 不适合于多对多模型

          • 会引入冗余数据

          • 子女结点必须通过双亲结点

          • 层次命令趋近程序化

      • 网状模型:

        • 允许一个以上的结点无双亲

        • 一个节点可以有多于一个的双亲

        • 关系可以不唯一

        • 优缺点:

          • 描述更直接

          • 存取效率高

          • 结构复杂,不利于用户掌握

          • 需要嵌入高级语言,不理用户理解

          • 联系是通过存取路径实现,用户必须了解系统结构,加重负担

      • 关系模型:

        • 元组(表中一行)、关系、属性(表中一列)、码、域、分量

        • 关系必须规范化

        • 每一个分量必须是不可分的数据项

        • 优缺点:

          • 建立在严格的数学概念上的模型

          • 概念单一

          • 存取路径对用户透明,数据独立性高,保密性高

          • 查询效率低

  • 逻辑模型

  • 概念模型→关系模型转换的原则

数据库系统的体系结构,三级模式结构和二级映象功能。
  • 数据库系统的模式结构(体系功能):三级模式结构和二级映像功能

  • 数据模型有“型”(对某一类数据的结构和性别的说明)和“值”(型的具体赋值)

  • 模式是数据库全体数据的逻辑结构和特征的描述,相对稳定。

  • 实例是模式的一个具体值,一个模式可以有很多实例,实例是相对变动的。

  • 三级模式结构:是数据的三个抽象级别

    • 模式:也称逻辑模式,是数据库中全体数据的逻辑结构和特征的描述,是所有用户的公共数据视图。是数据库系统模式的中间层。提供模式数据定义语言(模式DDL)来严格定义模式。

    • 外模式:也称子模式或者用户模式,是数据库用户能够看见和使用的局部数据的逻辑结构和特征的描述,是数据库用户的数据视图,是与某应用有关的数据的逻辑表示。

    • 内模式:又称存储模式,一个数据库只有一个内模式。他是数据物理结构和存储方式的描述,是数据在数据库内部的组织方式。

  • 二层映像:保证数据库系统的数据能够具有较高的逻辑独立性和物理独立性。

    • 外模式/模式映像:模式→数据的全局逻辑结构,外模式→数据的局部逻辑结构。管理员对各个外模式/模式映像改变,可以使外模式保持不变。

    • 模式/内模式映像:是唯一的,定义了数据全局逻辑结构与存储结构之间的对应关系。管理员对各个模式/内模式映像改变,可以使模式保持不变

数据库系统的组成。
  • 数据库系统一般由数据库、数据库管理系统(及其应用开发工具)、应用程序、数据库管理员

    • 硬件平台及数据库

      • 内存

      • 磁盘

      • 通道

    • 软件

      • 数据库管理系统

      • 操作系统

      • 编译系统及高级语言

      • 数据库应用管理系统

      • 应用开发工具

    • 人员

      • 数据库管理员(DBA)

        • 决定数据库中的信息内容和结构

        • 决定数据库的存储结构和存取策略

        • 定义数据的安全性要求和完整性约束条件

        • 监控数据库的使用和运行

        • 数据库的重组改进和重构

      • 系统分析员和数据库设计人员

      • 应用程序员

      • 用户:最终用户

        • 偶然用户:不常访问

        • 简单用户:主要查询和更新数据库

        • 复杂用户:熟悉数据库各种功能

关系模型的三个组成部分及各部分所包括的主要内容+关系的三类完整性约束的概念;
  • 关系模型由关系数据结构、关系操作集合、关系完整性约束。

  • 关系模型的数据结构:只包含单一的数据结构——关系。

    • 关系有三种类型:基本关系、查询表、视图表

    • 关系模式:关系的描述

    • 关系数据库:关系数据库的型为关系数据库模式,关系数据库的值是这些关系模式在某一时刻对应的关系的集合,通常称为关系数据库

  • 关系操作集合:查询、插入、删除、修改

    • 基本操作:选择、投影、并、差、笛卡儿积,还有其他操作:除、连接、交……

    • 关系操作的特点:集合操作方式,即操作的对象和结果都是集合

  • 关系数据库语言:

    • 关系代数语言(ISBL)

    • 关系演算语言

      • 元组关系演算语言

      • 域关系演算语言

    • 具有关系代数和关系演算双重特点的语言(SQL:是一种高度非过程化语言)

  • 关系模型完整性约束:完整性规则是对关系的某种约束条件

    • 有三种完整性约束:实体完整性、参照完整性、用户定义的完整性。前两个完整性是关系模型必须满足的条件,被称为关系的两个不变性。

      • 实体完整性:唯一确定一个关系的属性为主码。主码的取值不能为空;

      • 参照完整性:可以取空值也可以为某个元组主码值;

      • 用户自定义完整性;

关系代数及其运算规则,5种基本关系运算;关系演算语言的特点;
  • 关系代数:用对关系的运算来表达查询。分为传统集合运算和专门关系运算。

    • 传统的集合是二目运算,包括并、交、差、笛卡儿积四种运算。

    • 专门的关系运算:选择、投影、连接、除运算。

      • 连接:

        • 自然连接:特殊的等值连接,可以把结果中重复的属性列去掉

        • 等值连接:=