Python学习之路-Django基础:数据库

ORM框架

简介

O是object,也就类对象的意思,R是relation,翻译成中文是关系,也就是关系数据库中数据表的意思,M是mapping,是映射的意思。在ORM框架中,它帮我们把类和数据表进行了一个映射,可以让我们通过类和类对象就能操作它所对应的表格中的数据。ORM框架还有一个功能,它可以根据我们设计的类自动帮我们生成数据库中的表格,省去了我们自己建表的过程。

django中内嵌了ORM框架,不需要直接面向数据库编程,而是定义模型类,通过模型类和对象完成数据表的增删改查操作。

使用django进行数据库开发的步骤如下:

  1. 配置数据库连接信息
  2. 在models.py中定义模型类
  3. 迁移
  4. 通过类和对象完成数据增删改查操作

配置

  • 在settings.py中保存了数据库的连接配置信息,Django默认初始配置使用sqlite数据库。

    DATABASES = {'default': {'ENGINE': 'django.db.backends.sqlite3','NAME': os.path.join(BASE_DIR, 'db.sqlite3'),}}
  • 使用MySQL数据库首先需要安装驱动程序

    pip install PyMySQL
  • 在Django的工程同名子目录的__init__.py文件中添加如下语句

    from pymysql import install_as_MySQLdbinstall_as_MySQLdb()

    作用是让Django的ORM能以mysqldb的方式来调用PyMySQL。

  • 修改DATABASES配置信息

    DATABASES = {'default': {'ENGINE': 'django.db.backends.mysql','HOST': '127.0.0.1',# 数据库主机'PORT': 3306,# 数据库端口'USER': 'root',# 数据库用户名'PASSWORD': 'mysql',# 数据库用户密码'NAME': 'django_demo'# 数据库名字}}
  • 在MySQL中创建数据库

    create database django_demo default charset=utf8;

定义模型类

简介

模型类被定义在”应用/models.py”文件中。,模型类必须继承自Model类,位于包django.db.models中。

定义

创建应用booktest,在models.py 文件中定义模型类。

from django.db import models#定义图书模型类BookInfoclass BookInfo(models.Model):btitle = models.CharField(max_length=20, verbose_name='名称')bpub_date = models.DateField(verbose_name='发布日期')bread = models.IntegerField(default=0, verbose_name='阅读量')bcomment = models.IntegerField(default=0, verbose_name='评论量')is_delete = models.BooleanField(default=False, verbose_name='逻辑删除')class Meta:db_table = 'tb_books'# 指明数据库表名verbose_name = '图书'# 在admin站点中显示的名称verbose_name_plural = verbose_name# 显示的复数名称def __str__(self):"""定义每个数据对象的显示信息"""return self.btitle#定义英雄模型类HeroInfoclass HeroInfo(models.Model):GENDER_CHOICES = ((0, 'male'),(1, 'female'))hname = models.CharField(max_length=20, verbose_name='名称') hgender = models.SmallIntegerField(choices=GENDER_CHOICES, default=0, verbose_name='性别')hcomment = models.CharField(max_length=200, null=True, verbose_name='描述信息') hbook = models.ForeignKey(BookInfo, on_delete=models.CASCADE, verbose_name='图书')# 外键is_delete = models.BooleanField(default=False, verbose_name='逻辑删除')class Meta:db_table = 'tb_heros'verbose_name = '英雄'verbose_name_plural = verbose_namedef __str__(self):return self.hname
  • 数据库表名

    模型类如果未指明表名,Django默认以 小写app应用名_小写模型类名 为数据库表名。

    可通过db_table 指明数据库表名。

  • 关于主键

    django会为表创建自动增长的主键列,每个模型只能有一个主键列,如果使用选项设置某属性为主键列后django不会再创建自动增长的主键列。

    默认创建的主键列属性为id,可以使用pk代替,pk全拼为primary key。

  • 属性命名限制

    • 不能是python的保留关键字。

    • 不允许使用连续的下划线,这是由django的查询方式决定的。

    • 定义属性时需要指定字段类型,通过字段类型的参数指定选项,语法如下:

      属性=models.字段类型(选项)
  • 字段类型

    类型说明
    AutoField自动增长的IntegerField,通常不用指定,不指定时Django会自动创建属性名为id的自动增长属性
    BooleanField布尔字段,值为True或False
    NullBooleanField支持Null、True、False三种值
    CharField字符串,参数max_length表示最大字符个数
    TextField大文本字段,一般超过4000个字符时使用
    IntegerField整数
    DecimalField十进制浮点数, 参数max_digits表示总位数, 参数decimal_places表示小数位数
    FloatField浮点数
    DateField日期, 参数auto_now表示每次保存对象时,自动设置该字段为当前时间,用于”最后一次修改”的时间戳,它总是使用当前日期,默认为False; 参数auto_now_add表示当对象第一次被创建时自动设置当前时间,用于创建的时间戳,它总是使用当前日期,默认为False; 参数auto_now_add和auto_now是相互排斥的,组合将会发生错误
    TimeField时间,参数同DateField
    DateTimeField日期时间,参数同DateField
    FileField上传文件字段
    ImageField继承于FileField,对上传的内容进行校验,确保是有效的图片
  • 选项

    选项说明
    null如果为True,表示允许为空,默认值是False
    blank如果为True,则该字段允许为空白,默认值是False
    db_column字段的名称,如果未指定,则使用属性的名称
    db_index若值为True, 则在表中会为此字段创建索引,默认值是False
    default默认
    primary_key若为True,则该字段会成为模型的主键字段,默认值是False,一般作为AutoField的选项使用
    unique如果为True, 这个字段在表中必须有唯一值,默认值是False

    null是数据库范畴的概念,blank是表单验证范畴的

  • 外键

    在设置外键时,需要通过on_delete选项指明主表删除数据时,对于外键引用表数据如何处理,在django.db.models中包含了可选常量:

    • CASCADE 级联,删除主表数据时连通一起删除外键表中数据

    • PROTECT 保护,通过抛出ProtectedError异常,来阻止删除主表中被外键应用的数据

    • SET_NULL 设置为NULL,仅在该字段null=True允许为null时可用

    • SET_DEFAULT 设置为默认值,仅在该字段设置了默认值时可用

    • SET() 设置为特定值或者调用特定方法,如

      from django.conf import settingsfrom django.contrib.auth import get_user_modelfrom django.db import modelsdef get_sentinel_user():return get_user_model().objects.get_or_create(username='deleted')[0]class MyModel(models.Model):user = models.ForeignKey(settings.AUTH_USER_MODEL,on_delete=models.SET(get_sentinel_user),)
    • DO_NOTHING 不做任何操作,如果数据库前置指明级联性,此选项会抛出IntegrityError异常

迁移

将模型类同步到数据库中。

  • 生成迁移文件

    python manage.py makemigrations
  • 同步到数据库中

    python manage.py migrate

数据库操作

增加

增加数据有两种方法。

  • save,通过创建模型类对象,执行对象的save()方法保存到数据库中。

    >>> from datetime import date>>> book = BookInfo(btitle='西游记',bput_date=date(1988,1,1),bread=10,bcomment=10)>>> book.save()>>> hero = HeroInfo(hname='孙悟空',hgender=0,hbook=book)>>> hero.save()>>> hero2 = HeroInfo(hname='猪八戒',hgender=0,hbook_id=book.id)>>> hero2.save()
  • create,通过模型类.objects.create()保存。

    >>> HeroInfo.objects.create(hname='沙悟净',hgender=0,hbook=book)<HeroInfo: 沙悟净>
查询
基本查询
  • get 查询单一结果,如果不存在会抛出模型类.DoesNotExist异常。

  • all 查询多个结果。

  • count 查询结果数量。

    >>> BookInfo.objects.all()<QuerySet [<BookInfo: 射雕英雄传>, <BookInfo: 天龙八部>, <BookInfo: 笑傲江湖>, <BookInfo: 雪山飞狐>, <BookInfo: 西游记>]>>>> book = BookInfo.objects.get(btitle='西游记')>>> book.id5>>> BookInfo.objects.get(id=3)<BookInfo: 笑傲江湖>>>> BookInfo.objects.get(pk=3)<BookInfo: 笑傲江湖>>>> BookInfo.objects.get(id=100)Traceback (most recent call last):File "", line 1, in <module>File "/Users/delron/.virtualenv/dj/lib/python3.6/site-packages/django/db/models/manager.py", line 85, in manager_methodreturn getattr(self.get_queryset(), name)(*args, **kwargs)File "/Users/delron/.virtualenv/dj/lib/python3.6/site-packages/django/db/models/query.py", line 380, in getself.model._meta.object_namedb.models.DoesNotExist: BookInfo matching query does not exist.>>> BookInfo.objects.count()6
过滤查询

实现SQL中的where功能,包括

  • filter 过滤出多个结果
  • exclude 排除掉符合条件剩下的结果
  • get 过滤单一结果

对于过滤条件的使用,上述三个方法相同,故仅以filter进行讲解。

过滤条件的表达语法如下:

属性名称__比较运算符=# 属性名称和比较运算符间使用两个下划线,所以属性名不能包括多个下划线
相等

exact:表示判等。

例:查询编号为1的图书。

BookInfo.objects.filter(id__exact=1)可简写为:BookInfo.objects.filter(id=1)
模糊查询

contains:是否包含。

{{}}

如果要包含%无需转义,直接写即可。

{{}}

例:查询书名包含’传’的图书。

BookInfo.objects.filter(btitle__contains='传')

startswith、endswith:以指定值开头或结尾。

例:查询书名以’部’结尾的图书

BookInfo.objects.filter(btitle__endswith='部')

{{}}

以上运算符都区分大小写,在这些运算符前加上i表示不区分大小写,如iexact、icontains、istartswith、iendswith.

{{}}

空查询

isnull:是否为null。

例:查询书名不为空的图书。

BookInfo.objects.filter(btitle__isnull=False)
范围查询

in:是否包含在范围内。

例:查询编号为1或3或5的图书

BookInfo.objects.filter(id__in=[1, 3, 5])
比较查询
  • gt 大于 (greater then)
  • gte 大于等于 (greater then equal)
  • lt 小于 (less then)
  • lte 小于等于 (less then equal)

例:查询编号大于3的图书

BookInfo.objects.filter(id__gt=3)

不等于的运算符,使用exclude()过滤器。

例:查询编号不等于3的图书

BookInfo.objects.exclude(id=3)
日期查询

year、month、day、week_day、hour、minute、second:对日期时间类型的属性进行运算。

例:查询1980年发表的图书。

BookInfo.objects.filter(bpub_date__year=1980)

例:查询1980年1月1日后发表的图书。

BookInfo.objects.filter(bpub_date__gt=date(1990, 1, 1))
F对象

之前的查询都是对象的属性与常量值比较,两个属性怎么比较呢? 答:使用F对象,被定义在django.db.models中。

语法如下:

F(属性名)

例:查询阅读量大于等于评论量的图书。

from django.db.models import FBookInfo.objects.filter(bread__gte=F('bcomment'))

可以在F对象上使用算数运算。

例:查询阅读量大于2倍评论量的图书。

BookInfo.objects.filter(bread__gt=F('bcomment') * 2)
Q对象

多个过滤器逐个调用表示逻辑与关系,同sql语句中where部分的and关键字。

例:查询阅读量大于20,并且编号小于3的图书。

BookInfo.objects.filter(bread__gt=20,id__lt=3)或BookInfo.objects.filter(bread__gt=20).filter(id__lt=3)

如果需要实现逻辑或or的查询,需要使用Q()对象结合|运算符,Q对象被义在django.db.models中。

语法如下:

Q(属性名__运算符=值)

例:查询阅读量大于20的图书,改写为Q对象如下。

from django.db.models import QBookInfo.objects.filter(Q(bread__gt=20))

Q对象可以使用&、|连接,&表示逻辑与,|表示逻辑或。

例:查询阅读量大于20,或编号小于3的图书,只能使用Q对象实现

BookInfo.objects.filter(Q(bread__gt=20) | Q(pk__lt=3))

Q对象前可以使用~操作符,表示非not。

例:查询编号不等于3的图书。

BookInfo.objects.filter(~Q(pk=3))
聚合函数

使用aggregate()过滤器调用聚合函数。聚合函数包括:Avg 平均,Count 数量,Max 最大,Min 最小,Sum 求和,被定义在django.db.models中。

例:查询图书的总阅读量。

from django.db.models import SumBookInfo.objects.aggregate(Sum('bread'))

注意aggregate的返回值是一个字典类型,格式如下:

{'属性名__聚合类小写':}:{'bread__sum':3}

使用count时一般不使用aggregate()过滤器。

例:查询图书总数。

BookInfo.objects.count()

注意count函数的返回值是一个数字。

排序

使用order_by对结果进行排序

BookInfo.objects.all().order_by('bread')# 升序BookInfo.objects.all().order_by('-bread')# 降序
关联查询

由一到多的访问语法:

一对应的模型类对象.多对应的模型类名小写_set 例:

b = BookInfo.objects.get(id=1)b.heroinfo_set.all()

由多到一的访问语法:

多对应的模型类对象.多对应的模型类中的关系类属性名 例:

h = HeroInfo.objects.get(id=1)h.hbook

访问一对应的模型类关联对象的id语法:

多对应的模型类对象.关联类属性_id

例:

h = HeroInfo.objects.get(id=1)h.hbook_id
关联过滤查询

由多模型类条件查询一模型类数据:

语法如下:

关联模型类名小写__属性名__条件运算符=

注意:如果没有”__运算符”部分,表示等于。

例:

查询图书,要求图书英雄为”孙悟空”

BookInfo.objects.filter(heroinfo__hname='孙悟空')

查询图书,要求图书中英雄的描述包含”八”

BookInfo.objects.filter(heroinfo__hcomment__contains='八')

由一模型类条件查询多模型类数据:

语法如下:

一模型类关联属性名__一模型类属性名__条件运算符=值

注意:如果没有”__运算符”部分,表示等于。

例:

查询书名为“天龙八部”的所有英雄。

HeroInfo.objects.filter(hbook__btitle='天龙八部')

查询图书阅读量大于30的所有英雄

HeroInfo.objects.filter(hbook__bread__gt=30)
修改

修改更新有两种方法

  • save,修改模型类对象的属性,然后执行save()方法

    hero = HeroInfo.objects.get(hname='猪八戒')hero.hname = '猪悟能'hero.save()
  • update,使用模型类.objects.filter().update(),会返回受影响的行数

    HeroInfo.objects.filter(hname='沙悟净').update(hname='沙僧')
删除

删除有两种方法

  • 模型类对象delete

    hero = HeroInfo.objects.get(id=13)hero.delete()
  • 模型类.objects.filter().delete()

    HeroInfo.objects.filter(id=14).delete()

查询集 QuerySet

概念

Django的ORM中存在查询集的概念。

查询集,也称查询结果集、QuerySet,表示从数据库中获取的对象集合。

当调用如下过滤器方法时,Django会返回查询集(而不是简单的列表):

  • all():返回所有数据。
  • filter():返回满足条件的数据。
  • exclude():返回满足条件之外的数据。
  • order_by():对结果进行排序。

对查询集可以再次调用过滤器进行过滤,如

BookInfo.objects.filter(bread__gt=30).order_by('bpub_date')

也就意味着查询集可以含有零个、一个或多个过滤器。过滤器基于所给的参数限制查询的结果。

从SQL的角度讲,查询集与select语句等价,过滤器像where、limit、order by子句。

判断某一个查询集中是否有数据

  • exists():判断查询集中是否有数据,如果有则返回True,没有则返回False。
两大特性
惰性执行

创建查询集不会访问数据库,直到调用数据时,才会访问数据库,调用数据的情况包括迭代、序列化、与if合用

例如,当执行如下语句时,并未进行数据库查询,只是创建了一个查询集qs

qs = BookInfo.objects.all()

继续执行遍历迭代操作后,才真正的进行了数据库的查询

for book in qs:print(book.btitle)
缓存

使用同一个查询集,第一次使用时会发生数据库的查询,然后Django会把结果缓存下来,再次使用这个查询集时会使用缓存的数据,减少了数据库的查询次数。

情况一:如下是两个查询集,无法重用缓存,每次查询都会与数据库进行一次交互,增加了数据库的负载。

from booktest.models import BookInfo[book.id for book in BookInfo.objects.all()][book.id for book in BookInfo.objects.all()]

情况二:经过存储后,可以重用查询集,第二次使用缓存中的数据。

qs=BookInfo.objects.all()[book.id for book in qs][book.id for book in qs]
限制查询集

可以对查询集进行取下标或切片操作,等同于sql中的limit和offset子句。

{{}}

不支持负数索引。

{{}}

对查询集进行切片后返回一个新的查询集,不会立即执行查询。

如果获取一个对象,直接使用[0],等同于[0:1].get(),但是如果没有数据,[0]引发IndexError异常,[0:1].get()如果没有数据引发DoesNotExist异常。

示例:获取第1、2项,运行查看。

qs = BookInfo.objects.all()[0:2]

管理器Manager

简介

管理器是Django的模型进行数据库操作的接口,Django应用的每个模型类都拥有至少一个管理器。

我们在通过模型类的objects属性提供的方法操作数据库时,即是在使用一个管理器对象objects。当没有为模型类定义管理器时,Django会为每一个模型类生成一个名为objects的管理器,它是models.Manager类的对象。

自定义管理器

我们可以自定义管理器,并应用到我们的模型类上。

{{}}

一旦为模型类指明自定义的过滤器后,Django不再生成默认管理对象objects。

{{}}

自定义管理器类主要用于两种情况:

  • 修改原始查询集,重写all()方法。

    • 打开booktest/models.py文件,定义类BookInfoManager

      #图书管理器class BookInfoManager(models.Manager):def all(self):#默认查询未删除的图书信息#调用父类的成员语法为:super().方法名return super().filter(is_delete=False)
    • 在模型类BookInfo中定义管理器

      class BookInfo(models.Model):...books = BookInfoManager()
      • 使用方法
      BookInfo.books.all()
  • 在管理器类中补充定义新的方法

    • 打开booktest/models.py文件,定义方法create。

      class BookInfoManager(models.Manager):#创建模型类,接收参数为属性赋值def create_book(self, title, pub_date):#创建模型类对象self.model可以获得模型类book = self.model()book.btitle = titlebook.bpub_date = pub_datebook.bread=0book.bcommet=0book.is_delete = False# 将数据插入进数据表book.save()return book
      • 为模型类BookInfo定义管理器books语法如下
      class BookInfo(models.Model):...books = BookInfoManager()
      • 调用语法如下:
      book=BookInfo.books.create_book("abc",date(1980,1,1))