Changed in Django 1.8:
allow_migrate的签名与以前的版本相比发生了显着更改。有关详细信息,请参阅deprecation notes。
路由不必提供所有这些方法 —— 它可以省略一个或多个。如果某个方法缺失,在做相应的检查时Django 将忽略该路由。
Hint 由数据库路由接收,用于决定哪个数据库应该接收一个给定的请求。
目前,唯一一个提供的hint 是instance,它是一个对象实例,与正在进行的读或者写操作关联。这可能是正在保存的实例,或者它可能是以多对多关系添加的实例。在某些情况下,不会提供任何实例提示。路由器检查实例提示的存在,并确定是否应该使用该提示来更改路由行为。
使用路由
数据库路由使用DATABASE_ROUTERS 设置安装。这个设置定义一个类名的列表,其中每个类表示一个路由,它们将被主路由(django.db.router)使用。
Django 的数据库操作使用主路由来分配数据库的使用。每当一个查询需要知道使用哪一个数据库时,它将调用主路由,并提供一个模型和一个Hint (可选)。随后 Django 依次测试每个路由直至找到一个数据库的建议。如果找不到建议,它将尝试Hint 实例的当前_state.db。如果没有提供Hint 实例,或者该实例当前没有数据库状态,主路由将分配default 数据库。
一个例子
只是为了示例!
这个例子的目的是演示如何使用路由这个基本结构来改变数据库的使用。它有意忽略一些复杂的问题,目的是为了演示如何使用路由。
如果myapp 中的任何一个模型包含与其它 数据库之外的模型的关联,这个例子将不能工作。跨数据的关联引入引用完整性问题,Django目前还无法处理。
Primary/replica(在某些数据库中叫做master/slave)配置也是有缺陷的 —— 它不提供任何处理Replication lag 的解决办法(例如,因为写入同步到replica 需要一定的时间,这会引入查询的不一致)。它也不考虑事务与数据库利用率策略的交互。
那么 —— 在实际应用中这意味着什么?让我们看一下另外一个配置的例子。这个配置将有几个数据库:一个用于auth 应用,所有其它应用使用一个具有两个读replica 的 primary/replica。下面是表示这些数据库的设置:
DATABASES = {
'auth_db': {
'NAME': 'auth_db',
'ENGINE': 'django.db.backends.mysql',
'USER': 'mysql_user',
'PASSWORD': 'swordfish',
'primary': {
'NAME': 'primary',
'ENGINE': 'django.db.backends.mysql',
'USER': 'mysql_user',
'PASSWORD': 'spam',
'replica1': {
'NAME': 'replica1',
'ENGINE': 'django.db.backends.mysql',
'USER': 'mysql_user',
'PASSWORD': 'eggs',
'replica2': {
'NAME': 'replica2',
'ENGINE': 'django.db.backends.mysql',
'USER': 'mysql_user',
'PASSWORD': 'bacon',
现在我们将需要处理路由。首先,我们需要一个路由,它知道发送auth 应用的查询到auth_db:
class AuthRouter(object):
A router to control all database operations on models in the
auth application.
def db_for_read(self, model, **hints):
Attempts to read auth models go to auth_db.
if model._meta.app_label == 'auth':
return 'auth_db'
return None
def db_for_write(self, model, **hints):
Attempts to write auth models go to auth_db.
if model._meta.app_label == 'auth':
return 'auth_db'
return None
def allow_relation(self, obj1, obj2, **hints):
Allow relations if a model in the auth app is involved.
if obj1._meta.app_label == 'auth' or \
obj2._meta.app_label == 'auth':
return True
return None
def allow_migrate(self, db, app_label, model=None, **hints):
Make sure the auth app only appears in the 'auth_db'
database.
if app_label == 'auth':
return db == 'auth_db'
return None
我们还需要一个路由,它发送所有其它应用的查询到primary/replica 配置,并随机选择一个replica 来读取:
import random
class PrimaryReplicaRouter(object):
def db_for_read(self, model, **hints):
Reads go to a randomly-chosen replica.
return random.choice(['replica1', 'replica2'])
def db_for_write(self, model, **hints):
Writes always go to primary.
return 'primary'
def allow_relation(self, obj1, obj2, **hints):
Relations between objects are allowed if both objects are
in the primary/replica pool.
db_list = ('primary', 'replica1', 'replica2')
if obj1._state.db in db_list and obj2._state.db in db_list:
return True
return None
def allow_migrate(self, db, app_label, model=None, **hints):
All non-auth models end up in this pool.
return True
最后,在设置文件中,我们添加如下内容(替换path.to.为该路由定义所在的真正路径):
DATABASE_ROUTERS = ['path.to.AuthRouter', 'path.to.PrimaryReplicaRouter']
路由处理的顺序非常重要。路由的查询将按照DATABASE_ROUTERS设置中列出的顺序进行。在这个例子中,AuthRouter在PrimaryReplicaRouter之前处理,因此auth中的模型的查询处理在其它模型之前。如果DATABASE_ROUTERS设置按其它顺序列出这两个路由,PrimaryReplicaRouter.allow_migrate() 将先处理。PrimaryReplicaRouter 中实现的捕获所有的查询,这意味着所有的模型可以位于所有的数据库中。
建立这个配置后,让我们运行一些Django 代码:
>>> # This retrieval will be performed on the 'auth_db' database
>>> fred = User.objects.get(username='fred')
>>> fred.first_name = 'Frederick'
>>> # This save will also be directed to 'auth_db'
>>> fred.save()
>>> # These retrieval will be randomly allocated to a replica database
>>> dna = Person.objects.get(name='Douglas Adams')
>>> # A new object has no database allocation when created
>>> mh = Book(title='Mostly Harmless')
>>> # This assignment will consult the router, and set mh onto
>>> # the same database as the author object
>>> mh.author = dna
>>> # This save will force the 'mh' instance onto the primary database...
>>> mh.save()
>>> # ... but if we re-retrieve the object, it will come back on a replica
>>> mh = Book.objects.get(title='Mostly Harmless')
为QuerySet手动选择一个数据库
你可以在QuerySet“链”的任意节点上为QuerySet选择数据库 。只需要在QuerySet上调用using()就可以让QuerySet使用一个指定的数据库。
using() 接收单个参数:你的查询想要运行的数据库的别名。例如:
>>> # This will run on the 'default' database.
>>> Author.objects.all()
>>> # So will this.
>>> Author.objects.using('default').all()
>>> # This will run on the 'other' database.
>>> Author.objects.using('other').all()
为save() 选择一个数据库
对Model.save()使用using 关键字来指定数据应该保存在哪个数据库。
例如,若要保存一个对象到legacy_users 数据库,你应该使用:
>>> my_object.save(using='legacy_users')
如果你不指定using,save()方法将保存到路由分配的默认数据库中。
将对象从一个数据库移动到另一个数据库
如果你已经保存一个实例到一个数据库中,你可能很想使用save(using=...) 来迁移该实例到一个新的数据库中。然而,如果你不使用正确的步骤,这可能导致意外的结果。
考虑下面的例子:
>>> p = Person(name='Fred')
>>> p.save(using='first') # (statement 1)
>>> p.save(using='second') # (statement 2)
在statement 1中,一个新的Person 对象被保存到 first 数据库中。此时p 没有主键,所以Django 发出一个SQL INSERT 语句。这会创建一个主键,且Django 将此主键赋值给p。
当保存在statement 2中发生时,p已经具有一个主键,Django 将尝试在新的数据库上使用该主键。如果该主键值在second 数据库中没有使用,那么你不会遇到问题 —— 该对象将被复制到新的数据库中。
然而,如果p 的主键在second数据库上已经在使用second 数据库中的已经存在的对象将在p保存时被覆盖。
你可以用两种方法避免这种情况。首先,你可以清除实例的主键。如果一个对象没有主键,Django 将把它当做一个新的对象,这将避免second数据库上数据的丢失:
>>> p = Person(name='Fred')
>>> p.save(using='first')
>>> p.pk = None # Clear the primary key.
>>> p.save(using='second') # Write a completely new object.
第二种方法是使用force_insert 选项来save()以确保Django 使用一个INSERT SQL:
>>> p = Person(name='Fred')
>>> p.save(using='first')
>>> p.save(using='second', force_insert=True)
这将确保名称为Fred 的Person在两个数据库上具有相同的主键。在你试图保存到second数据库,如果主键已经在使用,将会引抛出发一个错误。
选择一个数据库用于删除表单
默认情况下,删除一个已存在对象的调用将在与获取对象时使用的相同数据库上执行:
>>> u = User.objects.using('legacy_users').get(username='fred')
>>> u.delete() # will delete from the `legacy_users` database
要指定删除一个模型时使用的数据库,可以对Model.delete()方法使用using 关键字参数。这个参数的工作方式与save()的using关键字参数一样。
例如,你正在从legacy_users 数据库到new_users 数据库迁移一个User ,你可以使用这些命令:
>>> user_obj.save(using='new_users')
>>> user_obj.delete(using='legacy_users')
多个数据库上使用管理器
在管理器上使用db_manager()方法来让管理器访问非默认的数据库。
例如,你有一个自定义的管理器方法,它访问数据库时候用 ——User.objects.create_user()。因为create_user()是一个管理器方法,不是一个QuerySet方法,你不可以使用User.objects.using('new_users').create_user()。(create_user() 方法只能在User.objects上使用,而不能在从管理器得到的QuerySet上使用)。解决办法是使用db_manager(),像这样:
User.objects.db_manager('new_users').create_user(...)
db_manager() 返回一个绑定在你指定的数据上的一个管理器。
多数据库上使用get_queryset()
如果你正在覆盖你的管理器上的get_queryset(),请确保在其父类上调用方法(使用super())或者正确处理管理器上的_db属性(一个包含将要使用的数据库名称的字符串)。
例如,如果你想从get_queryset 方法返回一个自定义的 QuerySet 类,你可以这样做:
class MyManager(models.Manager):
def get_queryset(self):
qs = CustomQuerySet(self.model)
if self._db is not None:
qs = qs.using(self._db)
return qs
Django 的管理站点中使用多数据库
Django 的管理站点没有对多数据库的任何显式的支持。如果你给数据库上某个模型提供的管理站点不想通过你的路由链指定,你将需要编写自定义的ModelAdmin类用来将管理站点导向一个特殊的数据库。
ModelAdmin 对象具有5个方法,它们需要定制以支持多数据库:
class MultiDBModelAdmin(admin.ModelAdmin):
# A handy constant for the name of the alternate database.
using = 'other'
def save_model(self, request, obj, form, change):
# Tell Django to save objects to the 'other' database.
obj.save(using=self.using)
def delete_model(self, request, obj):
# Tell Django to delete objects from the 'other' database
obj.delete(using=self.using)
def get_queryset(self, request):
# Tell Django to look for objects on the 'other' database.
return super(MultiDBModelAdmin, self).get_queryset(request).using(self.using)
def formfield_for_foreignkey(self, db_field, request=None, **kwargs):
# Tell Django to populate ForeignKey widgets using a query
# on the 'other' database.
return super(MultiDBModelAdmin, self).formfield_for_foreignkey(db_field, request=request, using=self.using, **kwargs)
def formfield_for_manytomany(self, db_field, request=None, **kwargs):
# Tell Django to populate ManyToMany widgets using a query
# on the 'other' database.
return super(MultiDBModelAdmin, self).formfield_for_manytomany(db_field, request=request, using=self.using, **kwargs)
这里提供的实现实现了一个多数据库策略,其中一个给定类型的所有对象都将保存在一个特定的数据库上(例如,所有的User保存在other 数据库中)。如果你的多数据库的用法更加复杂,你的ModelAdmin将需要反映相应的策略。
Inlines 可以用相似的方式处理。它们需要3个自定义的方法:
class MultiDBTabularInline(admin.TabularInline):
using = 'other'
def get_queryset(self, request):
# Tell Django to look for inline objects on the 'other' database.
return super(MultiDBTabularInline, self).get_queryset(request).using(self.using)
def formfield_for_foreignkey(self, db_field, request=None, **kwargs):
# Tell Django to populate ForeignKey widgets using a query
# on the 'other' database.
return super(MultiDBTabularInline, self).formfield_for_foreignkey(db_field, request=request, using=self.using, **kwargs)
def formfield_for_manytomany(self, db_field, request=None, **kwargs):
# Tell Django to populate ManyToMany widgets using a query
# on the 'other' database.
return super(MultiDBTabularInline, self).formfield_for_manytomany(db_field, request=request, using=self.using, **kwargs)
一旦你写好你的模型管理站点的定义,它们就可以使用任何Admin实例来注册:
from django.contrib import admin
# Specialize the multi-db admin objects for use with specific models.
class BookInline(MultiDBTabularInline):
model = Book
class PublisherAdmin(MultiDBModelAdmin):
inlines = [BookInline]
admin.site.register(Author, MultiDBModelAdmin)
admin.site.register(Publisher, PublisherAdmin)
othersite = admin.AdminSite('othersite')
othersite.register(Publisher, MultiDBModelAdmin)
这个例子建立两个管理站点。在第一个站点上,Author 和 Publisher 对象被暴露出来;Publisher 对象具有一个表格的内联,显示该出版社出版的书籍。第二个站点只暴露Publishers,而没有内联。
多数据库上使用原始游标
如果你正在使用多个数据库,你可以使用django.db.connections来获取特定数据库的连接(和游标):django.db.connections是一个类字典对象,它允许你使用别名来获取一个特定的连接:
from django.db import connections
cursor = connections['my_db_alias'].cursor()
跨数据库关联
Django 目前不提供跨多个数据库的外键或多对多关系的支持。如果你使用一个路由来路由分离到不同的数据库上,这些模型定义的任何外键和多对多关联必须在单个数据库的内部。
这是因为引用完整性的原因。为了保持两个对象之间的关联,Django 需要知道关联对象的主键是合法的。如果主键存储在另外一个数据库上,判断一个主键的合法性不是很容易。
如果你正在使用Postgres、Oracle或者MySQL 的InnoDB,这是数据库完整性级别的强制要求 —— 数据库级别的主键约束防止创建不能验证合法性的关联。
然而,如果你正在使用SQLite 或MySQL的MyISAM 表,则没有强制性的引用完整性;结果是你可以‘伪造’跨数据库的外键。但是Django 官方不支持这种配置。
Contrib 应用的行为
有几个Contrib 应用包含模型,其中一些应用相互依赖。因为跨数据库的关联是不可能的,这对你如何在数据库之间划分这些模型带来一些限制:
contenttypes.ContentType、sessions.Session和sites.Site 可以存储在分开存储在不同的数据库中,只要给出合适的路由
auth模型 —— User、Group和Permission —— 关联在一起并与ContentType关联,所以它们必须与ContentType存储在相同的数据库中。
admin依赖auth,所以它们的模型必须与auth在同一个数据库中。
flatpages和redirects依赖sites,所以它们必须与sites在同一个数据库中。
另外,migrate在数据库中创建一张表后,一些对象在该表中自动创建:
一个默认的Site,
为每个模型创建一个ContentType(包括没有存储在同一个数据库中的模型),
为每个模型创建3个Permission (包括不是存储在同一个数据库中的模型)。
对于常见的多数据库架构,将这些对象放在多个数据库中没有什么用处。常见的数据库架构包括primary/replica 和连接到外部的数据库。因此,建议写一个数据库路由,它只允许同步这3个模型到一个数据中。对于不需要将表放在多个数据库中的Contrib 应用和第三方应用,可以使用同样的方法。
如果你将Content Types 同步到多个数据库中,注意它们的主键在数据库之间可能不一致。这可能导致数据损坏或数据丢失。