如果只有一种 方式使用数据库是正确的…… 您可以用很多的方式创建数据库设计、数据库访问和基于数据库的 PHP 业务逻辑代码,但最终一般以错误告终。本文说明了数据库设计和访问数据库的 PHP 代码中出现的五个常见问题,以及在遇到这些问题时如何修复它们。
一个常见问题是较老的
PHP 代码直接使用
MysqL_
函数来访问
数据库。清单 1 展示了如何直接访问
数据库。 @H_
404_3@
以下为引用的内容:
PHP@H_404_3@function get_user_id( $name )@H_404_3@{@H_404_3@$db = MysqL_connect( 'localhost','root','password' );@H_404_3@MysqL_select_db( 'users' );
$res = MysqL_query( "SELECT id FROM users WHERE login='".$name."'" );@H_404_3@while( $row = MysqL_fetch_array( $res ) ) { $id = $row[0]; }
return $id;@H_404_3@}
var_dump( get_user_id( 'jack' ) );@H_404_3@?> |
清单 1. Access/get.PHP@H_404_3@注意使用了 MysqL_connect 函数来访问数据库。还要注意查询,其中使用字符串连接来向查询添加 $name 参数。 该技术有两个很好的替代方案:PEAR DB 模块和 PHP Data Objects (PDO) 类。两者都从特定数据库选择提供抽象。因此,您的代码无需太多调整就可以在 IBM® DB2®、MysqL、Postgresql 或者您想要连接到的任何其他数据库上运行。 使用 PEAR DB 模块和 PDO 抽象层的另一个价值在于您可以在 sql 语句中使用 ? 操作符。这样做可使 sql 更加易于维护,且可使您的应用程序免受 sql 注入攻击。 使用 PEAR DB 的替代代码如下所示。 @H_404_3@
以下为引用的内容:
PHP@H_404_3@require_once("DB.PHP");
function get_user_id( $name )@H_404_3@{@H_404_3@$dsn = 'MysqL://root:password@localhost/users';@H_404_3@$db =& DB::Connect( $dsn,array() );@H_404_3@if (PEAR::isError($db)) { die($db->getMessage()); }
$res = $db->query( 'SELECT id FROM users WHERE login=?',@H_404_3@array( $name ) );@H_404_3@$id = null;@H_404_3@while( $res->fetchInto( $row ) ) { $id = $row[0]; }
return $id;@H_404_3@}
var_dump( get_user_id( 'jack' ) );@H_404_3@?> |
清单 2. Access/get_good.PHP@H_404_3@注意,所有直接用到 MysqL 的地方都消除了,只有 $dsn 中的数据库连接字符串除外。此外,我们通过 ? 操作符在 sql 中使用 $name 变量。然后,查询的数据通过 query() 方法末尾的 array 被发送进来。
问题 2:不使用自动增量功能
与大多数现代
数据库一样,
MysqL 能够在每记录的基础上创建
自动增量惟一标识符。除此之外,我们仍然会看到这样的
代码,即首先运行一个 SELECT 语句来找到最大的 id,然后将该 id 增 1,并找到一个新记录。清单 3 展示了一个示例坏模式。 @H_
404_3@
404_3@DROP TABLE IF EXISTS users; @H_
404_3@CREATE TABLE users ( @H_
404_3@id MEDIUMINT,@H_
404_3@login TEXT,@H_
404_3@password TEXT @H_
404_3@); @H_
404_3@INSERT INTO users VALUES ( 1,'jack','pass' ); @H_
404_3@INSERT INTO users VALUES ( 2,'joan','pass' ); @H_
404_3@INSERT INTO users VALUES ( 1,'jane','pass' );@H_
404_3@
@H_
404_3@清单 3. Badid.
sql 这里的 id 字段被简单地指定为整数。所以,尽管它应该是惟一的,我们还是可以
添加任何值,如 CREATE 语句后面的几个 INSERT 语句中所示。清单 4 展示了将
用户添加到这种类型的模式的
PHP 代码。 @H_
404_3@
404_3@
PHP @H_
404_3@require_once("DB.
PHP"); function add_user( $name,$pass ) @H_
404_3@{ @H_
404_3@$rows = array(); $dsn = '
MysqL://root:password@localhost/bad_badid'; @H_
404_3@$db =& DB::Connect( $dsn,array() ); @H_
404_3@if (PEAR::isError($db)) { die($db->getMessage()); } $res = $db->query( "SELECT max(id) FROM users" ); @H_
404_3@$id = null; @H_
404_3@while( $res->fetchInto( $row ) ) { $id = $row[0]; } $id += 1; $sth = $db->prepare( "INSERT INTO users VALUES(?,?,?)" ); @H_
404_3@$db->execute( $sth,array( $id,$name,$pass ) ); return $id; @H_
404_3@} $id = add_user( 'jerry','pass' ); var_dump( $id ); @H_
404_3@?> @H_
404_3@
@H_
404_3@清单 4. Add_user.
PHP add_user.
PHP 中的
代码首先执行一个
查询以找到 id 的最大值。然后
文件以 id 值加 1 运行一个 INSERT 语句。该
代码在
负载很重的服务器上会在竞态条件中失败。另外,它也效率低下。 那么替代方案是什么呢?使用
MysqL 中的
自动增量特性来
自动地为每个插入创建惟一的 ID。更新后的模式如下所示。 @H_
404_3@
404_3@DROP TABLE IF EXISTS users; @H_
404_3@CREATE TABLE users ( @H_
404_3@id MEDIUMINT NOT NULL AUTO_INCREMENT,@H_
404_3@login TEXT NOT NULL,@H_
404_3@password TEXT NOT NULL,@H_
404_3@PRIMARY KEY( id ) @H_
404_3@); INSERT INTO users VALUES ( null,'pass' ); @H_
404_3@INSERT INTO users VALUES ( null,'pass' ); @H_
404_3@
@H_
404_3@清单 5. Goodid.
PHP 我们
添加了 NOT NULL 标志来指示字段必须不能为空。我们还
添加了 AUTO_INCREMENT 标志来指示字段是
自动增量的,
添加 PRIMARY KEY 标志来指示那个字段是一个 id。这些更改加快了速度。清单 6 展示了更新后的
PHP 代码,即将
用户插入表中。 @H_
404_3@
404_3@
PHP @H_
404_3@require_once("DB.
PHP"); function add_user( $name,$pass ) @H_
404_3@{ @H_
404_3@$dsn = '
MysqL://root:password@localhost/good_genid'; @H_
404_3@$db =& DB::Connect( $dsn,array() ); @H_
404_3@if (PEAR::isError($db)) { die($db->getMessage()); } $sth = $db->prepare( "INSERT INTO users VALUES(null,array( $name,$pass ) ); $res = $db->query( "SELECT last_insert_id()" ); @H_
404_3@$id = null; @H_
404_3@while( $res->fetchInto( $row ) ) { $id = $row[0]; } return $id; @H_
404_3@} $id = add_user( 'jerry','pass' ); var_dump( $id ); @H_
404_3@?> @H_
404_3@
@H_
404_3@清单 6. Add_user_good.
PHP 现在我不是获得最大的 id 值,而是直接使用 INSERT 语句来插入数据,然后使用 SELECT 语句来检索最后插入的记录的 id。该
代码比最初的版本及其相关模式要简单得多,且效率更高。
问题 3:使用多个数据库
偶尔,我们会看到一个应用程序中,每个表都在一个单独的
数据库中。在非常大的
数据库中这样做是合理的,但是对于一般的应用程序,则不需要这种级别的分割。此外,不能跨
数据库执行关系
查询,这会影响使用关系
数据库的整体思想,更不用说跨多个
数据库管理表会更困难了。 那么,多个
数据库应该是什么样的呢?首先,您需要一些数据。清单 7 展示了分成 4 个
文件的这样的数据。 @H_
404_3@Files.
sql: @H_
404_3@
404_3@CREATE TABLE files ( @H_
404_3@id MEDIUMINT,@H_
404_3@user_id MEDIUMINT,@H_
404_3@name TEXT,@H_
404_3@path TEXT @H_
404_3@); @H_
404_3@
@H_
404_3@Load_files.
sql: @H_
404_3@
404_3@INSERT INTO files VALUES ( 1,1,'test1.jpg','files/test1.jpg' ); @H_
404_3@INSERT INTO files VALUES ( 2,'test2.jpg','files/test2.jpg' ); @H_
404_3@
@H_
404_3@Users.
sql: @H_
404_3@
404_3@DROP TABLE IF EXISTS users; @H_
404_3@CREATE TABLE users ( @H_
404_3@id MEDIUMINT,@H_
404_3@password TEXT @H_
404_3@); @H_
404_3@
@H_
404_3@Load_users.
sql: @H_
404_3@
404_3@INSERT INTO users VALUES ( 1,'jon','pass' ); @H_
404_3@
@H_
404_3@在这些
文件的多
数据库版本中,您应该将
sql 语句加载到一个
数据库中,然后将 users
sql 语句加载到另一个
数据库中。用于在
数据库中
查询与某个
特定用户相关联的
文件的
PHP 代码如下所示。 @H_
404_3@
404_3@
PHP @H_
404_3@require_once("DB.
PHP"); function get_user( $name ) @H_
404_3@{ @H_
404_3@$dsn = '
MysqL://root:password@localhost/bad_multi1'; @H_
404_3@$db =& DB::Connect( $dsn,array() ); @H_
404_3@if (PEAR::isError($db)) { die($db->getMessage()); } $res = $db->query( "SELECT id FROM users WHERE login=?",@H_
404_3@array( $name ) ); @H_
404_3@$uid = null; @H_
404_3@while( $res->fetchInto( $row ) ) { $uid = $row[0]; } return $uid; @H_
404_3@} function get_files( $name ) @H_
404_3@{ @H_
404_3@$uid = get_user( $name ); $rows = array(); $dsn = '
MysqL://root:password@localhost/bad_multi2'; @H_
404_3@$db =& DB::Connect( $dsn,array() ); @H_
404_3@if (PEAR::isError($db)) { die($db->getMessage()); } $res = $db->query( "SELECT * FROM files WHERE user_id=?",@H_
404_3@array( $uid ) ); @H_
404_3@while( $res->fetchInto( $row ) ) { $rows[] = $row; } return $rows; @H_
404_3@} $files = get_files( 'jack' ); var_dump( $files ); @H_
404_3@?> @H_
404_3@
清单 8. Getfiles.
PHP @H_
404_3@get_user
函数连接到包含
用户表的
数据库并检索给定
用户的 ID。get_files
函数连接到
文件表并检索与给定
用户相关联的
文件行。 做所有这些事情的一个更好办法是将数据加载到一个
数据库中,然
后执行查询,比如下面的
查询。 @H_
404_3@
404_3@
PHP @H_
404_3@require_once("DB.
PHP"); function get_files( $name ) @H_
404_3@{ @H_
404_3@$rows = array(); $dsn = '
MysqL://root:password@localhost/good_multi'; @H_
404_3@$db =& DB::Connect( $dsn,array() ); @H_
404_3@if (PEAR::isError($db)) { die($db->getMessage()); } $res = $db->query( @H_
404_3@"SELECT files.* FROM users,files WHERE @H_
404_3@users.login=? AND users.id=files.user_id",@H_
404_3@array( $name ) ); @H_
404_3@while( $res->fetchInto( $row ) ) { $rows[] = $row; } return $rows; @H_
404_3@} $files = get_files( 'jack' ); var_dump( $files ); @H_
404_3@?> @H_
404_3@
清单 9. Getfiles_good.
PHP 该
代码不仅更短,而且也更容易理解和高效。我们不是执行两个
查询,而是执行一个
查询。 @H_
404_3@尽管该问题听起来有些牵强,但是在实践中我们通常总结出所有的表应该在同一个
数据库中,除非有非常迫不得已的理由。 @H_
404_3@问题 4:不使用关系 @H_
404_3@关系
数据库不同于编程语言,它们不具有数组类型。相反,它们使用表之间的关系来创建对象之间的一到多结构,这与数组具有相同的
效果。我在应用程序中看到的一个问题是,工程师试图将
数据库当作编程语言来使用,即通过使用具有逗号分隔的标识符的文本字符串来创建数组。请看下面的模式。 @H_
404_3@
404_3@DROP TABLE IF EXISTS files; @H_
404_3@CREATE TABLE files ( @H_
404_3@id MEDIUMINT,@H_
404_3@path TEXT @H_
404_3@); @H_
404_3@DROP TABLE IF EXISTS users; @H_
404_3@CREATE TABLE users ( @H_
404_3@id MEDIUMINT,@H_
404_3@password TEXT,@H_
404_3@files TEXT @H_
404_3@); @H_
404_3@INSERT INTO files VALUES ( 1,'media/test1.jpg' ); @H_
404_3@INSERT INTO files VALUES ( 2,'media/test1.jpg' ); @H_
404_3@INSERT INTO users VALUES ( 1,'pass','1,2' ); @H_
404_3@
@H_
404_3@清单 10. Bad.
sql @H_
404_3@系统中的一个
用户可以具有多个
文件。在编程语言中,应该使用数组来表示与一个
用户相关联的
文件。在本例中,程序员选择创建一个 files 字段,其中包含一个由逗号分隔的
文件 id 列表。要得到一个
特定用户的所有
文件的列表,程序员必须首先从
用户表中读取行,然后解析
文件的文本,并为每个
文件运行一个单独的 SELECT 语句。该
代码如下所示。 @H_
404_3@
404_3@
PHP @H_
404_3@require_once("DB.
PHP"); @H_
404_3@function get_files( $name ) @H_
404_3@{ @H_
404_3@$dsn = '
MysqL://root:password@localhost/bad_norel'; @H_
404_3@$db =& DB::Connect( $dsn,array() ); @H_
404_3@if (PEAR::isError($db)) { die($db->getMessage()); } @H_
404_3@$res = $db->query( "SELECT files FROM users WHERE login=?",@H_
404_3@array( $name ) ); @H_
404_3@$files = null; @H_
404_3@while( $res->fetchInto( $row ) ) { $files = $row[0]; } @H_
404_3@$rows = array(); @H_
404_3@foreach( split( ',',$files ) as $file ) @H_
404_3@{ @H_
404_3@$res = $db->query( "SELECT * FROM files WHERE id=?",@H_
404_3@array( $file ) ); @H_
404_3@while( $res->fetchInto( $row ) ) { $rows[] = $row; } @H_
404_3@} @H_
404_3@return $rows; @H_
404_3@} @H_
404_3@$files = get_files( 'jack' ); @H_
404_3@var_dump( $files ); @H_
404_3@?> @H_
404_3@
@H_
404_3@清单 11. Get.
PHP @H_
404_3@该技术很慢,难以维护,且没有很好地利用
数据库。惟一的
解决方案是重新架构模式,以将其转换回到传统的关系形式,如下所示。 @H_
404_3@
404_3@DROP TABLE IF EXISTS files; @H_
404_3@CREATE TABLE files ( @H_
404_3@id MEDIUMINT,'pass' ); @H_
404_3@INSERT INTO files VALUES ( 1,'media/test1.jpg' ); @H_
404_3@
@H_
404_3@清单 12. Good.
sql @H_
404_3@这里,每个
文件都通过 user_id
函数与
文件表中的
用户相关。这可能与任何将多个
文件看成数组的人的思想相反。当然,数组不引用其包含的对象 —— 事实上,反之亦然。但是在关系
数据库中,工作原理就是这样的,并且
查询也因此要
快速且简单得多。清单 13 展示了相应的
PHP 代码。 @H_
404_3@
404_3@
PHP @H_
404_3@require_once("DB.
PHP"); @H_
404_3@function get_files( $name ) @H_
404_3@{ @H_
404_3@$dsn = '
MysqL://root:password@localhost/good_rel'; @H_
404_3@$db =& DB::Connect( $dsn,array() ); @H_
404_3@if (PEAR::isError($db)) { die($db->getMessage()); } @H_
404_3@$rows = array(); @H_
404_3@$res = $db->query( @H_
404_3@"SELECT files.* FROM users,files WHERE users.login=? @H_
404_3@AND users.id=files.user_id",@H_
404_3@array( $name ) ); @H_
404_3@while( $res->fetchInto( $row ) ) { $rows[] = $row; } @H_
404_3@return $rows; @H_
404_3@} @H_
404_3@$files = get_files( 'jack' ); @H_
404_3@var_dump( $files ); @H_
404_3@?> @H_
404_3@
@H_
404_3@清单 13. Get_good.
PHP @H_
404_3@这里,我们对
数据库进行一次
查询,以获得所有的行。
代码不复杂,并且它将
数据库作为其原有的用途使用。 @H_
404_3@问题 5:n+1 模式 @H_
404_3@我真不知有多少次看到过这样的大型应用程序,其中的
代码首先检索一些实体(比如说客户),然后来回地一个一个地检索它们,以得到每个实体的详细信息。我们将其称为 n+1 模式,因为
查询要执行这么多次 —— 一次
查询检索所有实体的列表,然后对于 n 个实体中的每一个执行一次
查询。当 n=10 时这还不成其为问题,但是当 n=100 或 n=1000 时呢?然后肯定会出现低效率问题。清单 14 展示了这种模式的一个例子。 @H_
404_3@
404_3@DROP TABLE IF EXISTS authors; @H_
404_3@CREATE TABLE authors ( @H_
404_3@id MEDIUMINT NOT NULL AUTO_INCREMENT,@H_
404_3@name TEXT NOT NULL,@H_
404_3@PRIMARY KEY ( id ) @H_
404_3@); @H_
404_3@DROP TABLE IF EXISTS books; @H_
404_3@CREATE TABLE books ( @H_
404_3@id MEDIUMINT NOT NULL AUTO_INCREMENT,@H_
404_3@author_id MEDIUMINT NOT NULL,@H_
404_3@PRIMARY KEY ( id ) @H_
404_3@); @H_
404_3@INSERT INTO authors VALUES ( null,'Jack Herrington' ); @H_
404_3@INSERT INTO authors VALUES ( null,'Dave Thomas' ); @H_
404_3@INSERT INTO books VALUES ( null,'Code Generation in Action' ); @H_
404_3@INSERT INTO books VALUES ( null,'Podcasting Hacks' ); @H_
404_3@INSERT INTO books VALUES ( null,'
PHP Hacks' ); @H_
404_3@INSERT INTO books VALUES ( null,2,'Pragmatic Programmer' ); @H_
404_3@INSERT INTO books VALUES ( null,'Ruby on Rails' ); @H_
404_3@INSERT INTO books VALUES ( null,'Programming Ruby' ); @H_
404_3@[code] @H_
404_3@清单 14. Schema.
sql @H_
404_3@该模式是可靠的,其中没有任何
错误。问题在于访问
数据库以找到一个给定作者的所有书籍的
代码中,如下所示。 @H_
404_3@[code] @H_
404_3@
PHP @H_
404_3@require_once('DB.
PHP'); @H_
404_3@$dsn = '
MysqL://root:password@localhost/good_books'; @H_
404_3@$db =& DB::Connect( $dsn,array() ); @H_
404_3@if (PEAR::isError($db)) { die($db->getMessage()); } @H_
404_3@function get_author_id( $name ) @H_
404_3@{ @H_
404_3@global $db; @H_
404_3@$res = $db->query( "SELECT id FROM authors WHERE name=?",@H_
404_3@array( $name ) ); @H_
404_3@$id = null; @H_
404_3@while( $res->fetchInto( $row ) ) { $id = $row[0]; } @H_
404_3@return $id; @H_
404_3@} @H_
404_3@function get_books( $id ) @H_
404_3@{ @H_
404_3@global $db; @H_
404_3@$res = $db->query( "SELECT id FROM books WHERE author_id=?",@H_
404_3@array( $id ) ); @H_
404_3@$ids = array(); @H_
404_3@while( $res->fetchInto( $row ) ) { $ids []= $row[0]; } @H_
404_3@return $ids; @H_
404_3@} @H_
404_3@function get_book( $id ) @H_
404_3@{ @H_
404_3@global $db; @H_
404_3@$res = $db->query( "SELECT * FROM books WHERE id=?",array( $id ) ); @H_
404_3@while( $res->fetchInto( $row ) ) { return $row; } @H_
404_3@return null; @H_
404_3@} @H_
404_3@$author_id = get_author_id( 'Jack Herrington' ); @H_
404_3@$books = get_books( $author_id ); @H_
404_3@foreach( $books as $book_id ) { @H_
404_3@$book = get_book( $book_id ); @H_
404_3@var_dump( $book ); @H_
404_3@} @H_
404_3@?> @H_
404_3@
@H_
404_3@清单 15. Get.
PHP @H_
404_3@如果您看看下面的
代码,您可能会想,“嘿,这才是真正的清楚明了。” 首先,得到作者 id,然后得到书籍列表,然后得到有关每本书的信息。的确,它很清楚明了,但是其高效吗?回答是否定的。看看只是检索 Jack Herrington 的书籍时要执行多少次
查询。一次获得 id,另一次获得书籍列表,然后每本书执行一次
查询。三本书要执行五次
查询! @H_
404_3@
解决方案是用一个
函数来执行大量的
查询,如下所示。 @H_
404_3@
404_3@
PHP @H_
404_3@require_once('DB.
PHP'); @H_
404_3@$dsn = '
MysqL://root:password@localhost/good_books'; @H_
404_3@$db =& DB::Connect( $dsn,array() ); @H_
404_3@if (PEAR::isError($db)) { die($db->getMessage()); } @H_
404_3@function get_books( $name ) @H_
404_3@{ @H_
404_3@global $db; @H_
404_3@$res = $db->query( @H_
404_3@"SELECT books.* FROM authors,books WHERE @H_
404_3@books.author_id=authors.id AND authors.name=?",@H_
404_3@array( $name ) ); @H_
404_3@$rows = array(); @H_
404_3@while( $res->fetchInto( $row ) ) { $rows []= $row; } @H_
404_3@return $rows; @H_
404_3@} @H_
404_3@$books = get_books( 'Jack Herrington' ); @H_
404_3@var_dump( $books ); @H_
404_3@?> @H_
404_3@
@H_
404_3@清单 16. Get_good.
PHP @H_
404_3@现在检索列表需要一个
快速、单个的
查询。这意味着我将很可能必须具有几个这些类型的具有不同参数的
方法,但是实在是没有选择。如果您想要具有一个扩展的
PHP 应用程序,那么必须有效地使用
数据库,这意味着更智能的
查询。 本例的问题是它有点太清晰了。通常来说,这些类型的 n+1 或 n*n 问题要微妙得多。并且它们只有在
数据库管理员在系统具有
性能问题时在系统上运行
查询剖析器时才会出现。 结束语
数据库是强大的工具,就跟所有强大的工具一样,如果您不知道如何正确地使用就会滥用它们。识别和
解决这些问题的诀窍是更好地理解底层技术。长期以来,我老听到业务逻辑编写人员抱怨,他们不想要必须理解
数据库或
sql 代码。他们把
数据库当成对象使用,并疑惑
性能为什么如此之差。 他们没有认识到,理解
sql 对于将
数据库从一个困难的必需品转换成强大的联盟是多么重要。如果您每天使用
数据库,但是不熟悉
sql,那么请阅读 The Art of
sql,这本书写得很好,实践性也很强,可以指导您基本了解
数据库。