sql 指令
时间:2022-03-10 17:53
SELECT
是用来做什么的呢?一个最常用的方式是将资料从数据库中的表格内选出。从这一句回答中,我们马上可以看到两个关键字:从 (FROM)数据库中的表格内选出 (SELECT)。(表格是一个数据库内的结构,它的目的是储存资料。在表格处理这一部分中,我们会提到如何使用 SQL 来设定表格。) 我们由这里可以看到最基本的 SQL 架构:
SELECT "栏位名"FROM "表格名"
我们用以下的例子来看看实际上是怎么用的。假设我们有以下这个表格:
store_name |
Sales |
Date |
Los Angeles |
$1500 |
Jan-05-1999 |
San Diego |
$250 |
Jan-07-1999 |
Los Angeles |
$300 |
Jan-08-1999 |
Boston |
$700 |
Jan-08-1999 |
若要选出所有的店名(store_Name),我们就打入:
SELECT store_name FROM Store_Information
结果:
store_name |
Los Angeles |
San Diego |
Los Angeles |
Boston |
我们一次可以读取好几个栏位,也可以同时由好几个表格中选资料。
简单的SQL查询只包括选择列表、FROM子句和WHERE子句。它们分别说明所查询列、查询的表或视图、以及搜索条件等。
1、选择所有列
例如,下面语句显示testtable表中所有列的数据:
代码:SELECT * FROMtesttable
2、选择部分列并指定它们的显示次序查询结果集合中数据的排列顺序与选择列表中所指定的列名排列顺序相同。例如:
代码:SELECT nickname,email
FROMtesttable
3、更改列标题
在选择列表中,可重新指定列标题。定义格式为:列标题=列名
如果指定的列标题不是标准的标识符格式时,应使用引号定界符,例如,下列语句使用汉字显示列标题:
代码:SELECT 昵称=nickname,电子邮件=email FROM testtable
4、删除重复行
SELECT语句中使用ALL或DISTINCT选项来显示表中符合条件的所有行或删除其中重复的数据行,默认为ALL。使用DISTINCT选项时,对于所有重复的数据行在SELECT返回的结果集合中只保留一行。
5、限制返回的行数
使用TOP n [PERCENT]选项限制返回的数据行数,TOP n说明返回n行,而TOP n
PERCENT时,说明n是表示一百分数,指定返回的行数等于总行数的百分之几。例如:
代码:SELECT TOP 2 *
FROM `testtable`
代码:SELECT TOP 20 PERCENT*
FROM `testtable`
DISTINCT
SELECT 指令让我们能够读取表格中一个或数个栏位的所有资料。这将把所有的资料都抓出,无论资料值有无重复。在资料处理中,我们会经常碰到需要找出表格内的不同资料值的情况。换句话说,我们需要知道这个表格/栏位内有哪些不同的值,而每个值出现的次数并不重要。这要如何达成呢?在 SQL 中,这是很容易做到的。我们只要在 SELECT 后加上一个 DISTINCT 就可以了。DISTINCT 的语法如下:
SELECT DISTINCT"栏位名"
FROM "表格名"
举例来说,若要在以下的表格,Store_Information,找出所有不同的店名时,
Store_Information 表格
store_name |
Sales |
Date |
Los Angeles |
$1500 |
Jan-05-1999 |
San Diego |
$250 |
Jan-07-1999 |
Los Angeles |
$300 |
Jan-08-1999 |
Boston |
$700 |
Jan-08-1999 |
我们就键入,
SELECT DISTINCT store_name FROM Store_Information
结果:
store_name
Los Angeles
San Diego
Boston
WHERE
我们并不一定每一次都要将表格内的资料都完全抓出。在许多时候,我们会需要选择性地抓资料。就我们的例子来说,我们可能只要抓出营业额超过 $1,000 的资料。要做到这一点,我们就需要用到 WHERE 这个指令。这个指令的语法如下:
SELECT "栏位名"
FROM "表格名"
WHERE "条件"
比较运算符(大小比较):>、>=、=、<、<=、!<、!>、!=
例:返回96年1月的定单
SELECT orderID, CustomerID, orderDate
FROM orders
WHERE orderDate〉#1/1/96#AND orderDate〈#1/30/96#
注意:
Mcirosoft JET SQL 中,日期用‘#’定界。日期也可以用Datevalue()函数来代替。在比较字符型的数据时,要加上单引号’’,尾空格在比较中被忽略。
例:
WHERE orderDate〉#96-1-1#
也可以表示为:
WHERE orderDate〉Datevalue(‘1/1/96’)
若我们要由以下的表格抓出营业额超过 $1,000 的资料,
Store_Information 表格
store_name |
Sales |
Date |
Los Angeles |
$1500 |
Jan-05-1999 |
San Diego |
$250 |
Jan-07-1999 |
Los Angeles |
$300 |
Jan-08-1999 |
Boston |
$700 |
Jan-08-1999 |
我们就键入,
SELECT store_name
FROM Store_Information
WHERE Sales > 1000
结果:
store_name
Los Angeles
ANDOR
在上一页中,我们看到 WHERE 指令可以被用来由表格中有条件地选取资料。 这个条件可能是简单的 (像上一页的例子),也可能是复杂的。复杂条件是由二或多个简单条件透过 AND 或是 OR的连接而成。一个 SQL 语句中可以有无限多个简单条件的存在。
复杂条件的语法如下:
SELECT "栏位名"
FROM "表格名"
WHERE "简单条件"
{[AND|OR] "简单条件"}+
{}+ 代表{}之内的情况会发生一或多次。在这里的意思就是 AND 加简单条件及 OR 加简单条件的情况可以发生一或多次。另外,我们可以用 () 来代表条件的先后次序。
举例来说,我们若要在 Store_Information 表格中选出所有 Sales 高于 $1,000或是 Sales 在 $500 及 $275 之间的资料的话,
Store_Information 表格
store_name |
Sales |
Date |
Los Angeles |
$1500 |
Jan-05-1999 |
San Diego |
$250 |
Jan-07-1999 |
San Francisco |
$300 |
Jan-08-1999 |
Boston |
$700 |
Jan-08-1999 |
我们就键入,
SELECT store_name
FROM Store_Information
WHERE Sales > 1000
OR (Sales < 500 ANDSales > 275)
结果:
store_name
Los Angeles
San Francisco
IN
在 SQL 中,在两个情况下会用到IN 这个指令;这一页将介绍其中之一:与 WHERE 有关的那一个情况。在这个用法下,我们事先已知道至少一个我们需要的值,而我们将这些知道的值都放入 IN 这个子句。 IN 指令的语法为下:
SELECT "栏位名"
FROM "表格名"
WHERE "栏位名"IN (‘值一‘, ‘值二‘, ...)
在括号内可以有一或多个值,而不同值之间由逗点分开。值可以是数目或是文字。若在括号内只有一个值,那这个子句就等于
WHERE "栏位名"= ‘值一‘
举例来说,若我们要在 Store_Information 表格中找出所有含盖 Los Angeles 或 SanDiego 的资料,
Store_Information 表格
store_name |
Sales |
Date |
Los Angeles |
$1500 |
Jan-05-1999 |
San Diego |
$250 |
Jan-07-1999 |
San Francisco |
$300 |
Jan-08-1999 |
Boston |
$700 |
Jan-08-1999 |
我们就键入,
SELECT *
FROM Store_Information
WHERE store_name IN (‘Los Angeles‘, ‘San Diego‘)
结果:
store_name |
Sales |
Date |
Los Angeles |
$1500 |
Jan-05-1999 |
San Diego |
$250 |
Jan-07-1999 |
BETWEEN
IN 这个指令可以让我们依照一或数个不连续 (discrete) 的值的限制之内抓出资料库中的值,而 BETWEEN 则是让我们可以运用一个范围 (range) 内抓出资料库中的值。BETWEEN这个子句的语法如下:
SELECT "栏位名"
FROM "表格名"
WHERE "栏位名"BETWEEN ‘值一‘ AND ‘值二‘
这将选出栏位值包含在值一及值二之间的每一笔资料。
举例来说,若我们要由 Store_Information 表格中找出所有介于 January 6, 1999 及 January10, 1999 中的资料,
Store_Information 表格
store_name |
Sales |
Date |
Los Angeles |
$1500 |
Jan-05-1999 |
San Diego |
$250 |
Jan-07-1999 |
San Francisco |
$300 |
Jan-08-1999 |
Boston |
$700 |
Jan-08-1999 |
我们就键入,
SELECT *
FROM Store_Information
WHERE Date BETWEEN ‘Jan-06-1999‘ AND‘Jan-10-1999‘
请读者注意:在不同的数据库中,日期的储存法可能会有所不同。在这里我们选择了其中一种储存法。
结果:
store_name |
Sales |
Date |
San Diego |
$250 |
Jan-07-1999 |
San Francisco |
$300 |
Jan-08-1999 |
Boston |
$700 |
Jan-08-1999 |
LIKE
LIKE 是另一个在 WHERE 子句中会用到的指令。基本上, LIKE 能让我们依据一个模式 (pattern) 来找出我们要的资料。相对来说,在运用 IN 的时候,我们完全地知道我们需要的条件;在运用 BETWEEN 的时候,我们则是列出一个范围。 LIKE 的语法如下:
SELECT "栏位名"
FROM "表格名"
WHERE "栏位名"LIKE {模式}
LIKE运算符里使用的通配符
通配符含义
?任何一个单一的字符
* 任意长度的字符
# 0~9之间的单一数字
[字符列表]在字符列表里的任一值
[!字符列表] 不在字符列表里的任一值
- 指定字符范围,两边的值分别为其上下限
{模式} 经常包括野卡 (wildcard). 以下是几个例子:
‘A_Z‘: 所有以 ‘A‘ 起头,另一个任何值的字原,且以 ‘Z‘ 为结尾的字符串。‘ABZ‘ 和 ‘A2Z‘ 都符合这一个模式,而‘AKKZ‘ 并不符合 (因为在 A 和 Z 之间有两个字原,而不是一个字原)。
‘ABC%‘: 所有以 ‘ABC‘ 起头的字符串。举例来说,‘ABCD‘ 和‘ABCABC‘ 都符合这个模式。
‘%XYZ‘: 所有以 ‘XYZ‘ 结尾的字符串。举例来说,‘WXYZ‘ 和 ‘ZZXYZ‘都符合这个模式。
‘%AN%‘: 所有含有 ‘AN‘这个模式的字符串。举例来说, ‘LOS ANGELES‘ 和 ‘SANFRANCISCO‘ 都符合这个模式。
我们将以上最后一个例子用在我们的 Store_Information 表格上:
Store_Information 表格
store_name |
Sales |
Date |
LOS ANGELES |
$1500 |
Jan-05-1999 |
SAN DIEGO |
$250 |
Jan-07-1999 |
SAN FRANCISCO |
$300 |
Jan-08-1999 |
BOSTON |
$700 |
Jan-08-1999 |
我们就键入,
SELECT *
FROM Store_Information
WHERE store_name LIKE ‘%AN%‘
结果:
store_name |
Sales |
Date |
LOS ANGELES |
$1500 |
Jan-05-1999 |
SAN FRANCISCO |
$300 |
Jan-08-1999 |
SAN DIEGO |
$250 |
Jan-07-1999 |
ODERBY
到目前为止,我们已学到如何藉由 SELECT 及 WHERE 这两个指令将资料由表格中抓出。不过我们尚未提到这些资料要如何排列。这其实是一个很重要的问题。事实上,我们经常需要能够将抓出的资料做一个有系统的显示。这可能是由小往大 (ASCENDing) 或是由大往小(DESCENDing)。在这种情况下,我们就可以运用 ODER BY 这个指令来达到我们的目的。
ODER BY 的语法如下:
SELECT "栏位名"
FROM "表格名"
[WHERE "条件"]
ODER BY "栏位名"[ASC, DESC]
[] 代表 WHERE 子句不是一定需要的。不过,如果 WHERE 子句存在的话,它是在ODER BY 子句之前。 ASC 代表结果会以由小往大的顺序列出,而 DESC 代表结果会以由大往小的顺序列出。如果两者皆没有被写出的话,那我们就会用 ASC。
我们可以照好几个不同的栏位来排顺序。在这个情况下, ODER BY 子句的语法如下(假设有两个栏位):
ODER BY "栏位一"[ASC, DESC],"栏位二" [ASC, DESC]
若我们对这两个栏位都选择由小往大的话,那这个子句就会造成结果是依据 "栏位一"由小往大排。若有好几笔资料 "栏位一"的值相等,那这几笔资料就依据 "栏位二"由小往大排。
举例来说,若我们要依照 Sales 栏位的由大往小列出Store_Information 表格中的资料,
Store_Information 表格
store_name |
Sales |
Date |
Los Angeles |
$1500 |
Jan-05-1999 |
San Diego |
$250 |
Jan-07-1999 |
San Francisco |
$300 |
an-08-1999 |
Boston |
$700 |
Jan-08-1999 |
我们就键入,
SELECT store_name, Sales, Date
FROM Store_Information
ODER BY Sales DESC
结果:
store_name |
Sales |
Date |
Los Angeles |
$1500 |
Jan-05-1999 |
Boston |
$700 |
Jan-08-1999 |
San Francisco |
$300 |
Jan-08-1999 |
San Diego |
$250 |
Jan-07-1999 |
在以上的例子中,我们用栏位名来指定排列顺序的依据。除了栏位名外,我们也可以用栏位的顺序 (依据 SQL 句中的顺序)。在 SELECT 后的第一个栏位为 1,第二个栏位为 2,以此类推。在上面这个例子中,我们用以下这句 SQL 可以达到完全一样的效果:
SELECT store_name, Sales, Date
FROM Store_Information
ODER BY 2 DESC
函数
既然数据库中有许多资料都是已数字的型态存在,一个很重要的用途就是要能够对这些数字做一些运算,例如将它们总合起来,或是找出它们的平均值。SQL 有提供一些这一类的函数。它们是:
AVG (平均)
COUNT (计数)
MAX (最大值)
MIN (最小值)
SUM (总合)
VAR (方差)
STDEV (标准误差)
FIRST (第一个值)
LAST (最后一个值)
运用函数的语法是:
SELECT "函数名"("栏位名")
FROM "表格名"
举例来说,若我们要由我们的范例表格中求出 Sales 栏位的总合,
Store_Information 表格
store_name |
Sales |
Date |
Los Angeles |
$1500 |
Jan-05-1999 |
San Diego |
$250 |
Jan-07-1999 |
Los Angeles |
$300 |
Jan-08-1999 |
Boston |
$700 |
Jan-08-1999 |
我们就键入,
SELECT SUM(Sales) FROM Store_Information
结果:
SUM(Sales)
$2750
$2750 代表所有 Sales 栏位的总合: $1500 + $250 + $300 + $700.
除了函数的运用外,SQL 也可以做简单的数学运算,例如加(+)和减(-)。对于文字类的资料,SQL也有好几个文字处理方面的函数,例如文字相连 (concatenation),文字修整(trim),以及子字符串 (substring)。不同的数据库对这些函数有不同的语法,所以最好是参考您所用数据库的信息,来确定在那个数据库中,这些函数是如何被运用的。
COUNT
在上一页有提到, COUNT 是函数之一。由于它的使用广泛,我们在这里特别提出来讨论。基本上, COUNT 让我们能够数出在表格中有多少笔资料被选出来。它的语法是:
SELECT COUNT("栏位名")
FROM "表格名"
举例来说,若我们要找出我们的范例表格中有几笔 store_name 栏不是空白的资料时,
Store_Information 表格
store_name |
Sales |
Date |
Los Angeles |
$1500 |
Jan-05-1999 |
San Diego |
$250 |
Jan-07-1999 |
Los Angeles |
$300 |
Jan-08-1999 |
Boston |
$700 |
Jan-08-1999 |
我们就键入,
SELECT COUNT(store_name)
FROM Store_Information
WHERE store_name is not NULL
结果:
Count(store_name)
4
"is not NULL" 是 "这个栏位不是空白"的意思。
COUNT 和 DISTINCT 经常被合起来使用,目的是找出表格中有多少笔不同的资料 (至于这些资料实际上是什么并不重要)。举例来说,如果我们要找出我们的表格中有多少个不同的 store_name,我们就键入,
SELECT COUNT(DISTINCT store_name)
FROM Store_Information
结果:
Count(DISTINCTstore_name)
3
GROUP BY
我们现在回到函数上。记得我们用 SUM 这个指令来算出所有的 Sales (营业额)吧!如果我们的需求变成是要算出每一间店 (store_name) 的营业额 (sales),那怎么办呢?在这个情况下,我们要做到两件事:第一,我们对于 store_name 及 Sales 这两个栏位都要选出。第二,我们需要确认所有的 sales 都要依照各个store_name 来分开算。这个语法为:
SELECT "栏位1",SUM("栏位2")
FROM "表格名"
GROUP BY "栏位1"
在我们的范例上,
Store_Information 表格
store_name |
Sales |
Date |
Los Angeles |
$1500 |
Jan-05-1999 |
San Diego |
$250 |
Jan-07-1999 |
Los Angeles |
$300 |
Jan-08-1999 |
Boston |
$700 |
Jan-08-1999 |
我们就键入,
SELECT store_name, SUM(Sales)
FROM Store_Information
GROUP BY store_name
结果:
store_name SUM(Sales)
Los Angeles $1800
San Diego $250
Boston $700
当我们选不只一个栏位,且其中至少一个栏位有包含函数的运用时,我们就需要用到 GROUP BY 这个指令。在这个情况下,我们需要确定我们有 GROUP BY 所有其他的栏位。换句话说,除了有包括函数的栏位外,我们都需要将其放在 GROUP BY 的子句中。
HAVING
那我们如何对函数产生的值来设定条件呢?举例来说,我们可能只需要知道哪些店的营业额有超过 $1,500。在这个情况下,我们不能使用 WHERE 的指令。那要怎么办呢?很幸运地,SQL 有提供一个 HAVING 的指令,而我们就可以用这个指令来达到这个目标。 HAVING 子句通常是在一个 SQL 句子的最后。一个含有HAVING 子句的 SQL 并不一定要包含 GROUP BY 子句。HAVING 的语法如下:
SELECT "栏位1",SUM("栏位2")
FROM "表格名"
GROUP BY "栏位1"
HAVING (函数条件)
请读者注意: 如果被 SELECT 的只有函数栏, 那就不需要 GROUP BY 子句。
在我们 Store_Information 表格这个例子中,
Store_Information 表格
store_name |
Sales |
Date |
Los Angeles |
$1500 |
Jan-05-1999 |
San Diego |
$250 |
Jan-07-1999 |
Los Angeles |
$300 |
Jan-08-1999 |
Boston |
$700 |
Jan-08-1999 |
若我们要找出 Sales 大于 $1,500的 store_name,我们就键入,
SELECT store_name, SUM(sales)
FROM Store_Information
GROUP BY store_name
HAVING SUM(sales) > 1500
结果:
store_name SUM(Sales)
Los Angeles $1800
ALIAS
接下来,我们讨论 alias (别名) 在 SQL 上的用处。最常用到的别名有两种:栏位别名及表格别名。
简单地来说,栏位别名的目的是为了让 SQL 产生的结果易读。在之前的例子中,每当我们有营业额总合时,栏位名都是 SUM(sales)。虽然在这个情况下没有什么问题,可是如果这个栏位不是一个简单的总合,而是一个复杂的计算,那栏位名就没有这么易懂了。若我们用栏位别名的话,就可以确认结果中的栏位名是简单易懂的。
第二种别名是表格别名。要给一个表格取一个别名,只要在 FROM 子句中的表格名后空一格,然后再列出要用的表格别名就可以了。这在我们要用 SQL 由数个不同的表格中获取资料时是很方便的。这一点我们在之后谈到连接 (join) 时会看到。
我们先来看一下栏位别名和表格别名的语法:
SELECT "表格别名"."栏位1" "栏位别名"
FROM "表格名""表格别名"
或者:
SELECT "表格名"AS "表格别名"
基本上,这两种别名都是放在它们要替代的物件后面,而它们中间由一个空白分开。我们继续使用 Store_Information 这个表格来做例子:
Store_Information 表格
store_name |
Sales |
Date |
Los Angeles |
$1500 |
Jan-05-1999 |
San Diego |
$250 |
Jan-07-1999 |
Los Angeles |
$300 |
Jan-08-1999 |
Boston |
$700 |
Jan-08-1999 |
我们用跟 SQL GROUP BY 那一页一样的例子。这里的不同处是我们加上了栏位别名以及表格别名:
SELECT A1.store_name Store, SUM(A1.Sales) "Total Sales"
FROM Store_Information A1
GROUP BY A1.store_name
结果:
Store Total Sales
Los Angeles $1800
San Diego $250
Boston $700
在结果中,资料本身没有不同。不同的是栏位的标题。这是运用栏位别名的结果。在第二个栏位上,原本我们的标题是 "Sum(Sales)",而现在我们有一个很清楚的 "Total Sales"。很明显地, "Total Sales" 能够比 "Sum(Sales)" 更精确地阐述这个栏位的含意。用表格别名的好处在这里并没有显现出来,不过这在 下一页就会很清楚了。
表格链接
现在我们介绍连接(join)的概念。要了解连接,我们需要用到许多我们之前已介绍过的指令。我们先假设我们有以下的两个表格,
Store_Information 表格
store_name |
Sales |
Date |
Los Angeles |
$1500 |
Jan-05-1999 |
San Diego |
$250 |
Jan-07-1999 |
Los Angeles |
$300 |
Jan-08-1999 |
Boston |
$700 |
Jan-08-1999 |
Geography 表格
region_name |
store_name |
East |
Boston |
East |
New York |
West |
Los Angeles |
West |
San Diego |
而我们要知道每一区 (region_name) 的营业额(sales)。 Geography 这个表格告诉我们每一区有哪些店,而 Store_Information 告诉我们每一个店的营业额。若我们要知道每一区的营业额,我们需要将这两个不同表格中的资料串联起来。当我们仔细了解这两个表格后,我们会发现它们可经由一个相同的栏位,store_name,连接起来。我们先将SQL 句列出,之后再讨论每一个子句的意义:
SELECT A1.region_name REGION, SUM(A2.Sales) SALES
FROM Geography A1, Store_Information A2
WHERE A1.store_name = A2.store_name
GROUP BY A1.region_name
结果:
REGION SALES
East $700
West $2050
在第一行中,我们告诉 SQL 去选出两个栏位:第一个栏位是Geography 表格中的 region_name 栏位 (我们取了一个别名叫做 REGION);第二个栏位是 Store_Information 表格中的 sales 栏位 (别名为 SALES)。请注意在这里我们有用到表格别名:Geography 表格的别名是 A1,Store_Information 表格的别名是 A2。若我们没有用表格别名的话,第一行就会变成
SELECT Geography.region_name REGION, SUM(Store_Information.Sales) SALES
很明显地,这就复杂多了。在这里我们可以看到表格别名的功用:它能让 SQL 句容易被了解,尤其是这个 SQL 句含盖好几个不同的表格时。
接下来我们看第三行,就是 WHERE 子句。这是我们阐述连接条件的地方。在这里,我们要确认 Geography 表格中store_name 栏位的值与 Store_Information 表格中 store_name 栏位的值是相等的。这个 WHERE 子句是一个连接的灵魂人物,因为它的角色是确定两个表格之间的连接是正确的。如果 WHERE 子句是错误的,我们就极可能得到一个笛卡儿连接 (Cartesian join)。笛卡儿连接会造成我们得到所有两个表格每两行之间所有可能的组合。在这个例子中,笛卡儿连接会让我们得到 4 x 4 = 16 行的结果。
外部链接
之前我们看到的左连接 (left join),又称内部连接(inner join)。在这个情况下,要两个表格内都有同样的值,那一笔资料才会被选出。那如果我们想要列出一个表格中每一笔的资料,无论它的值在另一个表格中有没有出现,那该怎么办呢?在这个时候,我们就需要用到 SQL OUTER JOIN (外部连接) 的指令。
外部连接的语法是依数据库的不同而有所不同的。举例来说,在 Oracle 上,我们会在 WHERE 子句中要选出所有资料的那个表格之后加上一个"(+)" 来代表说这个表格中的所有资料我们都要。
假设我们有以下的两个表格:
Store_Information 表格
store_name |
Sales |
Date |
Los Angeles |
$1500 |
Jan-05-1999 |
San Diego |
$250 |
Jan-07-1999 |
Los Angeles |
$300 |
Jan-08-1999 |
Boston |
$700 |
Jan-08-1999 |
Geography 表格
region_name |
store_name |
East |
Boston |
East |
New York |
West |
Los Angeles |
West |
San Diego |
我们需要知道每一间店的营业额。如果我们用一个普通的连接,我们将会漏失掉 ‘New York‘这个店,因为它并不存在于 Store_Information 这个表格。所以,在这个情况下,我们需要用外部连接来串联这两个表格:
SELECT A1.store_name, SUM(A2.Sales) SALES
FROM Georgraphy A1, Store_Information A2
WHERE A1.store_name = A2.store_name (+)
GROUP BY A1.store_name
我们在这里是使用了 Oracle 的外部连接语法。
结果:
store_name SALES
Boston $700
New York
Los Angeles $1800
San Diego $250
请注意: 当第二个表格没有相对的资料时, SQL 会传回 NULL 值。在这一个例子中, ‘New York‘ 并不存在于Store_Information 表格,所以它的 "SALES" 栏位是 NULL.
CONCATENATE
有的时候,我们有需要将由不同栏位获得的资料串连在一起。每一种数据库都有提供方法来达到这个目的:
MySQL: CONCAT()
Oracle: CONCAT(), ||
SQL Server: +
CONCAT() 的语法如下:
CONCAT(字符串1, 字符串2, 字符串3, ...): 将字符串1、字符串2、字符串3,等字符串连在一起。请注意,Oracle的CONCAT()只允许两个参数;换言之,一次只能将两个字符串串连起来。不过,在Oracle中,我们可以用‘||‘来一次串连多个字符串。
来看一个例子。假设我们有以下的表格:
Geography 表格
region_name |
store_name |
East |
Boston |
East |
New York |
West |
Los Angeles |
West |
San Diego |
例子1:
MySQL/Oracle:
SELECT CONCAT(region_name,store_name) FROMGeography
WHERE store_name = ‘Boston‘;
结果:
‘EastBoston‘
例子2:
Oracle:
SELECT region_name || ‘ ‘ || store_name FROMGeography
WHERE store_name = ‘Boston‘;
结果:
‘East Boston‘
例子3:
SQL Server:
SELECT region_name + ‘ ‘ + store_name FROMGeography
WHERE store_name = ‘Boston‘;
结果:
‘East Boston‘
SUBSTRING
SQL 中的 substring 函数是用来抓出一个栏位资料中的其中一部分。这个函数的名称在不同的数据库中不完全一样:
MySQL: SUBSTR(), SUBSTRING()
Oracle: SUBSTR()
SQL Server: SUBSTRING()
最常用到的方式如下 (在这里我们用SUBSTR()为例):
SUBSTR(str,pos): 由<str>中,选出所有从第<pos>位置开始的字符。请注意,这个语法不适用于SQL Server上。
SUBSTR(str,pos,len): 由<str>中的第<pos>位置开始,选出接下去的<len>个字符。
假设我们有以下的表格:
Geography 表格
region_name |
store_name |
East |
Boston |
East |
New York |
West |
Los Angeles |
West |
San Diego |
例1:
SELECT SUBSTR(store_name, 3)
FROM Geography
WHERE store_name = ‘Los Angeles‘;
结果:
‘s Angeles‘
例2:
SELECT SUBSTR(store_name,2,4)
FROM Geography
WHERE store_name = ‘San Diego‘;
结果:
‘an D‘
进阶SQL
在这一部分,我们将介绍以下的 SQL 概念及关键字:
我们并介绍如何用 SQL 来做出以下的运算:
UNION
UNION 指令的目的是将两个 SQL 语句的结果合并起来。从这个角度来看, UNION 跟 JOIN 有些许类似,因为这两个指令都可以由多个表格中撷取资料。 UNION 的一个限制是两个 SQL 语句所产生的栏位需要是同样的资料种类。另外,当我们用 UNION 这个指令时,我们只会看到不同的资料值 (类似 SELECT DISTINCT)。
UNION 的语法如下:
[SQL 语句 1]
UNION
[SQL 语句 2]
假设我们有以下的两个表格,
Store_Information 表格
store_name |
Sales |
Date |
Los Angeles |
$1500 |
Jan-05-1999 |
San Diego |
$250 |
Jan-07-1999 |
Los Angeles |
$300 |
Jan-08-1999 |
Boston |
$700 |
Jan-08-1999 |
Internet_Sales 表格
Date |
Sales |
Jan-07-1999 |
$250 |
Jan-10-1999 |
$535 |
Jan-11-1999 |
$320 |
Jan-12-1999 |
$750 |
而我们要找出来所有有营业额 (sales) 的日子。要达到这个目的,我们用以下的 SQL 语句:
SELECT Date FROM Store_Information
UNION
SELECT Date FROM Internet_Sales
结果:
Date
Jan-05-1999
Jan-07-1999
Jan-08-1999
Jan-10-1999
Jan-11-1999
Jan-12-1999
有一点值得注意的是,如果我们在任何一个 SQL 语句 (或是两句都一起) 用 "SELECT DISTINCTDate" 的话,那我们会得到完全一样的结果。
UNION ALL
UNION ALL 这个指令的目的也是要将两个 SQL 语句的结果合并在一起。UNION ALL 和 UNION 不同之处在于 UNION ALL 会将每一笔符合条件的资料都列出来,无论资料值有无重复。
UNION ALL 的语法如下:
[SQL 语句 1]
UNION ALL
[SQL 语句 2]
我们用和上一页同样的例子来显示出UNION ALL 和 UNION 的不同。同样假设我们有以下两个表格,
Store_Information 表格
store_name |
Sales |
Date |
Los Angeles |
$1500 |
Jan-05-1999 |
San Diego |
$250 |
Jan-07-1999 |
Los Angeles |
$300 |
Jan-08-1999 |
Boston |
$700 |
Jan-08-1999 |
Internet_Sales 表格
Date |
Sales |
Jan-07-1999 |
$250 |
Jan-10-1999 |
$535 |
Jan-11-1999 |
$320 |
Jan-12-1999 |
$750 |
而我们要找出有店面营业额以及网络营业额的日子。要达到这个目的,我们用以下的 SQL 语句:
SELECT Date FROM Store_Information
UNION ALL
SELECT Date FROM Internet_Sales
结果:
Date
Jan-05-1999
Jan-07-1999
Jan-08-1999
Jan-08-1999
Jan-07-1999
Jan-10-1999
Jan-11-1999
Jan-12-1999
INTERSECT
和 UNION 指令类似,INTERSECT 也是对两个 SQL 语句所产生的结果做处理的。不同的地方是, UNION 基本上是一个 OR (如果这个值存在于第一句或是第二句,它就会被选出),而 INTERSECT则比较像 AND (这个值要存在于第一句和第二句才会被选出)。 UNION是联集,而 INTERSECT 是交集。
INTERSECT 的语法如下:
[SQL 语句 1]
INTERSECT
[SQL 语句 2]
假设我们有以下的两个表格,
Store_Information 表格
store_name |
Sales |
Date |
Los Angeles |
$1500 |
Jan-05-1999 |
San Diego |
$250 |
Jan-07-1999 |
Los Angeles |
$300 |
Jan-08-1999 |
Boston |
$700 |
Jan-08-1999 |
Internet_Sales 表格
Date |
Sales |
Jan-07-1999 |
$250 |
Jan-10-1999 |
$535 |
Jan-11-1999 |
$320 |
Jan-12-1999 |
$750 |
而我们要找出哪几天有店面交易和网络交易。要达到这个目的,我们用以下的 SQL 语句:
SELECT Date FROM Store_Information
INTERSECT
SELECT Date FROM Internet_Sales
结果:
Date
Jan-07-1999
请注意,在 INTERSECT 指令下,不同的值只会被列出一次。
MINUS
MINUS 指令是运用在两个 SQL 语句上。它先找出第一个SQL 语句所产生的结果,然后看这些结果有没有在第二个 SQL 语句的结果中。如果有的话,那这一笔资料就被去除,而不会在最后的结果中出现。如果第二个 SQL 语句所产生的结果并没有存在于第一个 SQL 语句所产生的结果内,那这笔资料就被抛弃。
MINUS 的语法如下:
[SQL 语句 1]
MINUS
[SQL 语句 2]
我们继续使用一样的例子:
Store_Information 表格
store_name |
Sales |
Date |
Los Angeles |
$1500 |
Jan-05-1999 |
San Diego |
$250 |
Jan-07-1999 |
Los Angeles |
$300 |
Jan-08-1999 |
Boston |
$700 |
Jan-08-1999 |
Internet_Sales 表格
Date |
Sales |
Jan-07-1999 |
$250 |
Jan-10-1999 |
$535 |
Jan-11-1999 |
$320 |
Jan-12-1999 |
$750 |
而我们要知道有哪几天是有店面营业额而没有网络营业额的。要达到这个目的,我们用以下的 SQL 语句:
SELECT Date FROM Store_Information
MINUS
SELECT Date FROM Internet_Sales
结果:
Date
Jan-05-1999
Jan-08-1999
"Jan-05-1999","Jan-07-1999", AND"Jan-08-1999" 是 "SELECTDate FROM Store_Information" 所产生的结果。在这里面, "Jan-07-1999" 是存在于 "SELECT Date FROMInternet_Sales" 所产生的结果中。因此"Jan-07-1999" 并不在最后的结果中。
请注意,在 MINUS 指令下,不同的值只会被列出一次。
子查询
我们可以在一个 SQL 语句中放入另一个SQL 语句。当我们在 WHERE 子句或 HAVING 子句中插入另一个SQL 语句时,我们就有一个子查询 (subquery) 的架构。 子查询的作用是什么呢?第一,它可以被用来连接表格。另外,有的时候子查询是唯一能够连接两个表格的方式。
子查询的语法如下:
SELECT "栏位1"
FROM "表格"
WHERE "栏位2"[比较运算素]
(SELECT "栏位1"
FROM "表格"
WHERE [条件])
[比较运算素] 可以是相等的运算素,例如 =, >, <, >=, <=. 这也可以是一个对文字的运算素,例如 "LIKE"。绿色的部分代表外查询,红色的部分代表内查询。
我们就用刚刚在阐述 SQL 连接时用过的例子:
Store_Information 表格
store_name |
Sales |
Date |
Los Angeles |
$1500 |
Jan-05-1999 |
San Diego |
$250 |
Jan-07-1999 |
Los Angeles |
$300 |
Jan-08-1999 |
Boston |
$700 |
Jan-08-1999 |
Geography 表格
region_name |
store_name |
East |
Boston |
East |
New York |
West |
Los Angeles |
West |
San Diego |
我们要运用 subquery 来找出所有在西部的店的营业额。我们可以用下面的 SQL 来达到我们的目的:
SELECT SUM(Sales) FROM Store_Information
WHERE Store_name IN
(SELECTstore_name FROM Geography
WHERE region_name = ‘West‘)
结果:
SUM(Sales)
2050
在这个例子中,我们并没有直接将两个表格连接起来,然后由此直接算出每一间西区店面的营业额。我们做的是先找出哪些店是在西区的,然后再算出这些店的营业额总共是多少。
在以上的例子,内部查询本身与外部查询没有关系。这一类的子查询称为『简单子查询』 (Simple Subquery)。如果内部查询是要利用到外部查询提到的表格中的栏位,那这个字查询就被称为『相关子查询』 (Correlated Subquery)。以下是一个相关子查询的例子:
SELECT SUM(a1.Sales) FROMStore_Information a1
WHERE a1.Store_name IN
(SELECTstore_name FROM Geography a2
WHERE a2.store_name = a1.store_name)
红色部分即是外部查询提到的表格中的栏位。
EXISTS
在上一页中,我们用 IN 来连接内查询和外查询。另外有数个方式,例如 >, <, 及 =,都可以用来连接内查询和外查询。 EXISTS 也是其中一种方式。这一页我们将讨论 EXISTS 的用法。
基本上, EXISTS 是用来测试内查询有没有产生任何结果。如果有的话,系统就会执行外查询中的 SQL。若是没有的话,那整个SQL 语句就不会产生任何结果。
EXISTS 的语法是:
SELECT "栏位1"
FROM "表格1"
WHERE EXISTS
(SELECT *
FROM "表格2"
WHERE [条件])
在内查询中,我们并不一定要用 * 来选出所有的栏位。我们也可以选择表格2中的任何栏位。这两种做法最后的结果是一样的。
来看一个例子。假设我们有以下的两个表格:
Store_Information 表格
store_name |
Sales |
Date |
Los Angeles |
$1500 |
Jan-05-1999 |
San Diego |
$250 |
Jan-07-1999 |
Los Angeles |
$300 |
Jan-08-1999 |
Boston |
$700 |
Jan-08-1999 |
Geography 表格
region_name |
store_name |
East |
Boston |
East |
New York |
West |
Los Angeles |
West |
San Diego |
而我们打入的 SQL 是:
SELECT SUM(Sales) FROM Store_Information
WHERE EXISTS
(SELECT * FROM Geography
WHERE region_name = ‘West‘)
我们会得到以下的答案:
SUM(Sales)
2750
乍看之下,这个答案似乎不太正确,因为内查询有包含一个 [region_name = ‘West‘] 的条件,可是最后的答案并没有包含这个条件。实际上,这并没有问题。在这个例子中,内查询产生了超过一笔的资料,所以 EXISTS 的条件成立,所以外查询被执行。而外查询本身并没有包含 [region_name = ‘West‘] 这个条件。
CASE
CASE 是 SQL 用来做为 IF-THEN-ELSE 之类逻辑的关键字。 CASE 的语法如下:
SELECT CASE ("栏位名")
WHEN "条件1" THEN "结果1"
WHEN "条件2" THEN "结果2"
...
[ELSE "结果N"]
END
FROM "表格名"
"条件" 可以是一个数值或是公式。 ELSE 子句则并不是必须的。
在我们的 Store_Information 中
Store_Information 表格
store_name Sales Date
Los Angeles $1500 Jan-05-1999
San Diego $250 Jan-07-1999
San Francisco $300 Jan-08-1999
Boston $700 Jan-08-1999
若我们要将 ‘Los Angeles‘ 的 Sales 数值乘以2,以及将 ‘San Diego‘ 的 Sales 数值乘以1.5,我们就键入以下的 SQL:
SELECT store_name, CASE store_name
WHEN ‘Los Angeles‘ THENSales * 2
WHEN ‘San Diego‘ THENSales * 1.5
ELSE Sales
END
"New Sales",
Date
FROM Store_Information
"New Sales" 是用到 CASE 那个栏位的栏位名。
结果:
store_name |
New Sales |
Date |
Los Angeles |
$3000 |
Jan-05-1999 |
San Diego |
$375 |
Jan-07-1999 |
San Francisco |
$300 |
Jan-08-1999 |