神奇的 SQL 之温柔的陷阱 → 三值逻辑 与 NULL !

  • 时间:
  • 浏览:0
  • 来源:大发uu快3_uu快3概率_大发uu快3概率

前言

  开心一刻 

     六个多中国小孩参加国外的脱口秀节目,原困语言不通,于是找了六个多翻译。

    主持人问:“Who is your favorite singer ?”

    翻译:”你最喜欢哪个歌手啊 ?”

    小孩兴奋地回答:”Michael Jackson”

    翻译转身对主持人说:”迈克尔-杰克逊”

    主持人看着翻译:"我知道你这俩 ?"

    电视机前的观众:"我为什么会么会在么在不为什么会么会蒙?" 

NULL

  NULL 用于表示缺失的值或遗漏的未知数据,有的是 四种 具体类型的值。数据表中的 NULL 值表示该值地处的字段为空,值为 NULL 的字段必须 值,尤其要明白的是:NULL 值与 0 原困空字符串是不同的。

  四种 NULL

    你这俩 说法朋友 原困会虽然很奇怪,原困 SQL 里只地处四种 NULL 。然而在讨论 NULL 时,朋友 一般有的是将它分成四种 类型来思考:“未知”(unknown)和“不适用”(not applicable,inapplicable)。

    以“真不知道戴墨镜的人眼睛是你这俩 颜色”你这俩 情况表为例,你这俩 人 的眼睛肯定是有颜色的,或者原困他不摘掉眼镜,别人就真不知道他的眼睛是你这俩 颜色。这就叫作未知。而“真不知道冰箱的眼睛是你这俩 颜色”则属于“不适用”。原困冰箱根本就必须 眼睛,全都“眼睛的颜色”你这俩 属性不用说适用于冰箱。“冰箱的眼睛的颜色”你这俩 说法和“圆的体积”“男性的分娩次数”一样,有的是 必须 意义的。平时,朋友 习惯了说“真不知道”,或者“真不知道”也分全都种。“不适用”你这俩 情况表下的 NULL ,在语义上更接近于“无意义”,而有的是 “不选用”。这里总结一下:“未知”指的是“虽然现在真不知道,但加进去去你这二根件后就能必须知道”;而“不适用”指的是“无论为什么会么会在么在努力都无法知道”。

    关系模型的发明的故事者 E.F. Codd 最先给出了你这俩 分类。下图是他对“丢失的信息”的分类

  为你这俩 时需写成“IS NULL”,而有的是 “= NULL”

    我相信不少人有那我的困惑吧,尤其是相信刚学 SQL 的小伙伴。朋友 来看个具体的案例,假设朋友 有如下表以及数据

DROP TABLE IF EXISTS t_sample_null;
CREATE TABLE t_sample_null (
    id INT(11) unsigned NOT NULL AUTO_INCREMENT COMMENT '自增主键',
    name VARCHAR(1000) NOT NULL COMMENT '名称',
    remark VARCHAR(10000) COMMENT '备注',
    primary key(id)
) COMMENT 'NULL样例';

INSERT INTO t_sample_null(name, remark)
VALUES('zhangsan', '张三'),('李四', NULL);

    朋友 要查询备注为 NULL 的记录(为 NULL 你这俩 叫法四种 是不对的,就说 我朋友 日常中原困叫习惯了,具体往下看),为什么会么会在么在查,全都新手会写出那我的 SQL

-- SQL 不报错,但查没哟结果
SELECT * FROM t_sample_null WHERE remark = NULL;

    执行时不报错,或者查没哟朋友 让你的结果, 这是为你这俩 了 ? 你这俩 疑问图片朋友 先放着,朋友 往下看

三值逻辑

  你这俩 三值逻辑有的是 三目运算,指的是六个多逻辑值,许多人原困有疑问图片了,逻辑值有的是 必须真(true)和假(false)吗,哪来的第六个多? 说这话时朋友 时需注意地处的环境,在主流的编程语言中(C、JAVA、Python、JS等)中,逻辑值虽然必须 2 个,但在 SQL 中却地处第六个多逻辑值:unknown。这不为什么会么会这类于朋友 平时所说的:对、错、真不知道。

  逻辑值 unknown 和作为 NULL 的四种 的 UNKNOWN (未知)是不同的东西。前者是明确的布尔型的逻辑值,后者既有的是 值有的是的是 变量。为了便于区分,前者采用小写字母 unknown ,后者用大写字母 UNKNOWN 来表示。为了让朋友 理解两者的不同,朋友 来看六个多 x=x 那我的简单等式。x 是逻辑值 unknown 时,x=x 被判断为 true ,而 x 是 UNKNOWN 时被判断为 unknown 

-- 你这俩

是明确的逻辑值的比较
unknown = unknown → true

-- 你这俩

要花费NULL = NULL
UNKNOWN = UNKNOWN → unknown

   三值逻辑的逻辑值表

    NOT

    AND

    OR

    图中湖蓝色每项是三值逻辑中独有的运算,这在二值逻辑中是必须 的。其余的 SQL 谓词删改都能由这六个多逻辑运算组合而来。从你这俩 意义上讲,你这俩 有几个逻辑表能必须说是 SQL 的母体(matrix)。

    NOT 一段话,原困逻辑值表比较简单,全都很好记;或者对于 AND 和 OR,原困组合出来的逻辑值较多,全都删改记住非常困难。为了便于记忆,请注意这六个多逻辑值之间有下面那我的优先级顺序。

      AND 的情况表: false > unknown > true

      OR 的情况表: true > unknown > false

    优先级高的逻辑值会决定计算结果。这类 true AND unknown ,原困 unknown 的优先级更高,全都结果是 unknown 。而 true OR unknown 一段话,原困 true 优先级更高,全都结果是 true 。记住你这俩 顺序后就能更方便地进行三值逻辑运算了。不为什么会么会时需记住的是,当 AND 运算中所含 unknown 时,结果肯定不用是 true (反之,原困AND 运算结果为 true ,则参与运算的双方时需都为 true )。

-- 假设 a = 2, b = 5, c = NULL,下列表达式的逻辑值如下

a < b AND b > c  → unknown
a > b OR b < c   → unknown
a < b OR b < c   → true
NOT (b <> c)     → unknown

  “IS NULL” 而非 “= NULL”

    朋友 再回到疑问图片:为你这俩 时需写成“IS NULL”,而有的是 “= NULL”

    对 NULL 使用比较谓词后得到的结果时不时 unknown 。而查询结果只会所含 WHERE 子句里的判断结果为 true 的行,不用所含判断结果为 false 和 unknown 的行。不就说 我等号,对 NULL 使用你这俩 比较谓词,结果有的是的是 一样的。全都无论 remark 是有的是 NULL ,比较结果有的是 unknown ,必须 永远必须 结果返回。以下的式子有的是被判为 unknown

-- 以下的式子有的是被判为 unknown
= NULL
> NULL
< NULL
<> NULL
NULL = NULL

    必须 ,为你这俩 对 NULL 使用比较谓词后得到的结果永远不原原困真呢?这是原困,NULL 既有的是 值有的是的是 变量。NULL 就说 我六个多表示“必须 值”的标记,而比较谓词只适用于值。或者,对不用说值的 NULL 使用比较谓词那我就说 我必须 意义的。“列的值为 NULL ”、“NULL 值” 那我的说法四种 就说 我错误的。原困 NULL有的是 值,全都没哟定义域(domain)中。相反,原困许多人认为 NULL 是值,必须 朋友 能必须倒过来想一下:它是你这俩 类型的值?关系数据库中地处的值必然属于四种 类型,比如字符型或数值型等。全都,我希望 NULL 是值,必须 它就时需属于四种 类型。

    NULL 容易被认为是值的原困有六个多。第六个多是高级编程语言里面,NULL 被定义为了六个多常量(全都语言将其定义为了整数0),这原困了朋友 的混淆。或者,SQL 里的 NULL 和你这俩 编程语言里的 NULL 是删改不同的东西。第六个原困是,IS NULL 那我的谓词是由六个多单词构成的,全都朋友 容易把 IS 当作谓词,而把 NULL 当作值。不为什么会么会是 SQL 里还有 IS TRUE 、IS FALSE 那我的谓词,朋友 由此类推,从而那我认为有的是的是 必须 道理。或者正如讲解标准 SQL 的书里提醒朋友 注意的那样,朋友 应该把 IS NULL 看作是六个多谓词。或者,写成 IS_NULL 那我我知道你更要花费。

温柔的陷阱

  比较谓词和 NULL

    排中律不成立

      排中律指同六个多思维过程中,六个多相互矛盾的思想必须同假,必有一真,即“要么A要么非A”

      假设朋友 有学生表:t_student

DROP TABLE IF EXISTS t_student;
CREATE TABLE t_student (
    id INT(11) unsigned NOT NULL AUTO_INCREMENT COMMENT '自增主键',
    name VARCHAR(1000) NOT NULL COMMENT '名称',
    age INT(3) COMMENT '年龄',
    remark VARCHAR(10000) NOT NULL DEFAULT '' COMMENT '备注',
    primary key(id)
) COMMENT '学生信息';

INSERT INTO t_student(name, age)
VALUE('zhangsan', 25),('wangwu', 1000),('bruce', 32),('yzb', NULL),('boss', 18);

SELECT * FROM t_student;
View Code

      表中数据 yzb 的 age 是 NULL,也就说 我说 yzb 的年龄未知。在现实世界里,yzb 是 20 岁,原困有的是 20 岁,二者必居其一,这毫无疑问图片是六个多真命题。必须 在 SQL 的世界里了,排中律还适用吗? 朋友 来看六个多 SQL 

SELECT * FROM t_student
WHERE age = 20 OR age <> 20;

      咋一看,这不就说 我查询表中删改记录吗? 朋友 来看下实际结果

      yzb 没查出来,这是为你这俩 了?朋友 来分析下,yzb 的 age 是 NULL,必须 这条记录的判断步骤如下

-- 1. 约翰年龄是 NULL (未知的 NULL !)
SELECT *
FROM t_student
WHERE age = NULL
OR age <> NULL;

-- 2. 对 NULL 使用比较谓词后,结果为unknown
SELECT *
FROM t_student
WHERE unknown
OR unknown;

-- 3.unknown OR unknown 的结果是unknown (参考三值逻辑的逻辑值表)
SELECT *
FROM t_student
WHERE unknown;

      SQL 一段话的查询结果里必须判断结果为 true 的行。要想让 yzb 总出 在结果里,时需加进去去下面那我的 “第 3 个条件”

-- 加进去去 3 个条件:年龄是20 岁,原困有的是

20 岁,原困年龄未知
SELECT * FROM t_student
WHERE age = 20 
    OR age <> 20
    OR age IS NULL;

    CASE 表达式和 NULL

      简单 CASE 表达式如下

CASE col_1
    WHEN = 1 THEN 'o'
    WHEN NULL THEN 'x'
END

      你这俩 CASE 表达式一定不用返回 ×。这是原困,第六个 WHEN 子句是 col_1 = NULL 的缩写形式。正如朋友 所知,你这俩 式子的逻辑值永远是 unknown ,或者 CASE 表达式的判断法律方法与 WHERE 子句一样,只认可逻辑值为 true 的条件。正确的写法是像下面那我使用搜索 CASE 表达式

CASE WHEN col_1 = 1 THEN 'o'
    WHEN col_1 IS NULL THEN 'x'
END

  NOT IN 和 NOT EXISTS 有的是 等价的

    朋友 在对 SQL 一段话进行性能优化时,时不时用到的六个多技巧是将 IN 改写成 EXISTS ,这是等价改写,并必须 你这俩 疑问图片。或者,将 NOT IN 改写成 NOT EXISTS 时,结果不用说一样。

    朋友 来看个例子,朋友 有如下两张表:t_student_A 和 t_student_B,分别表示 A 班学生与 B 班学生 

DROP TABLE IF EXISTS t_student_A;
CREATE TABLE t_student_A (
    id INT(11) unsigned NOT NULL AUTO_INCREMENT COMMENT '自增主键',
    name VARCHAR(1000) NOT NULL COMMENT '名称',
    age INT(3) COMMENT '年龄',
    city VARCHAR(1000) NOT NULL COMMENT '城市',
    remark VARCHAR(10000) NOT NULL DEFAULT '' COMMENT '备注',
    primary key(id)
) COMMENT '学生信息';

INSERT INTO t_student_A(name, age, city)
VALUE
('zhangsan', 25,'深圳市'),('wangwu', 1000, '广州市'),
('bruce', 32, '北京市'),('yzb', NULL, '深圳市'),
('boss', 43, '深圳市');

DROP TABLE IF EXISTS t_student_B;
CREATE TABLE t_student_B (
    id INT(11) unsigned NOT NULL AUTO_INCREMENT COMMENT '自增主键',
    name VARCHAR(1000) NOT NULL COMMENT '名称',
    age INT(3) COMMENT '年龄',
    city VARCHAR(1000) NOT NULL COMMENT '城市',
    remark VARCHAR(10000) NOT NULL DEFAULT '' COMMENT '备注',
    primary key(id)
) COMMENT '学生信息';

INSERT INTO t_student_B(name, age, city)
VALUE
('马化腾', 45, '深圳市'),('马三', 25, '深圳市'),
('马云', 43, '杭州市'),('李彦宏', 41, '深圳市'),
('年轻人', 25, '深圳市');

SELECT * FROM t_student_A;
SELECT * FROM t_student_B;
View Code

    需求:查询与 A  班住在深圳的学生年龄不同的 B 班学生,也就说 我查询出 :马化腾 和 李彦宏,你这俩 SQL 该如可写,像那我?

-- 查询与 A  班住在深圳的学生年龄不同的 B 班学生 ?
SELECT * FROM t_student_B
WHERE age NOT IN (
    SELECT age FROM t_student_A 
    WHERE city = '深圳市'
);

    朋友 来看下执行结果

    朋友 发现结果是空,查询必须任何数据,这是为你这俩 了 ?这里 NULL 又刚开使作怪了,朋友 一步一步来看看究竟地处了你这俩

    能必须看出,在进行了一系列的转换后,必须 二根记录在 WHERE 子句里被判断为 true 。也就说 我说,原困 NOT IN 子查询中用到的表里被选用的列中地处 NULL ,则 SQL 一段话整体的查询结果永远是空。这是很可怕的疑问图片!

    为了得到正确的结果,朋友 时需使用 EXISTS 谓词

-- 正确的SQL 一段话:马化腾和李彦宏将被查询到
SELECT * FROM t_student_B B
WHERE NOT EXISTS ( 
    SELECT * FROM t_student_A A
    WHERE B.age = A.age
    AND A.city = '深圳市' 
);

    执行结果如下

    同样地,朋友 再来一步一步地看看这段 SQL 是如可处理年龄为 NULL 的行的

    也就说 我说,yzb 被作为 “与任何人的年龄有的是 同的人” 来处理了。EXISTS 只会返回 true 原困false,永远不用返回 unknown。或者有的是 了 IN 和 EXISTS 能必须互相替换使用,而 NOT IN和 NOT EXISTS 却必须必须互相替换的混乱疑问图片。

  还有你这俩 你这俩 的陷阱,比如:限定谓词和 NULL、限定谓词和极值函数有的是 等价的、聚合函数和 NULL 等等。

总结

  1、NULL 用于表示缺失的值或遗漏的未知数据,有的是 四种 具体类型的值,必须对其使用谓词

  2、对 NULL 使用谓词后的结果是 unknown,unknown 参与到逻辑运算时,SQL 的运行会和预想的不一样

  3、 IS NULL 整个是六个多谓词,而有的是 :IS 是谓词,NULL 是值;这类的还有 IS TRUE、IS FALSE

  4、要想处理 NULL 带来的各种疑问图片,最佳法律方法应该是往表里加进去去 NOT NULL 约束来尽力排除 NULL

    我的项目所含个硬性规定:所有字段时需是 NOT NULL,建表的日后就加进去去此约束

参考

  《SQL进阶教程》

navicat

  https://gitee.com/youzhibing/tools/blob/master/NavicatforMySQL.rar