表结构如图
①无条件的直接左连表查询
select a.*,b.* from a left join b on a.id=a_id;
这种情况,a表的所有数据都会拿出来,然后逐一去右表寻找能匹配的记录,找不到记录的则用null填充
② where后面增加a表条件
select a.*,b.* from a left join b on a.id=a_id where a.id>1;
与上一种相比,从结果集中过滤了a表中id不大于1的记录
③where后面增加b表条件
select a.*,b.* from a left join b on a.id=a_id where a_id>2;
与第一种相比,从结果集中过滤了b表中a_id不大于1的记录,null也符合
④on后面增加a表条件(与②对比)
select a.*,b.* from a left join b on a.id=a_id and a.id>1;
与②对比,把where改为and,明明a.id>1,但仍有a.id=1的记录,且a.id=1的关联数据对不上。何解?由于这里添加a表的过滤条件,但主表仍然是a表,所以a表的记录必定要出现在结果集中,只是不会再去b表寻找匹配的结果,而直接用null填充。
可能的查询过程是这样的:先在a中拿到一条记录,由于条件是a.id>1,故停止去b寻找,直接填充null。然后从a中获取下一条数据,再去b中寻找,由于条件与b表无关,所有b中所有数据都符合,全部拿出来。如此循环a表。
⑤on后面增加b表条件(与③对比)
select a.*,b.* from a left join b on a.id=a_id and a_id>2;
与③对比,也是把where改为and,却多了两条null的记录。
查询过程与④一样,先在a中拿到一条记录,然后去b中从头到尾寻找符合a.id=a_id and a_id>2的记录,只要找到则拿出来并继续往下寻找,如果找完b表都没数据,那么右侧填充null,a表第一条记录寻找结束。接着继续从a表第二条记录开始循环。
如果是`select a.*,b.* from a left join b on a.id=a_id and a_id!=4;`,过程还是一样,只是处理方式不同。可能是这样的,如果在b中找到符合a.id=a_id and a_id!=4的则填充null,并提前终止本轮寻找,然后继续从a的下一条开始循环。
⑥on后面有and和or条件1
select a.*,b.* from a left join b on a.id=a_id and a_id>2 or title='2222';
根据⑤的分析,处理过程一样,只是多了一个or。如果and后面符合了,就不会校验or后面的条件,只有当and不符合,再校验or后面的条件。
⑦on后面有and和or条件2(与⑥对比)
select a.*,b.* from a left join b on a.id=a_id and (a_id>2 or title='2222');
与⑤一样,只是and后面的条件由单一条件变为复合条件。
where后面的条件与左连接本身无关,影响的是连接产生后的数据。所以对于第③种情况,先获取到连表的结果,然后剔除掉不符合where后面条件的记录。
on后面的条件,情况比较多,归纳起来基本就是上面的④~⑦及其演变。