强连通分量¶

若一张有向图的节点两两互相可达，则称这张图是强连通的。

那么实际上我们发现找强连通分量就是在有向图上找环。我们可以大致考虑如下步骤：

在有向图上dfs，同时维护一个存有已访问点的栈。
对于已访问的点打上特殊的标记，表示该点是之前访问过的（称为0标记），还是当前路径中走过的（称为1标记）。
当重新走到一个含有1标记的节点上时，说明发现一个环，从栈中取出环上的节点。

tarjan 算法介绍¶

算法目的:

Tarjan 算法是基于***深度优先搜索***的算法，用于求解图的连通性问题。Tarjan 算法可以在线性时间内求出无向图的割点与桥，进一步地可以求解无向图的双连通分量；同时，也可以求解有向图的强连通分量、必经点与必经边。

如果你对上面的一些术语不是很了解，没关系，我们只要知道 Tarjan 算法是基于深度优先搜索的，用于求解图的连通性问题的算法 就好了。

zhuanlan.zhihu.com

强连通：若一张有向图的节点两两互相可达，则称这张图是强连通的。 强连通分量（Strongly Connected Components，SCC）：极大的强连通子图。例如，图中的SCC: (1) 1,2,3,4,9 (2) 5,6,8 (3) 7 对图深搜时，每一个节点只访问一次，被访问过的节点与边构成**搜索树**。

强连通分量¶

一个环是强连通分量。一个没有出边的点也是强连通分量。

如果一个子图可以构成多个连通分量，则只有包含节点最多的才是强连通分量。（如下图4，包含3个节点的环不是强连通分量，4个的才是）一个图中的强连通分量可以有多个，并且他们所包含的节点数可能不同（如上图1,2,3,4,9和5,6,8和7）

分类之后，就可以通过不同的边寻找环，从而找到强连通分量

如果节点x是某个强连通分量在搜索树中遇到的第一个节点，那么这个强连通分量的其余节点肯定是在搜索树中以x为根的子树中。节点x被称为这个强连通分量的根。

Tarjan算法¶

下面是图片中的文本内容，已经将数学公式和变量转换为了 LaTeX 格式：

Tarjan（塔扬）算法

时间戳 dfn[x]：节点 x 第一次被访问的顺序。
追溯值 low[x]：从节点 x 出发，所能访问到的最早时间戳。

入x时，盖戳、入栈。枚举 x 的邻点 y，分三种情况。

(1) 若 y 尚未访问：对 y 深搜。回 x 时，用 low[y] 更新 low[x]。因为 x 是 y 的父节点，y 能访问到的点，x 一定也能访问到。 (2) 若 y 已访问且在栈中：说明 y 是祖先节点或左子树节点，用 dfn[y] 更新 low[x]。 (3) 若 y 已访问且不在栈中：说明 y 已搜索完毕，其所在连通分量已被处理，所以不用对其做操作。

离 x 时，记录 SCC。只有遍历完一个 SCC，才可以出栈。更新 low 值的意义：避免 SCC 的节点提前出栈。

1.入x¶

//入x时,时间戳追溯值更新,入栈
    dfn[x]=low[x]=++tot;
    stk[++top]=x;instk[x]=1;

2.找x¶

枚举x的邻点y，可能会有3种情况

for(int i=0;i<e[x].size();i++){//枚举x的邻点y 
        int y=e[x][i];
        if(!dfn[y]){//如果y还没有访问过 
            tarjan(y);//向下走 
            low[x]=min(low[x],low[y]);//返回时更新 

        }
    }

1.没有访问过y

考察以下走法

1→2→3→1

节点3可以访问到dfn最小的节点为1，dfn为1.并且节点3是从1，2走过来的，说明1，2也可以通过节点3访问到dfn最小的节点为1，因此在返回时要更新low为自己的和邻点的low的最小值

向下继续走

if(!dfn[y]){//如果y还没有访问过 
            tarjan(y);//向下走 
            low[x]=mid(low[x],low[y]);//返回时更新 
        }

2.y被访问过

考察点3.它可以走到点1（一个**被访问过的点**）

考察点9.它可以走到点3（一个被访问过的点）也是同理

不用往回走（即不需要tarjan(y);）

else if(dfn[y]&&instk[y]){//说明 y被访问过 ->要么y是祖先(在x出通过返祖边访问到了),要么是左子树的点(在x通过横插边访问到了) 
            low[x]=min(low[x],dfn[y]); 
        }

3.y被访问过并且已经弹出栈

只有当一个强连通分量全部扫描完，才会将节点弹出。如果y已经被弹出了，说明y所在的强连通分量已经被扫描完了。又因为一个点所在的强连通分量**有且只有一个**，所以y一定不是目前正在扫描的强连通分量里的一个点，直接忽略它

离x¶

if(dfn[x]==low[x]){//说明x是这个强连通分量的根 
        int y;++cnt;
        do{
            y=stk[top--];instk[y]=0;
            scc[y]=cnt;
            ++siz[cnt];
        } while(y!=x);
    }

考察以下图

当访问了5→6→8，访问到5（通过返祖边），此时属于**2.y被访问过情况，执行**low[x]=min(low[x],dfn[y]);

并且从8不能继续走到5，也没有其他出边（7属于**3.y被访问过并且已经弹出栈情况，忽略**）

开始回溯

将点8，6，5的low更新为min(low[8],dfn[5])即dfn[5]。当回溯到5时，把low[5]也更新为了dfn[5]，并且5的所有邻点都访问完了（7忽略，理由同上）。此时节点5的**for循环**结束，运行到判定环节（离x）。也恰好满足(dfn[x]==low[x])说明x是这个强连通分量的根

此时栈里有...,5,6,8

执行循环，不断出栈，直到把5的scc更新后，发现x=y（y就是目前的栈顶，5），就说明这个强连通分量走完了

代码¶

/*////////ACACACACACACAC///////////
Code By Ntsc
/*////////ACACACACACACAC///////////
#include<bits/stdc++.h>
using namespace std;
#define ll long long
const int N=1e5;

vector<int> e[N];//邻接矩阵 
int dfn[N],low[N],tot;//时间戳，追溯值，给时间戳编号的计数器 
int stk[N],top;//栈，指针 
bool instk[N]; //是否在栈中
int scc[N],siz[N],cnt; //记录每个点在那个强连通分量里, 每个点所在的强连通分量的大小,强连通分量的数量 
int ans;

void tarjan(int x){//从节点x进入 
    if(scc[x])return;//如果已经是某个强连通分量里的点,停止函数
    //入x时,时间戳追溯值更新,入栈
    dfn[x]=low[x]=++tot;
    stk[++top]=x;instk[x]=1; 

    for(int i=0;i<e[x].size();i++){//枚举x的邻点y 
        int y=e[x][i];
        if(!dfn[y]){//如果y还没有访问过 
            tarjan(y);//向下走 
            low[x]=min(low[x],low[y]);//返回时更新 
        }else if(dfn[y]&&instk[y]){//说明 y被访问过 ->要么y是祖先(在x出通过返祖边访问到了),要么是左子树的点(在x通过横插边访问到了) 
            low[x]=min(low[x],dfn[y]); 
        }
    }
    if(dfn[x]==low[x]){//说明x是这个强连通分量的根 
        int y;++cnt;
        int flag=0;//记录当前强连通分量点的个数
        do{
            flag++;
            y=stk[top--];instk[y]=0;
//          ans-=e[y].size();
            scc[y]=cnt;
            ++siz[cnt];
        } while(y!=x); 
        if(flag>1)ans++;
    }
}
signed main(){
    int m,n;
    cin>>n>>m;
    for(int i=1;i<=m;i++){
        int a,b;
        cin>>a>>b;
        e[a].push_back(b);
    }
//  ans=m;
    for(int i=1;i<=n;i++)tarjan(i);//图可能不连通！
//  for(int i=1;i<=n;i++)cout<<scc[i]<<' ';
    cout<<ans;
    return 0;
}

注意本代码与下面例题代码有一点不同，下面的代码不能计算点数为1的强连通分量，但本代码可以，只需要修改if(flag>1)ans++;即可。

例题 #1 [USACO06JAN]The Cow Prom S¶

有一个 \(n\) 个点，\(m\) 条边的有向图，请求出这个图点数大于 \(1\) 的强联通分量个数。

对于全部的测试点，保证 \(2\le n \le 10^4\)，\(2\le m\le 5\times 10^4\)，\(1 \leq a, b \leq n\)。

完整代码

/*////////ACACACACACACAC///////////
Code By Ntsc
/*////////ACACACACACACAC///////////
#include<bits/stdc++.h>
using namespace std;
#define ll long long
const int N=1e5;

vector<int> e[N];//邻接矩阵 
int dfn[N],low[N],tot;//时间戳，追溯值，给时间戳编号的计数器 
int stk[N],top;//栈，指针 
bool instk[N]; //是否在栈中
int scc[N],siz[N],cnt; //记录每个点在那个强连通分量里, 每个点所在的强连通分量的大小,强连通分量的数量 
int ans;

void tarjan(int x){//从节点x进入 
    //入x时,时间戳追溯值更新,入栈
    dfn[x]=low[x]=++tot;
    stk[++top]=x;instk[x]=1; 

    for(int i=0;i<e[x].size();i++){//枚举x的邻点y 
        int y=e[x][i];
        if(!dfn[y]){//如果y还没有访问过 
            tarjan(y);//向下走 
            low[x]=min(low[x],low[y]);//返回时更新 
        }else if(dfn[y]&&instk[y]){//说明 y被访问过 ->要么y是祖先(在x出通过返祖边访问到了),要么是左子树的点(在x通过横插边访问到了) 
            low[x]=min(low[x],dfn[y]); 
        }
    }
    if(dfn[x]==low[x]){//说明x是这个强连通分量的根 
        int y;++cnt;
        int flag=0;
        do{
            flag++;
            y=stk[top--];instk[y]=0;
            scc[y]=cnt;
            ++siz[cnt];
        } while(y!=x); 
        if(flag>1)ans++;
    }
}
signed main(){
    int m,n;
    cin>>n>>m;
    for(int i=1;i<=m;i++){
        int a,b;
        cin>>a>>b;
        e[a].push_back(b);
    }
    for(int i=1;i<=n;i++)if(!dfn[i])tarjan(i);//图可能不连通！但也不要重复扫描！
    cout<<ans;
    return 0;
}

我们也可以tarjan完了之后统一统计，去掉flag

在输出答案前统计答案，在输出答案前插入以下代码

for(int i=1;i<=cnt;i++)
     if(siz[i]>1) ans++;

融会贯通：dfn与low替换¶

在边双连通分量和强连通分量中，我们发现下面两种写法是等效的。

if(i!=(eid^1)) low[u]=min(low[u],dfn[v]);
//等于
if(i!=(eid^1)) low[u]=min(low[u],low[v]);

但是在点双连通分量中，这样写是错误的，这是为什么呢？

因为在点双连通分量中，一个点可能在两个点双连通分量中，我们在更新点\(u\)的\(low_v\)时，用到的\(v\)是与\(u\)属于同一个点双连通分量里的，但可能在前面的某个也包含点v的点双连通分量中已经更新过其\(low_v\)了，这样的话就可能跨不同的点双连通分量访问\(low_v\)了，这样的话就错了。

而在边双连通分量中，该边要么不属于任何边双连通分量，要么一定只属于一个边双连通分量（因为如果该边属于若干个边双连通分量，首先保证其为广义双向边，但如果两个边双连通分量有一个公共的广义双向边，那么这两个边双连通分量其实是一个整体（即它们就是一个边双连通分量））

强连通分量标号和拓扑序的关系¶

拓扑序（Topological Order）是指对有向无环图（DAG）中的顶点进行线性排序，使得对于每一条有向边(u, v)，u在排序中都出现在v之前。只有有向无环图才能进行拓扑排序。

在有向图中，强连通分量的标号顺序与拓扑序的关系如下：

Tarjan算法给出的强连通分量的标号顺序并不是拓扑序，因为强连通分量本身可能包含环，因此不能简单地映射到一个线性的拓扑序。
Tarjan算法在处理过程中，实际上是按照某种“逆拓扑序”来发现强连通分量的，这是因为算法在深度优先搜索（DFS）的过程中会先访问那些没有出边的节点，而这与拓扑排序的过程是相反的。
如果我们将图中的所有强连通分量缩成单个节点，那么在这些缩点后的节点形成的DAG中进行拓扑排序，得到的顺序将与Tarjan算法给出的强连通分量的标号顺序相反。

因此，可以说，在缩点后的DAG中，强连通分量（缩点后）的标号顺序是其拓扑序的逆序。但要注意的是，这种说法仅在考虑了强连通分量之间的依赖关系（即从一个强连通分量到另一个强连通分量的有向边）时才成立。单个强连通分量内部的节点由于存在环，所以内部并不满足拓扑序的定义。