[이코테] 최단 경로 알고리즘

1. 다익스트라 알고리즘 

최단 경로(Shortest Path) 알고리즘은 말 그대로 가장 짧은 경로를 찾는 알고리즘이다. 그래서 '길 찾기' 문제라고도 불린다. 최단 경로 알고리즘 유형에는 다양한 종류가 있는데, 상황에 맞는 효율적인 알고리즘이 이미 정립되어 있다. 내가 학교를 다닐 때 배운 알고리즘은 다익스트라 알고리즘과 플로이드 워셜 이렇게 2가지였다.(더 있는데 기억 안나는 걸 수도 있음.) 이 2가지가 코딩 테스트에서 가장 많이 등장하는 유형이라고 하니 이 2가지만 먼저 자세히 알아보자.

 

데이크스트라 알고리즘

다익스트라(Dijkstra) 최단 경로 알고리즘은 그래프에서 여러 개의 노드가 있을 때, 특정한 노드에서 출발하여 다른 노드로 가는 각각의 최단 경로를 구해주는 알고리즘이다. 다익스트라 최단 경로 알고리즘은 '음의 간선'이 없을 때 정상적으로 동작한다.

 

  1. 출발 노드를 설정한다.
  2. 최단 거리 테이블을 초기화한다.
  3. 방문하지 않은 노드 중에서 최단 거리가 가장 짧은 노드를 선택한다.
  4. 해당 노드를 거쳐 다른 노드로 가는 비용을 계산하여 최단 거리 테이블을 생성한다.
  5. 위 과정에서 3번과 4번을 반복한다.

다익스트라 알고리즘은 최단 경로를 구하는 과정에서 '각 노드에 대한 현재까지의 최단 거리' 정보를 항상 1차원 리스트에 저장하며 리스트를 계속 갱신한다는 특징이 있다. 

 

다익스트라 알고리즘을 구현하는 방법은 2가지이다.

 

  1. 구현하기 쉽지만 느리게 동작하는 코드
  2. 구현하기에는 조금 더 까다롭지만 빠르게 동작하는 코드

다익스트라 최단 경로 알고리즘에서는 '방문하지 않은 노드 중에서 가장 최단 거리가 짧은 노드를 선택'하는 과정을 반복하는데 최단 거리가 줄어들지 않는다. 


간단한 다익스트라 알고리즘 구현 - 시간 복잡도 O(V^2) V는 노드의 개수

처음에는 각 노드에 대한 최단 거리를 담는 1차원 리스트 선언. 이후에 단계마다 '방문하지 않은 노드 중에서 최단 거리가 가장 짧은 노드를 선택'하기 위해 매 단계마다 1차원 리스트의 모든 원소를 확인(순차 탐색)한다.

 

import sys
input = sys.stdin.readline
INF  = int(1e9) #무한을 의미하는 값으로 10억 설정

#노드의 개수, 간선의 개수를 입력받기\
n,m = map(int,input().split())
#시작 노드 번호를 입력 받기
start = int(input())
#각 노드에 연결되어 있는 노드에 대한 정보를 담는 리스트를 만들기
graph = [[] for i in range(n+1)]
#방문한 적이 있는지 체크하는 목적의 리스트를 만들기
visited = [False] * (n+1)
#최단거리 테이블을 모두 무한으로 초기화
distance =[INF] * (n+1)

#모든 간선 정보를 입력받기:
for _ in range(m):
  a,b,c = map(int,input().split())
  #a번 노드에서 b번 노드로 가는 비용이 c라는 의미.
  graph[a].append((b,c))

#방문하지 않은 노드 중에서, 가장 최단 거리가 짧은 노드의 번호를 반환
def get_smallest_node():
  min_value = INF
  index = 0 #가장 최단 거리가 짧은 노드의 번호를 반환
  for i in range(1,n+1):
    if distance[i] < min_value and not visited[i]:
      min_value = distance[i]
      index = i
  return index

def dijkstra(start):
  #시작 노드에 대해서 초기화
  distance[start] = 0
  visited[start] = True
  for j in graph[start]:
    distance[j[0]] =j[1]
  #시작 노드를 제외한 전체 n-1개의 노드에 대해 반복
  for i in range(n-1):
    #현재 최단 거리가 가장 짧은 노드를 꺼내서, 방문처리
    now = get_smallest_node()
    visited[now] = True
    #현재 노드와 연결된 다른 노드를 확인
    for j in graph[now]:
      cost =distance[now] + j[1]
      #현재 노드를 거쳐서 다른 노드로 이동하는 거리가 더 짧은 경우
      if cost < distance[j[0]]:
        distance[j[0]] = cost

#다익스트라 알고리즘 수행
dijkstra(start)

#모든 노드로 가기 위한 최단 거리를 출력
for i in range(1,n+1):
  #도달할 수 없는 경우, 무한(INF)라고 출력
  if distance[i] == INF:
    print("INF")
  #도달할 수 있는 경우 거리를 출력
  else:
    print(distance[i])

 

코딩 테스트의 최단 경로 문제에서 전체 노드의 개수가 5,000개 이하라면 일반적으로 이 코드로 문제를 풀 수 있다. 하지만 노드의 개수가 10,000개를 넘어가는 문제라면 이 코드로는 문제를 해결하기 어렵다. 노드의 개수 및 간선의 개수가 많을 때는 '개선된 다익스트라 알고리즘'을 이용해야 한다.


2. 개선된 다익스트라 알고리즘

개선된 다익스트라 알고리즘에서는 힙(Heap) 구조를 사용한다. 힙 자료구조를 이용하게 되면 특정 노드까지의 최단 거리에 대한 정보를 힙에 담아서 처리하므로 출발 노드로부터 가장 거리가 짧은 노드를 더욱 빠르게 찾을 수 있다. 이 과정에서 선형 시간이 아닌 로그 시간이 걸린다. N=1,000,000일 때 logN이 약 20인 것을 감안하면 속도가 획기적으로 빨라지는 것임을 이해할 수 있다.

 

import sys
import heapq
input = sys.stdin.readline
INF  = int(1e9) #무한을 의미하는 값으로 10억 설정

#노드의 개수, 간선의 개수를 입력받기\
n,m = map(int,input().split())
#시작 노드 번호를 입력 받기
start = int(input())
#각 노드에 연결되어 있는 노드에 대한 정보를 담는 리스트를 만들기
graph = [[] for i in range(n+1)]
#방문한 적이 있는지 체크하는 목적의 리스트를 만들기
visited = [False] * (n+1)
#최단거리 테이블을 모두 무한으로 초기화
distance =[INF] * (n+1)

#모든 간선 정보를 입력받기:
for _ in range(m):
  a,b,c = map(int,input().split())
  #a번 노드에서 b번 노드로 가는 비용이 c라는 의미.
  graph[a].append((b,c))

def dijkstra(start):
  q = []
  #시작 노드로 가기 위한 최단 경로는 0 으로 설정하며 , 큐에 삽입
  heapq.heappush(q,(0,start))
  distance[start] = 0
  while q:#큐가 비어 있지 않다면
    #가장 최단 거리가 짧은 노드에 대한 정보 꺼내기
    dist , now = heapq.heappop(q)
    #현재 노드가 이미 처리된 적이 있는 노드라면 무시
    if distance[now] <dist:
      continue
    #현재 노드와 연결된 다른 인접한 노드들을 확인
    for i in graph[now]:
      cost = dist + i[1]
      #현재 노드를 거쳐서, 다른 노드로 이동하는 거리가 더 짧은 경우
      if cost < distance[i[0]]:
        distance[i[0]] = cost
        heapq.heappush(q,(cost,i[0]))
#다익스트라 알고리즘 수행
dijkstra(start)
#모든 노드로 가기 위한 최단 거리를 출력
for i in range(1,n+1):
  #도달할 수 없는 경우 무한(INF)출력
  if distance[i] == INF:
    print("INF")
  #도달핧 수 있는 경우 거리 출력
  else:
    print(distance[i])

 

개선된 다익스트라 알고리즘 시간 복잡도

큐에서 노드를 하나씩 꺼내 검사하는 반복문(while문)은 노드의 개수 V 이상의 횟수로는 반복되지 않는다. 또한 V번 반복될 때마다 각각 자신과 연결된 간선들을 모두 확인한다. 따라서 '현재 우선순위 큐에서 꺼낸 노드와 연결된 다른 노드들을 확인'하는 총횟수는 총 최대 간선의 개수(E) 만큼 연산이 수행될 수 있다.

<