Cherry & Cherish
탐색 알고리즘 (DFS/BFS) 본문
DFS/BFS는 정말 코테의 단골 출제 문제이다. 그래프 탐색을 마스터 해보자!
1. 그래프 탐색
DFS/BFS로 문제를 풀기 위해서는, 그래프의 기본 구조를 알아야 한다.
그래프는 노드와 간선으로 구성되어 있다. 그래프 탐색이란 하나의 노드를 시작으로 다수의 노드를 방문하는 것을 말한다. 또한 두 노드가 간선으로 연결되어 있다면 두 노드는 인접하다라고 표현한다.
프로그래밍에서 그래프는 크게 2가지 방식으로 표현할 수 있는데 코딩 테스트에서는 이 두방식 모두 필요하다.
바로, 인접행렬과 인접 리스트다.
💡 인접 행렬 : 2차원 배열로 그래프의 연결 관계를 표현하는 방식
인접 행렬은 2차원 배열에 각 노드가 연결된 형태를 기록하는 방식이다. 위와 같이 연결된 그래프를 인접 행렬로 표현할 때 파이썬에서는 2차원 리스트로 구현할 수 있다.
연결 되어 있지 않은 노드끼리는 무한의 비용이라고 작성한다. 실제 코드에서는 논리적으로 정답이 될 수 없는 큰 값 중에서 99999999, 987654321 등의 값으로 초기화하는 경우가 많다. 이렇게 그래프를 인접 행렬 방식으로 처리할 때는 다음과 같이 데이터를 초기화한다.
INF = 99999999 #무한의 비용 선언
#2차원 리스트를 이용해 인접 행렬 표현
graph = [
[0, 7, 5],
[7, 0, INF],
[5, INF, 0]
]
print(graph)
💡 인접 리스트 : 리스트로 그래프의 연결 관계를 표현하는 방식
인접 리스트 방식에서는 모든 노드에 연결된 노드에 대한 정보를 차례 대로 연결하여 저장한다.
인접 리스트는 연결 리스트를 이용해 구현하는데, 파이썬에서는 기본 자료형인 리스트 자료형이 append()와 메소드를 제공(C, Java는 표준 라이브러리로 제공)하므로 전통적인 프로그래밍 언어에서의 배열과 연결 리스트의 기능을 모두 기본으로 제공한다.
파이썬으로 인접 리스트를 이용해 그래프를 표현하고자 할 때에도 단순히 2차원 리스트를 이용하면 된다.
#행(row)이 3개인 2차원 리스트로 인접 리스트 표현
graph = [[] for _ in range(3)]
#노드 0에 연결된 노드 정보 저장(노드, 거리)
graph[0].append((1, 7))
graph[0].append((2, 5))
#노드 1에 연결된 노드 정보 저장(노드, 거리)
graph[1].append((0, 7))
#노드 2에 연결된 노드 정보 저장(노드, 거리)
graph[2].append((0,5))
print(graph)
이 두 방식은 메모리와 속도 측면에서 차이가 있다.
메모리 측면에서보자면 인접 행렬 방식은 모든 관계를 저장하므로 노드 개수가 많을수록 메모리가 불필요하게 낭비된다.
반면 인접 리스트 방식은 연결된 정보만을 저장하기 때문에 메모리를 효율적으로 사용한다.
하지만 이와 같은 속성 때문에 인접 리스트 방식은 인접 행렬 방식에 비해 특정한 두 노드가 연결되어 있는지에 대한 정보를 얻는 속도가 느리다. 인접 리스트 방식에서는 연결된 데이터를 하나씩 확인해야 하기 때문이다.
또 다른 예시로 한 그래프에서 노드 1과 노드 7이 연결되어 있는 상황을 생각해 보자. 인접 행렬 방식에서는 graph[1][7]만 확인하면 된다. 반면에 인접리스트 방식에서는 노드 1에 대한 인접 리스트를 앞에서부터 차례대로 확인해야 한다.
그러므로 특정한 노드와 연결된 모든 인접 노드를 순회해야 하는 경우, 인접 리스트 방식이 인접 행렬 방식에 비해 메모리 공간의 낭비가 적다.
2. DFS
DFS(Depth-First Search)는 깊이 우선 탐색이다.
알고리즘은 특정한 경로를 탐색하다가 특정한 상황에서 최대한 깊숙하게 들어가서 노드를 방문한 후, 다시 돌아가 다른 경로로 탐색하는 아록리즘이다.
DFS는 스택 자료구조를 이용하며 구체적인 동작 과정은 다음과 같다.
2-1) DFS 동작 과정
- 탐색 시작 노드를 스택에 삽입하고 방문 처리를 한다.
- 스택의 최상단 노드에 방문하지 않은 인접 노드가 있으면 그 인접 노드를 스택에 넣고 방문 처리를 한다. 방문하지 않은 인접 노드가 없으면 스택에서 최상단 노드를 꺼낸다.
- 2번의 과정을 더 이상 수행할 수 없을 때까지 반복한다.
- ‘방문처리’는 스택에 한 번 삽입되어 처리된 노드가 다시 삽입되지 앟게 체크하는 것을 의미한다. 방문 처리를 함으로써 각 노드를 한 번씩만 처리할 수 있다.
2-2) DFS 구현
깊이 우선탐색 알고리즘인 DFS는 스택 자료구조에 기초한다는 점에서 구현이 간단하다. 실제로는 스택을 쓰지 않아도 되며 탐색을 수행함에 있어서 데이터의 개수가 N개인 경우 O(N)의 시간이 소요된다는 특징이 있다.
또한 DFS는 스택을 이용하는 알고리즘이기 때문에 실제 구현은 재귀 함수를 이용했을 때 매우 간결하게 구현할 수 있다.
#DFS 메서드 정의
def dfs(graph, v, visited):
#현재 노드를 방문 처리
visited[v] = True
print(v, end=' ')
#현재 노드와 연결된 다른 노드를 재귀적으로 방문
for i in graph[v]:
if not visited[i]:
dfs(graph, i, visited)
#각 노드가 연결된 정보를 리스트 자료형으로 표현 (2차원 리스트)
graph =[
[],
[2, 3, 8],
[1, 7],
[1, 4, 5],
[3, 5],
[3, 4],
[7],
[2, 6, 8],
[1, 7],
]
#각 노드가 방문된 정보를 리스트 자료형으로 표현 (1차원 리스트)
visited = [False] * 9
#정의된 DFS 함수 호출
dfs(graph, 1, visited)
3. BFS
반대로, BFS(Breadth First Search)는 너비 우선 탐색이라는 의미를 가진다.
가까운 노드부터 탐색하는 알고리즘이다. DFS는 최대한 멀리 있는 노드를 우선으로 탐색하지만, BFS는 그 반대다.
BFS 구현에서는 선입선출 방식인 큐를 이용하는 것이 정석이다. 인접한 노드를 반복적으로 큐에 넣도록 알고리즘을 작성하면 자연스럽게 먼저 들어온 것이 먼저 나가게 되어, 가까운 노드부터 탐색을 진행하게 된다.
3-1) BFS 동작과정
- 탐색 시작 노드를 큐에 삽입하고 방문 처리를 한다.
- 큐에서 노드를 꺼내 해당 노드의 인접 노드 중에서 방문하지 않은 노드를 모두 큐에 삽입하고 방문 처리를 한다.
- 2번의 과정을 더이상 수행할 수 없을 때까지 반복한다.
3-2) BFS 구현
너비 우선 탐색 알고리즘인 BFS는 큐 자료구조에 기초한다는 점에서 구현이 간단하다.
deque 라이브러리를 사용 하는 것이 좋으며, 탐색을 수행함에 있어 O(N)의 시간이 소요된다.
일반적인 경우 실제 수행 시간은 DFS 보다 좋은 편이다.
from collections import deque
#BFS 매서드 정의
def bfs(graph, start, visited):
#큐(Queue) 구현을 위해 deque 라이브러리 사용
queue = deque([start])
#현재 노드를 방문 처리
visited[start] = True
#큐가 빌 때까지 반복
while queue:
#큐에서 하나의 원소를 봅아 출력
v = queue.popleft()
print(v, end=' ')
#해당 원소와 연결된, 아직 방문하지 않은 원소들을 큐에 삽입
for i in graph[v]:
if not visited[i]:
queue.append(i)
visited[i] = True
#각 노드가 연결된 정보를 리스트 자료형으로 표현 (2차원 리스트)
graph =[
[],
[2, 3, 8],
[1, 7],
[1, 4, 5],
[3, 5],
[3, 4],
[7],
[2, 6, 8],
[1, 7],
]
#각 노드가 방문된 정보를 리스트 자료형으로 표현 (1차원 리스트)
visited = [False] * 9
#정의된 BFS 함수 호출
bfs(graph, 1, visited)
4. 정리
- DFS
- 동작원리 : 스택
- 구현 방법 : 재귀 함수 이용
- BFS
- 동작원리 : 큐
- 구현 방법 : 큐 자료구조 (deque)
코테 중 2차원 배열에서의 탐색 문제를 만나면 그래프 형태로 바꿔서 생각해보자.
5. 대표 문제
1) DFS 대표문제 - 연결된 0의 개수 세기
n x m의 바둑판에서 연결되어 있는 0의 덩어리 개수를 세어 보자!
ex ) 아래는 3개의 0 덩어리가 있는 것이다.
0 0 1
0 1 0
1 0 1
- 특정한 지점의 주변 상, 하, 좌, 우를 살펴본 뒤에 주변 지점 중에서 값이 ‘0’이면서 아직 방문하지 않은 지점이 있다면 해당 지점을 방문한다.
- 방문한 지점에서 다시 상, 하, 좌, 우를 살펴보면서 방문을 다시 진행하면, 연결된 모든 지점을 방문할 수 있다.
- 위의 과정을 모든 노드에 반복하면서 방문하지 않은 지점의 수를 센다.
#가로, 세로 수 입력 받기
n, m = map(int, input().split())
#맵 정보 받기
graph = []
for i in range(n):
graph.append(list(map(int, input())))
def dfs(x, y):
if x <= -1 or x >= n or y <= -1 or y >= m:
return False
#현재 노드를 방문하지 않았다면
if graph[x][y] == 0:
#방문 처리
graph[x][y] = 1
#상, 하, 좌, 우의 위치도 모두 재귀적으로 호출
dfs(x-1, y)
dfs(x, y-1)
dfs(x+1, y)
dfs(x, y+1)
return True
return False
result = 0
for i in range(n):
for j in range(m):
if dfs(i,j) == True:
result += 1
print(result)
2) BFS 대표 문제 - 미로 탈출
0은 갈 수 없는 벽, 1은 도로이다. (1,1)부터 시작해 (N, M)까지 도착하려면 움직여야 하는 최소 칸의 개수는 얼마일까?
- 네 방향 위치를 정의한다.
- 해동 노드를 처음 방문하는 경우에만 최단 거리라고 갱신한다
from collections import deque
#가로, 세로 수 입력 받기
n, m = map(int, input().split())
#맵 정보 받기
graph = []
for i in range(n):
graph.append(list(map(int, input())))
#이동할 네 방향 정의 (상, 하, 좌, 우)
dx = [-1, 1, 0, 0]
dy = [0, 0, -1, 1]
def bfs(x, y):
queue = deque()
queue.append((x, y))
#큐가 빌 때까지 반복
while queue :
x, y = queue.popleft()
#현재 위치에서 네 방향으로의 위치 확인
for i in range(4):
nx = x + dx[i]
ny = y + dy[i]
#미로 찾기 공간을 벗어난 경우 무시
if nx < 0 or nx >= n or ny < 0 or ny >= m:
continue
#벽인 경우 무시
if graph[nx][ny] == 0:
continue
#해당 노드를 처음 방문하는 경우에만 최단 거리 기록
if graph[nx][ny] == 1:
graph[nx][ny] = graph[x][y] + 1
queue.append((nx, ny))
#가장 오른쪽 아래까지의 최단 거리 반환
return graph[n-1][m-1]
print(bfs(0, 0))
6. 연관 문제
이제 BFS/DFS에 대한 개념 학습은 끝났다. 바로 실제 문제를 풀어보자!
[백준]
- 셀프넘버(4673) - https://www.acmicpc.net/problem/4673
- 체스판 다시 칠하기(1018) - https://www.acmicpc.net/problem/1018
- 한수(1065) - https://www.acmicpc.net/problem/1065
[프로그래머스]
[SWEA]
'Algorithm > Learning' 카테고리의 다른 글
최단경로 알고리즘(다익스트라, 플로이드 워셜) (1) | 2023.02.02 |
---|---|
이진 탐색 알고리즘 (0) | 2023.02.01 |
정렬 알고리즘 (선택정렬, 삽입정렬, 퀵정렬, 계수정렬, 버블정렬, 합병정렬, 힙정렬, 정렬 라이브러리) (1) | 2023.01.31 |
그리디 알고리즘 (0) | 2023.01.26 |
알고리즘이란? & 알고리즘 공부 계획 (0) | 2023.01.26 |