계수 정렬 알고리즘은 특정한 조건이 부합할 때만 사용할 수 있지만 매우 빠른 정렬 알고리즘이다. 모든 데이터가 양의 정수인 상황이라면 , 데이터의 개수가 N , 데이터 중 최댓값이 K일 때, 계수 정렬은 최악의 경우에도 수행 시간 O(N+K)를 보장한다. 다만 계수 정렬은 이처럼 매우 빠르게 동작할 뿐만 아니라 원리 또한 매우 간단하다. 데이터의 값이 무한한 범위를 가질 수 있는 실수형 데이터가 주어지는 경우 계수 정렬은 사용하기 어렵다. 일반적으로 가장 큰 데이터와 가장 작은 데이터의 차이가 1,000,000을 넘지 않을 때 효과적으로 사용할 수 있다.
계수 정렬이 이러한 특징을 가지는 이유는, 계수 정렬을 이용할 때는 '모든 범위를 담을 수 있는 크기의 리스트를 선언'헤야 하기 때문이다.
계수 정렬은, 먼저 가장 큰 데이터와 가장 작은 데이터의 범위가 모두 담길 수 있도록 하나의 리스트를 생성한다. 현재 예시에서는 가장 큰 데이터가 8이고 가장 작은 데이터가 0이다. 따라서 우리가 정렬한 데이터의 범위는 0부터 8까지이며 리스트의 인덱스가 모든 범위를 포함할 수 있도록 한다. 처음에는 리스트의 모든 데이터가 0이 되도록 초기화한다. 그다음 데이터를 하나씩 확인하며 데이터의 값과 동일한 인덱스의 데이터를 1씩 증가시키면 계수 정렬이 완료된다.
#모든 원소의 값이 0보다 크거나 같다고 가정
array = [1,3,7,8,1,1,3]
#모든 범위를 포함하는 리스트 선언(모든 값은 0으로 초기화)
count = [0] *(max(array)+1)
for i in range(len(array)):
count[array[i]] += 1 #각 데이터에 해당하는 인덱스의 값 증가
for i in range(len(count)):#리스트에 기록된 정렬 정보 확인
for j in range(count[i]):
print(i,end=' ') #띄어쓰기를 구분으로 등장한 횟수만큼 인덱스 출력
계수 정렬의 시간 복잡도
앞서 언급했듯이 모든 데이터가 양의 정수인 상황에서 데이터의 개수를 N, 데이터 중 최댓값의 크기를 K라고 할 때, 계수 정렬의 시간 복잡도는 O(N+K)이다. 계수 정렬은 앞에서부터 데이터를 하나씩 확인하면서 리스트에서 적절한 인덱스의 값을 1씩 증가시킬 뿐만 아니라, 추후에 리스트의 각 인덱스에 해당하는 값들을 확인할 때 데이터 중 최댓값의 크기만큼 반복을 수행해야 하기 때문이다.
따라서 데이터의 범위만 한정되어 있다면 효과적으로 사용할 수 있으며 항상 빠르게 동작한다.
'Algorithm' 카테고리의 다른 글
[BOJ/백준] 10816 숫자 카드 2 (0) | 2020.11.19 |
---|---|
[BOJ/백준]1920번 수 찾기 (0) | 2020.11.17 |
[이코테]순차탐색과 이진탐색 (0) | 2020.11.17 |
[백준/BOJ] 2108번 통계학 (0) | 2020.11.16 |
[이코테]정렬알고리즘의 개요 (0) | 2020.11.15 |