[Data Structure] Heap

잡다한 지식/CS 베이스

[Data Structure] Heap

GGOBOOGI 2021. 3. 19. 17:54

Heap의 기본 개념

(binary) heap 자료구조는 complete binary tree특성을 가지는 배열 객체이다.

Heap 객체 구성 요소

heap을 나타내는 배열 A는 다음 두 개의 인자를 가진다.

A.length

배열 A의 모든 원소의 개수를 나타낸다.
A.heap-size

배열 A의 모든 원소가 heap에 속하지 않을 수 있다. $A[1..A.length]$ 의 값들 중, $A[1..A.heap-size]$ 에 속한 값만 heap 내부에 있는 원소이다.

배열 A의 원소 중 heap에 속하는 원소의 개수를 나타낸다. 단, $0\leq{A.heap-size}\leq{A.length}$ 를 만족한다.

Heap index 계산

tree index의 편의를 위해, tree의 root는 A[1]이다.

heap에 속한 어떤 node의 index i가 주어지면, parent node, left-child node, right-child node의 index를 아래의 방법으로 쉽게 계산할 수 있다.

LEFT, RIGHT, PARENT

heap의 i번째 node의 left child, right child, parent의 index를 return 하는 함수

LEFT(i)

    return 2*i

RIGHT(i)

    return 2*i + 1

PARENT(i)

    return floor(i/2)

위의 계산들은 2를 곱하거나 나누는 연산들이므로, bit shift 연산으로 쉽게 해결할 수 있다.

Heap의 종류

binary heap는 크게 max-heap, min-heap 두 종류로 나눌 수 있다. heap의 종류에 따라 heap 특성이 달라진다.

1. max-heap

   root node를 제외한 모든 node에 대해 다음을 만족한다.

    $A[Parent(i)]\geq{A[i]}$

   **즉, max-heap에서 최댓값은 root에 있다.**

2. min-heap

    root node를 제외한 모든 node에 대해 다음을 만족한다.

     $A[Parent(i)]\leq{A[i]}$

    **즉, min-heap에서 최솟값은 root에 있다.**

Heap의 높이

node의 높이

해당 node에서 leaf node에 이르는 하향 경로 중, 가장 긴 것의 간선의 수
Heap의 높이

root node의 높이와 같다.

heap은 complete binary tree를 기반으로 하므로, 원소 개수가 n인 heap의 높이는 $O(\log{n})$ 이다.

Heap의 기본 프로시저

MAX-HEAPIFY

max heap 특성을 유지할 수 있도록 하는 함수이다.

parent node가 child node보다 작은 경우, parent node를 max heap 특성을 만족할 때 까지 아래로 계속 내린다.

Pseudo Code

MAX-HEAPIFY(A, i)

    l = LEFT(i)
    r = RIGHT(i)

    if l < A.heap-size and A[l] > A[i]
        largest = l
    else
        largest = i

    if r < A.heap-size and A[r] > A[i]
        largest = r

    if largest != i
        exchange A[i] with A[largest]
        MAX-HEAPIFY(A, largest)

수행 시간 분석

높이가 h인 node에서 MAX-HEAPIFY를 call 할 경우를 생각해 보자.

최악의 경우 높이 h부터 leafnode에 도달할 때 까지 MAX-HEAPIFY를 재귀적으로 호출할 수 있다.

따라서, 높이가 h인 node에서 MAX-HEAPIFY 수행 시간의 상한은 $O(h)$ .

BUILD-MAX-HEAP

배열 A[1, ..., n]를 max heap으로 만드는 함수이다.

MAX-HEAPIFY 프로시저를 heap의 leaf node를 제외한 나머지 node에 대해 바닥에서부터 시작하여 위로 올라가며 적용한다.

$A[\left \lfloor \frac{n}{2} \right \rfloor+1,...,n]$ 의 원소는 모두 tree의 leaf node이므로, 원소의 개수가 하나인 heap이라고 볼 수 있다. 따라서, leaf node를 제외한 나머지 node들에 대하여 MAX-HEAPIFY를 적용한다.

Pseudo Code

BUILD-MAX-HEAP(A)

    A.heap-size = A.length

    for i = floor(A.length/2) downto 1
        MAX-HEAPIFY(A, i)

수행 시간 분석

단순 분석

단순하게 생각할 경우, node의 개수가 n개인 heap에서 MAX-HEAPIFY는 한 번의 call 마다 $O(\log{n})$ 이 걸린다고 볼 수 있다. 왜냐하면, node의 개수가 n인 heap의 최대 높이가 $O(\log{n})$ 이기 때문이다.

$O(\log{n})$ 의 수행 시간을 가지는 MAX-HEAPIFY를 BUILD-MAX-HEAP이 $O(n)$ 번 call 하게 되므로,

BUILD-MAX-HEAP을 단순 분석했을 때 수행 시간의 상한은

$O(\log{n})\times{O(n)}=O(n\log{n})$ 이다.

하지만, MAX-HEAPIFY의 수행 시간이 node의 높이에 따라 다르고, node 대부분의 높이가 다른 점을 고려하여 수행 시간을 개선할 여지가 있다.

정확한 분석

이 분석에서는 다음을 이용한다.

원소가 n개인 heap의 높이는 $\left\lfloor\log{n}\right\rfloor$ 이다.

이에 대한 자세한 설명은 아래의 생각해 볼 문제 2번 을 참고하라.
높이가 h인 노드 수는 최대 $\left\lceil\frac{n}{2^{h+1}}\right\rceil$ 이다.

높이가 h인 node에서 호출된 MAX-HEAPIFY의 수행시간은 $O(h)$ 이다.

BUILD-MAX-HEAP은 leaf node를 제외한 모든 node에서 MAX-HEAPIFY를 call 한다.

따라서, BUILD-MAX-HEAP의 총 수행시간을 다음과 같이 나타낼 수 있다.

$\sum_{h=0}^{\left\lfloor\log{n}\right\rfloor}\left\lfloor\frac{n}{2^{h+1}}\right\rfloor O(h)=O(n\sum_{h=0}^{\left\lfloor\log{n}\right\rfloor}\frac{h}{2^{h}})$

node의 수가 매우 많을 경우를 생각해 보면, 다음의 공식을 이용해 식을 정리할 수 있다. (단, $\left|x\right|<1$ )

$\sum_{k=0}^{\infty}kx^{k}=\frac{x}{(1-x)^2}$

위의 식을 공식을 이용하여 정리하면,

$O(n\sum_{h=0}^{\left\lfloor\log{n}\right\rfloor}\frac{h}{2^{h}})=O(n\sum_{h=0}^{\infty}\frac{h}{2^h})=O(2n)=O(n)$

이므로, BUILD-MAX-HEAP의 수행 시간의 상한은 $O(n)$ 이다.

T. Cormen, C. Leiserson, R. Rivest and C. Stein, 『Introduction to Algorithms』, 문병로, 심규석, 이충세 옮김, 한빛아카데미(2014), p153-p171

CLRS Solutions, "Introduction to Algorithms solution", https://sites.math.rutgers.edu/~ajl213/CLRS/CLRS.html, (2021.01.14)

저작자표시 비영리 변경금지

'잡다한 지식 > CS 베이스' 카테고리의 다른 글

[프로그래밍언어론] 오버로딩(overloading)과 오버라이딩(overriding)의 차이점 (0)	2021.03.26
[프로그래밍언어론] 객체지향 프로그래밍 언어의 특징 (0)	2021.03.26
#define 의 함정... 나만 빠짐 (1)	2021.03.19
정수 범위 무한대 입력 방법 (0)	2021.03.19
[Data Structure] Priority Queue (우선순위 큐) (0)	2021.03.19

현재글[Data Structure] Heap

Huilife 꼬부기의 잡다한 삶의 기록

꼬부기의 잡다한 삶의 기록

허프만트리, 전산, 오버라이딩, OpenJDK, OracleJDK, 백준, dynamodb, 한국은행, macOSaarch, 알고리즘, AWS, vscode, Overloading, 프로세스, 오버로딩, MacOS, tasks.json, Overriding, Gradle, IntelliJ,

Today :
Yesterday :

일	월	화	수	목	금	토
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30

내 블로그 - 관리자 홈 전환	`Q` `Q`
새 글 쓰기	`W` `W`

글 수정 (권한 있는 경우)	`E` `E`
댓글 영역으로 이동	`C` `C`

이 페이지의 URL 복사	`S` `S`
맨 위로 이동	`T` `T`
티스토리 홈 이동	`H` `H`
단축키 안내	`Shift` + `/` `⇧` + `/`

Huilife