본문 바로가기
STUDY/Data Structure

[자료구조] heap(힙 자료구조) / Python heapq(힙큐)

by mhl22 2021. 8. 11.

스택(Stack) 과 큐(Queue)

큐 (queue) 는 컴퓨터의 기본적인 자료 구조의 한가지로, 먼저 집어넣은 데이터가 먼저 나오는 FIFO 구조로 저장하는 형식을 말한다. 우선순위 큐는 우선순위의 개념을 큐에 도입한 자료구조로, 데이터들이 우선순위를 가지고 있고 우선순위가 높은 데이터가 먼저 나가는 자료구조를 말한다.

 

우선순위 큐는 배열, 연결리스트, 힙으로 구현이 가능하다. 이 중에서 힙(heap)으로 구현하는 것이 가장 효율적이다.

 

힙(heap)

힙 (heap) 은 최댓값 및 최솟값을 찾아내는 연산을 빠르게 하기 위해 고안된 완전이진트리를 기본으로 한 자료구조로서 다음과 같은 힙 속성을 만족한다.

  • A가 B의 부모노드이면, A의 key값과 B의 key값 사이에는 대소관계가 성립한다.
  • 키 값의 대소 관계는 부모/자식 간에만 성립하고, 형제노드 사이에는 대소 관계가 정해지지 않는다.

힙에는 '최대 힙' 과 '최소 힙' 이 있다.

  • 최대 힙 : 부모 노드의 키값이 자식노드의 키 값보다 항상 큰 힙
  • 최소 힙 : 부모 노드의 키값이 자식노드의 키 값보다 항상 작은 힙

힙은 가장 높은(혹은 가장 낮은) 우선순위를 가지는 노드가 항상 루트노트에 오게되는 특징이 있으며, 이를 응용하면 우선순위 큐와 같은 추상적 자료형을 구현할 수 있다.

 

힙(heap)의 구현

  • 힙을 저장하는 표준적인 자료구조는 배열이다.
  • 구현을 쉽게 하기 위해 배열의 첫번째 인덱스인 0은 사용되지 않는다.
  • 특정위치의 노드번호는 새로운 노드가 추가되어도 변하지 않는다.
    • 예를 들어 루트노드의 오른쪽 노드 번호는 항상 3이다.
  • 힙에서의 부모노드와 자식노드의 관계
    • 왼쪽 자식의 인덱스 = (부모의 인덱스) * 2
    • 오른쪽 자식의 인덱스 = (부모의 인덱스) * 2 + 1
    • 부모의 인덱스 = (자식의 인덱스) / 2
  • 힙의 삽입 : 새로운 요소를 마지막 노드에 이어서 삽입 후 힙의 성질 만족할 때 까지 부모노드와 교환
  • 힙의 삭제 : (최대 힙의 경우) 루트 노드 삭제 후 마지막 노드를 루트 노드에 위치 시킨 뒤 힙의 성질 만족할 때 까지 자식노드와 교환

 

파이썬 힙 자료구조

파이썬 heapq 모듈은 완전 이진트리 기반의 최소 힙 자료구조이다. 즉 루트노드는 heapq에서 가장 작은 값이다.

  • heapq.heappush(heap, item) : item을 heap 에 추가
  • heapq.heappop(heap) : heap에서 가장 작은 원소를 pop & 리턴, 비어있는 경우 IndexError 호출
  • heapq.heapify(x) : 리스트 x 를 즉각적으로 heap 으로 변환함 (in linear time, O(N))

최대 힙 만들기

힙에 원소를 추가할때 튜플 형태로 넣어주면 튜플의 첫 번째 원소를 우선순위로 힙을 구성하게 된다는 아이디어를 이용한다.

  • (-item, item) 의 튜플 형태로 push 하는 경우 제일 큰 값이 루트노드에 위치하는 최대 힙을 만들 수 있다.
heap_items = [1,3,5,7,9]

max_heap = []
for item in heap_items:
  heapq.heappush(max_heap, (-item, item))

print(max_heap)

결과 : [(-9,9), (-7,7), (-5,5), (-3,3), (-1,1)]

 

heappop 을 사용하면 가장 앞에 있는 최댓값이 반환되는 것을 확인할 수 있다. 이 때 실제 원소값은 튜플의 두번째 자리에 저장되어 있다.

max_item = heapq.heappop(max_heap)[1]

 

 


참고

https://gmlwjd9405.github.io/2018/05/10/data-structure-heap.html

 

[자료구조] 힙(heap)이란 - Heee's Development Blog

Step by step goes a long way.

gmlwjd9405.github.io

https://littlefoxdiary.tistory.com/3

 

[Python] 힙 자료구조 / 힙큐(heapq) / 파이썬에서 heapq 모듈 사용하기

힙은 특정한 규칙을 가지는 트리로, 최댓값과 최솟값을 찾는 연산을 빠르게 하기 위해 고안된 완전이진트리를 기본으로 한다. 힙 property : A가 B의 부모노드이면 A의 키값과 B의 키값 사이에는 대

littlefoxdiary.tistory.com

 

'STUDY > Data Structure' 카테고리의 다른 글

[자료구조] 해시 테이블(Hash Table)  (0) 2021.08.06