TIL

자료구조 Graph

sweet-po 2023. 5. 5. 15:51

그래프는 여러 개의 점들이 서로 복잡하게 연결되어 있는 관계를 표현한 자료 구조. 복잡한 네트워크망과 같은 모습

 

알아둬야 할 그래프 용어들

  • 정점 (vertex): 노드(node)라고도 하며 데이터가 저장되는 그래프의 기본 원소입니다.
  • 간선 (edge): 정점 간의 관계를 나타냅니다. (정점을 이어주는 선)
  • 인접 정점 (adjacent vertex): 하나의 정점에서 간선에 의해 직접 연결되어 있는 정점을 뜻합니다.(직접적인 관계)   
  • 몇 개의 점과 선에 걸쳐 이어지면 (간접적인 관계)
  • 가중치 그래프 (weighted Graph): 연결의 강도(추가적인 정보, 서울-부산으로 가는 거리 등)가 얼마나 되는지 적혀 있는 그래프를 뜻합니다.
  • 비가중치 그래프 (unweighted Graph): 연결의 강도가 적혀 있지 않는 그래프를 뜻합니다.
  • 무향(무방향) 그래프 (undirected graph): 앞서 보았던 내비게이션 예제는 무향(무방향) 그래프입니다. 서울에서 부산으로 갈 수 있듯, 반대로 부산에서 서울로 가는 것도 가능합니다.
  • 하지만 단방향(directed) 그래프로 구현된다면 서울에서 부산을 갈 수 있지만, 부산에서 서울로 가는 것은 불가능합니다(혹은 그 반대). 만약 두 지점이 일방통행 도로로 이어져 있다면 단방향인 간선으로 표현할 수 있습니다.
  • 진입차수 (in-degree) / 진출차수 (out-degree): 한 정점에 진입(들어오는 간선)하고 진출(나가는 간선)하는 간선이 몇 개인지를 나타냅니다.
  • 인접 (adjacency): 두 정점 간에 간선이 직접 이어져 있다면 이 두 정점은 인접한 정점입니다.                                       
  • 자기 루프 (self loop): 정점에서 진출하는 간선이 곧바로 자기 자신에게 진입하는 경우 자기 루프를 가졌다라고 표현합니다. 다른 정점을 거치지 않는다는 것이 특징입니다.
  • 사이클 (cycle): 한 정점에서 출발하여 다시 해당 정점으로 돌아갈 수 있다면 사이클이 있다고 표현합니다. 내비게이션 그래프는 서울 —> 대전 —> 부산 —> 서울로 이동이 가능하므로, 사이클이 존재하는 그래프입니다.

 

Graph의 표현 방식

인접 행렬

두 정점을 바로 이어주는 간선이 있다면 이 두 정점은 '인접한다'.

인접 행렬은 서로 다른 정점들이 인접한 상태인지를 표시한 행렬로 2차원 배열의 형태.

만약 A라는 정점과 B라는 정점이 이어져 있다면 1(true), 이어져 있지 않다면 0(false)으로 일종의 표.

만약 가중치 그래프라면 1 대신 관계에서 의미 있는 값을 저장.

출처: 코드스테이츠

  • A의 진출차수는 1개: A —> C
    • [0][2] == 1
  • B의 진출차수는 2개: B —> A, B —> C
    • [1][0] == 1
    • [1][2] == 1
  • C의 진출차수는 1개: C —> A
    • [2][0] == 1

가장 빠른 경로(shortest path)를 찾고자 할 때 주로 사용

 

인접 리스트

인접 리스트는 각 정점이 어떤 정점과 인접하는지를 리스트의 형태로 표현.

각 정점마다 하나의 리스트를 가지고 있으며, 이 리스트는 자신과 인접한 다른 정점을 담고 있음.

위 그래프를 인접 리스트로 표현.

출처: 코드스테이츠

B는 A와 C로 이어지는 간선이 두 개가 있는데, A가 C보다 먼저인건 보통은 중요X.

우선순위를 다뤄야 한다면 더 적합한 자료 구조(ex. queue, heap)를 사용하는 것이 합리적. 따라서 보통은 중요X. (언제나 예외有)

그래프, 트리, 스택, 큐 등 모든 자료 구조는 구현하는 사람의 편의와 목적에 따라 기능을 추가/삭제 가능.

그래프를 인접 리스트로 구현할 때, 정점별로 살펴봐야 할 우선순위를 고려해 구현 가능.

리스트에 담긴 정점들을 우선순위별로 정렬 가능.

우선순위가 없다면, 연결된 정점들을 단순하게 나열한 리스트.

 

인접 리스트는 언제 사용?

인접 행렬은 연결 가능한 모든 경우의 수를 저장하기 때문에 상대적으로 메모리를 많이 차지,

메모리를 효율적으로 사용하고 싶을 때 인접 리스트를 사용.

 

실사용 예제

포털 사이트의 검색 엔진, SNS에서 사람들과의 관계, 내비게이션 (길 찾기) 등에서 사용하는 자료 구조가 바로 그래프.

 

-네비게이션

[1] = [0, 1, 1] // 서울 - 부산 , 서울 - 대전
[2] = [1, 0, 1] // 부산 - 서울 , 부산 - 대전
[3] = [1, 1, 0] // 대전 - 서울 , 대전 - 부산
  • 정점: 서울, 대전, 부산
  • 간선: 서울—대전, 대전—부산, 부산—서울

정점에 캐나다의 토론토를 추가한다면 어떠한 간선도 추가할 수 없고 그래프에선 이런 경우를 관계가 없다고 표현.

각 도시가 얼마나 떨어져 있는지는 알 수X. 간선은 특정 도시 두 개가 이어져 있다는 사실만 알려줄 뿐.

비가중치 그래프 : 추가적인 정보를 파악할 수 없는 그래프, 가중치(연결의 강도가 얼마나 되는지)가 적혀 있지 않은 이런 그래프

 

가중치 그래프로 바꾸고, 각 도시 간의 거리를 표시한다면

  • 정점: 서울, 대전, 부산
  • 간선: 서울—140km—대전, 대전—200km—부산, 부산—325km—서울