Madison Digital Garden

Search

Log (Database Recovery)

Aug 29, 2024, 5 min read

#mdg
#database
#db-recovery
#terms

참고한 것들

미디엄 블로그 ARIES 포스팅

Log

출처: 네이버 영어사전

Log 는 위의 사진처럼 어떤 작업의 일지, 기록 등을 뜻하는 단어이다.
이와 비슷하게, DBMS 에서 Log 는 DBMS 가 작업한 것에 대한 기록이고, 따라서 Transaction 이 수행한 operation 들이 sequential 하게 파일에 저장된다.

Log Sequence Number, LSN

각 log entry 에는 Log Sequence Number (LSN) 라 불리는 증가하는 ID 가 붙는다.
- 즉, LSN 이 더 큰 log entry 는 그렇지 않은 것에 비해 최신의 log 인 것.
각 Page 에는 LSN 이 명시되어 있어 해당 page 를 변경한 마지막 log 를 식별할 수 있게 한다.
- 따라서 이것으로 recovery 시에 해당 page 를 변경한 마지막 log 을 빨리 알아내어 복구할 수 있게 된다.
LSN 은 어떤 무한히 늘어나는 가상의 파일이 있다고 가정했을 때, 여기에 저장되는 log 의 offset 이 LSN 이 된다.
- 즉, 1씩 증가하는 counter 는 아닌 셈이고
- 따라서 physical file 내에서도 이 LSN 으로 log 의 위치를 특정할 수 있게 된다.

LSN 과 DB replication

이놈은 database replication 에도 사용된다고 한다: VR

간단하게 생각하면, secondary 에서 primary 의 데이터를 다 들고오는 대신 primary 의 log 만 갖고 와서 replay 하면 primary 와 sync 가 맞기 때문.

Log Types

DBMS 에서 recovery 가 필요한 상황은 다음과 같이 정리해 볼 수 있다.
- Transaction failure:
  - Tx 를 commit 하는 것은 여러개의 page write 을 필요로 할 수 있는데,
  - Tx 가 실패하면 Atomicity 를 위해 이 page write 들을 원상복구시킬 필요가 있다.
  - 이를 위한 log 가 UNDO log 이다.
- DBMS crash (Node reboot):
  - DBMS 혹은 Node (즉, Server) 가 뻗는 경우에 persistent 하게 disk 에 저장되어 있어야 했지만 아직까지는 memory 에만 저장되어 있어서 사라진 애들을 복구할 필요가 있다.
  - 이를 위한 log 가 REDO log 이다.
그럼 이 각각에 대해 좀 더 알아보자.

Redo Log: Ctrl + Y

말 그대로 “이후 상태로 복원하기 위한 로그” 이다.
따라서 “이후 상태” 를 로깅해놓고, recovery 시에 이 Redo Log 를 보면서 이후 상태로 되돌리게 된다.
위에서 말한것 처럼, 이놈은 committed transaction 을 복구할 때 사용된다.
- NO_FORCE 정책에서는 commit 이 항상 disk 에 저장되지는 않기 때문에, crash 시에 committed transaction 을 이 redo log 를 보면서 transaction 이 정상적으로 끝난 상태로 되돌리게 된다.
- 즉, Durability 를 보장하기 위한 것.

Undo Log: Ctrl + Z

말 그대로 “이전 상태로 되돌리기 위한 로그” 이다.
따라서 update 를 할 때 “이전 상태” 를 로깅하고, recovery 시에 이 Undo Log 를 보면서 이전 상태로 되돌리게 되는 것.
위에서 말한것 처럼, 이놈은 transaction rollback 에 사용된다.
- Transaction rollback 을 하면 transaction 이전 상태로 되돌려야 하기 때문에, 이놈을 보면서 되돌리는 것.
- STEAL 정책에서는 commit 되지 않은 update 가 flush 될 수 있기 때문에, tx failure 시에 이런 flush 된 애들까지 되돌리기 위해 Undo log 가 필요하다.
- 즉, Atomicity 를 보장하기 위한 것이다.

Checkpoint

Log 에는 이런 작업 기록 말고도 주기적으로 현재 상태에 대해서도 적으면서 recovery 에 사용될 수 있게 한다.
이런 애들을 Checkpoint 라고 한다.
이게 필요한 이유는 recovery 시간을 단축시키기 위해서 이다.
- Checkpoint 의 가장 큰 역할은 “여기까지는 완벽함” 인데,
- 주기적으로 checkpointing 을 해서 중간중간 이 “여기까지는 완벽함” 지점을 만들어 줌으로써 recovery 해야 하는 양이 너무 많아지지 않게 한다.

Graph View

Log
Log Sequence Number, LSN
Log Types
Redo Log: Ctrl + Y
Undo Log: Ctrl + Z
Checkpoint

Backlinks

(Garden) Database
4. Scalable Database Logging (Bigdata and Knowledge Management Systems 2, SNU GSDS)
(논문 요약) Border-Collie: A Wait-free, Read-optimal Algorithm for Database Logging on Multicore Hardware (SIGMOD'19)
(논문) Scalable Database Logging for Multicores (4. Eleda Design)
Algorithms for Recovery and Isolation Exploiting Semantics, ARIES (Database Recovery)
Compensation Log Record, CLR (Database Recovery)
FORCE, NO_FORCE Policy (Database Recovery)
Log Message Schemes (Database Recovery)
STEAL, NO_STEAL Policy (Database Recovery)
Write Ahead Log, WAL (Database Recovery)

Created with Quartz v4.1.0, © 2026

GitHub
LinkedIn
Email