로드 밸런싱 이란 기술을 소개 할건데
우선 이 로드 밸런싱을 이해하기 위해서 이게 왜 등장하게 되었는지 알아야 한다
지금은 it 산업의 시대이다
인터넷이 발달함으로써 데이터 통신이 활발해졌다
그로 인해서 네트워크 트래픽이 엄청나게 증가 하게 되었다
그래서 아무리 성능이 좋은 서버를 갖추고 있다고 하더라도 이렇게 늘어난 트래픽을 감당하기 어려워졌다
이런 점으로 인해 서버를 추가로 설치하고 여러 서버에 동일한 데이터를 저장하여 수많은 트래픽을 효과적으로 분산 처리 한다
하지만 단순하게 이렇게 분산 처리하면 데이터의 일관성이 맞을까? 라는 답변을 놓게 된다 이에 필요한 기술이 로드 밸런싱이라는 기술이다
이렇게 데이터 일관성 문제라고 하면 감이 안올것 이다 작자도 그랬다
좀 더 깊게 보면
여러 서버에서 동일한 데이터를 저장하는 쓰기 작업을 할때 각각의 서버에 대해 데이터의 최신 상태를 유지하여야한다
쓰기 작업이 여러 서버에서 발생하게 되면 데이터 간에 동기화가 지연되어서 일관성이 깨지는 문제가 일어난다
이러한 문제가 있다
다시 로드밸런싱으로 돌아가보자
네트워크 트래픽이 늘어난다는 의미가 서버의 규모가 커지고 고객의 수가 늘어나게 된다는 것이다
이렇게 된다면 원활한 서비스 동작이 불가능해지게 되는데 이에 대처 할 수 있는 방법은 2가지로 나뉜다고 한다
- Scale-up 방식
- 기존의 서버 성능을 확장 하는 방식
- Scale-out 방식
- - 기존의 서버와 동일하게 하거나 낮은 성능의 서버를 증설하는 방식
여기에서 Scale-out 방식을 사용하게 된다면 여러 대의 서버로 트래픽을 균등하게 분산해주는 로드 밸런싱이 반드시 필요하다고 한다
로드밸런싱
- 서버가 처리해야 할 클라이언트 요청을 여러 서버로 나누어서 처리하는 것을 의미한다
- 이때 서버가 처리해야할 작업을 Load 라고 하고 여러 서버로 나누어서 처리하는 것을 Balancing이라고한다
- 로드밸런싱의 목표는 서버 간의 부하를 효율적으로 분산시켜 특정 서버의 과부하를 방지하고 전체 시스템 성능을 최적화하는 데 있다
로드밸런싱 방법에는 다양한 방식이 있으며, 각 방식은 시스템의 특성에 따라 다르게 적용될 수 있다
1. 라운드 로빈 방식 (Round Robin)
- 서버에 들어온 요청을 순서대로 배정하는 방식
- 여러 대의 서버가 동일한 스펙을 가지고 있고 서버와의 연결이 오래 지속되지 않는 경우에 활용하기 적합함
2. 가중 라운드 로빈 방식 (Weighted Round Robin)
- 각각의 서버마다 가중치를 매기고 가중치가 높은 서버에 요청을 우선적으로 배분하는 방식
- 주로 서버의 트래픽 처리 능력이 상이한 경우에 사용된다
- 예를들면 A라는 서버의 가중치는 2이고 B 라는 서버의 가중치는 4라고 할때 B에 요청을 4개 A에 요청을 2개를 전달하는 방식이라고 이해하면 된다
3. IP 해시 방식 (IP Hash)
- 클라이언트의 IP 주소를 특정 서버로 매핑하여 요청을 처리하는 방식
- 사용자의 IP를 해싱하여 로드를 분배해서 사용자가 항상 동일한 서버로 연결되는 것을 보장
4. 최소 연결 방식 (Least Connections)
- 요청이 들어온 시점에 가장 적은 연결 상태를 보이는 서버에 우선적으로 트래픽을 분배
- 세션이 길어지거나 서벙에 분배된 트래픽들이 일정하지 않은 경우에 적합하다
5. 최소 응답 시간 방식 (Least Response Time)
- 서버의 현재 연결 상태와 응답시간을 모두 고려하여 트래픽을 배분한다
- 가장 적은 연결 상태와 가장 짧은 응답 시간을 보이는 서버에 우선적으로 로드를 배분하는 방식
어떤 상황일때 사용해야할지, 어떤걸 사용해야 적합한지에 대해서는 이렇게 보면 감이 안잡힌다
쉽게 이야기하면
1. 라운드 로빈 방식은 서버의 성능이 모두 비슷하고 요청의 양도 대체로 균일할때 적합하다
2. 가중 라운드 로빈 방식은 서버마다 성능이 다를 때 적합하다
3. IP 해시 방식은 세션이 중요한 서비스에 적합하다
4. 최소 연결 방식은 연결 시간이 길거나 서버의 부하가 불균형 할때 적합하다
5. 최소 응답 시간 방식은 성능이 중요한 서비스에 적합하다
L4, L7 로드 밸런싱
로드 밸런싱에는 L4, L7 로드 밸런싱이 가장 많이 활용한다고 한다
L4, L7? 이게 뭘까?
Layer 4, Layer 7 이라고 한다
즉, 네트워크 OSI 계층이라고 한다
왜 4계층 7계층 일까?
-> 전송 계층 프로토콜과 응용 계층 프로토콜의 헤더를 부하 분산에 이용하기 때문이다
->모든 요청을 L4, L7 로드 밸런서가 받아 서버들에게 적절히 나누어 준다
L4
- 네트워크 계층이나 전송계층의 정보를 바탕으로 분산
L7
- 애플리케이션 계층에서 로드를 분산
- HTTP 헤더, 쿠키 등과 같은 사용자의 요청을 기준으로 특정 서버에 트래픽을 분산하는 것이 가능
- 패킷의 내용을 확인하고 그 내용에 따라 로드를 특정 서버에 분배한다
L7 로드 밸런서는 특정한 패턴을 지닌 바이러스를 감지하여 보호할 수 있고 DOS/DDOS 와 같은 비정상적인 트래픽을 필터링할 수 있어서 보안 분야에서도 활용 된다고 한다
결론은 현재 개발하고 있는 서버나 운영하고 있는 서버에 관해서 로드 밸런스를 적절하게 이용하여 부하 분산을 하여 가용성 및 응답 시간을 최적화 시켜 보다 안정적인 서비스를 구축하자
'네트워크' 카테고리의 다른 글
[네트워크] Socket 이란? (0) | 2024.09.01 |
---|---|
[네트워크] TCP/IP 4계층 (0) | 2024.07.11 |
[네트워크] OSI 7계층 7 Layer (0) | 2024.07.09 |
[네트워크] 쿠키(Cookie), 세션(Session), 토큰(Token) (1) | 2024.06.09 |
[네트워크] 3-way handshake 와 4-way handshake (0) | 2024.05.10 |