실전 프로젝트에 앞서 https를 적용해보기 위해 구글링을 해서 방법을 모색했다.
실행방법은 찾았는데 해결되지 않는 부분이 있어서 기술매니저님께 질문을 드렸는데, 돌아가는 원리를 확실히 파악하고 하는건지에 대한 질문을 받아서 우선적으로 개념을 알고 가기로 했다.
로드 밸런싱(Load Balancing)
정의
- 네트워크 또는 서버에 가해지는 로드를 분산 해주는 기술
- 중앙처리장치 혹은 저장장치와 같은 컴퓨터 자원들에게 작업을 나누는 것을 의미
즉, 여러서버가 분산 처리하는 것을 로드 밸런싱이라고 합니다.
그럼 로드 밸런서는?
로드밸런서는 로드밸런싱을 제공하는 서비스나 장치를 말합니다
--------------------------------------------------------------------------------------------------------------간단요약
Load Balancing의 필요성?
로드밸런싱은 여러 대의 서버를 두고 서비스를 제공하는 분산 처리 시스템에서 필요한 기술이다.
서비스의 제공 초기 단계라면 적은 수의 클라이언트로 인해 서버 한 대로 요청에 응답하는 것이 가능하다.
하지만 사업의 규모가 확장되고, 클라이언트의 수가 늘어나게 되면 기존 서버만으로는 정상적인 서비스가 불가능하게 된다. 증가한 트래픽에 대처할 수 있는 방법은 크게 2가지이다.
1) Scale-up
: 서버 자체의 성능을 확장하는 것. 비유하자면 CPU가 i3인 컴퓨터를 i7으로 업그레이드하는 것과 같다.
2) Scale-out
: 기존 서버와 동일하거나 낮은 성능의 서버를 두 대 이상 증설하여 운영하는 것을 의미한다.CPU가 i3인 컴퓨터를 여러 대 추가 구입해 운영한 것에 비유할 수 있다.
=> 이 경우,여러 대의 트래픽을 균등하게 분산해주는 로드밸런싱이 반드시 필요하다.
로드밸런서(Load Balancer)
정의
- 로드밸런싱 기술을 제공하는 서비스 또는 장치
- 클라이언트와 네트워크 트래픽이 집중되는 서버들 또는 네트워크 허브 사이에 위치
종류
1) L4 Load Balancing
- 전송 계층에서 로드를 분산한다.
- IP주소나 포트번호,MAC주소 등에 따라 트래픽을 나누고 분산처리가 가능하다
- CLB(Connection Load Balancer)혹은 SLB(Session Load Balancer)라고 부르기도 한다
2) L7 Load Balancing
- 애플리케이션 계층에서 로드를 분산한다
- OSI 7계층의 프로토콜(HTTP,SMTP,FTP 등)을 바탕으로도 분산 처리가 가능하다
로드밸런싱의 기본 기능
1. Health Check(상태확인)
- 서버들에 대한 주기적인 Health Check를 통해 서버들의 장애 여부를 판단하여,정상 동작중인 서버로만 트래픽을 보낸다
- L3 체크 : ICMP를 이용해 서버의 IP주소가 통신 가능한 상태인지를 확인한다.
- L4 체크 : TCP는 3 Way-Handshaking(전송-확인/전송-확인)를 기반으로 통신하는데, 이런 TCP의 특성을 바탕으로 각 포 트상태를 체크하는 방식
- L7 체크 : 어플레이케이션 계층에서 체크를 수행하며,실제 웹페이지와 통신을 시도해 이상 유무를 파악한다
2.Tunneling(터널링)
- 데이터 스트림을 인터넷 상에서 가상의 파이프를 통해 전달시키는 기술로,패킷 내에 터널링할 대상을 캡슐화시켜 목적 지까지 전송
- 연결된 상호 간에만 캡슐화된 패킷을 구별해 캡슐화를 해제하게 한다
3. NAT(Network Address Translation)
- 내부 네트워크에서 사용하는 사설 IP주소와 로드밸런서 외부의 공인 IP 주소 간의 변환 역할
- 로드밸런싱 관점에서는 여러 개의 호스트가 하나의 공인 IP 주소(VLAN or VIP)를 통해 접속하는 것이 주목적
- SNAT(Source Network Address Translation) : 내부에서 외부로 트래픽이 나갈때
내부 사설 IP 주소 - > 외부 공인 IP 주소로 변환
- DNAT(Destination Network Address Translation) : 외부에서 내부로 트래픽이 들어올 때
외부 공인 IP 주소 -> 내부 사설 IP 주소로 변환
4. DSR(Destination Network Address Translation)
- 서버에서 클라이언트로 트래픽이 되돌아가는 경우, 목적지를 클라이언트로 설정한 다음,네트워크 장비나 로드밸런서를
거치지 않고 바로 클라이언트를 찾는 방식
- 이 기능을 통해 로드밸런서의 부하를 줄여줄 수 있다
*ICMP(Internet Control Message Protocol)
: 패킷 전송에 실패했을 때 에러가 났음을 알림과 동시에,해결 가능한 힌트를 제공하는 메시징 프로토콜.
TCP/IP의 IP계층에서 동작
로드밸런싱 알고리즘 (Load Balancing Algorithm)
종류
1. 라운드로빈 방식(Round Robin Method)
- 서버에 들어온 요청을 순서대로 돌아가며 배정하는 방식
- 클라이언트의 요청을 순서대로 분배하기 때문에 여러 대의 서버가 동일한 스펙을 갖고 있고, 서버와의 연결(세션)이 오래 지속되지 않는 경우에 활용하기 적합함.
2. 가중 라운드로빈 방식(Weighted Round Robin Method)
- 각각의 서버마다 가중치를 매기고 가중치가 높은 서버에 클라이언트 요청을 우선적으로 배분하는 방식
- 주로 서버의 트래픽 처리 능력이 상이한 경우 사용되는 부하 분산 방식이다. 예를 들어 A라는 서버가 5라는 가중치를 갖고 B라는 서버가 2라는 가중치를 갖는다면, 로드밸런서는 라운드로빈 방식으로 A 서버에 5개 B 서버에 2개의 요청을 전달함.
3. IP 해시 방식(IP Hash Method)
- 클라이언트의 IP 주소를 특정 서버로 매핑하여 요청을 처리하는 방식
- 사용자의 IP를 해싱해(Hashing, 임의의 길이를 지닌 데이터를 고정된 길이의 데이터로 매핑하는 것, 또는 그러한 함수) 로드를 분배하기 때문에 사용자가 항상 동일한 서버로 연결되는 것을 보장함.
4. 최소 연결 방식(Least Connection Method)
- 요청이 들어온 시점에 가장 적은 연결상태를 보이는 서버에 우선적으로 트래픽을 배분하는 방식
- 자주 세션이 길어지거나, 서버에 분배된 트래픽들이 일정하지 않은 경우에 적합함.
5. 최소 리스폰타임(Least Response Time Method)
- 서버의 현재 연결 상태와 응답시간(Response Time, 서버에 요청을 보내고 최초 응답을 받을 때까지 소요되는 시간)을 모두 고려하여 트래픽을 배분하는 방식
- 가장 적은 연결 상태와 가장 짧은 응답시간을 보이는 서버에 우선적으로 로드를 배분함.
참고 자료:
https://dev.classmethod.jp/articles/load-balancing-types-and-algorithm/
'책벌레와 벌레 그 사이 어딘가 > 개념쌓기' 카테고리의 다른 글
[개념쌓기]타임리프/API/SDK/JDK (0) | 2022.08.30 |
---|---|
[개념쌓기] Docker (0) | 2022.08.26 |
[개념쌓기]SSL? HTTPS? (0) | 2022.08.25 |
[개념쌓기]NginX? + 설치까지 (0) | 2022.08.23 |
[개념쌓기]@Builder (0) | 2022.08.23 |
댓글