[번역] Azure 앱서비스 구조를 깊게 살펴봅시다

2017년 4월 3일2017년 4월 3일 youngjaekim 본격 강좌, 기술 이야기 architecture, Azure, 번역, Microsoft, MSDN, WebApp, WebSites

원문: https://msdn.microsoft.com/en-us/magazine/mt793270

Azure 앱서비스는 웹, 모바일, API 어플리케이션을 개발할 때 최고의 PaaS가 되도록 만들었습니다. 간단한 마케팅 페이지부터 확장성이 중요한 상거래 솔루션까지 모두 소화할 수 있습니다.

앱서비스는 완전한 관리형(managed) 플랫폼으로, 쉽게 말해서 인프라를 직접 운영할 필요가 없다는 뜻입니다. OS 패치와 프레임워크는 모두 플랫폼에서 알아서 해주기 때문에 서버를 직접 관리하지 않아도 됩니다. 여러분이 만든 어플리케이션은 가상화된 서버에서 동작하며 확장할 최대한의 서버 인스턴스 수만 정해주면 됩니다. 어플리케이션이 더 많은 리소스를 필요로 할 때 플랫폼이 자동으로 인스턴스를 확장하고, 동시에 확장한 인스턴스의 부하 분산 처리까지 합니다.

저희 앱서비스 팀은 여러분이 굳이 자세한 내용을 몰라도 편하게 쓸 수 있도록 만들었지만 동작 원리를 깊게 알면 더 좋을 것입니다. 이 글에서는 앱서비스의 내부 구조를 다루고 몇 가지 시나리오에 알맞은 구성에 대해서도 살펴보겠습니다.

전세계적으로 지역 분산된 구조

클라우드 컴퓨팅은 빠르게 확장할 수 있어야 하고 한 없이 큰 용량을 가져야 합니다. 클라우드의 확장 개념을 우리가 모니터를 보는 모습에 빗대보겠습니다. 모니터에 그림 하나가 있다고 할 때, 이를 멀리서 보면 하나의 선명한 그림이지만 가까이서 보면 수많은 픽셀로 이루어져있습니다. 클라우드도 이처럼 많은 서버로 구성되면서 하나의 큰 그림을 만듭니다. 앱서비스 클러스터는 서버의 묶음을 ‘확장 단위(scale unit)’ 또는 ‘스탬프’라고 부르고, 이 확장 단위가 전세계 Azure 데이터센터에 빼곡히 있습니다.

앱서비스는 전세계에 Azure를 지원하는 지역이면 어디든 있습니다. Azure가 있는 모든 지역에는 사용자의 어플리케이션을 실행하는 앱서비스 확장 단위와 지역 제어 단위(regional control unit)가 있습니다. 평상시에는 제어 단위가 사용자에게 보이지 않으며 플랫폼의 일부로 취급됩니다. 제어단위에 문제가 있다면 그 때는 보이겠지만 평소엔 제어 단위가 있는지도 모를 것입니다. 제어 단위 중에는 모든 API 호출을 관리하는 게이트웨이 역할을 하는 제어 단위도 있습니다. 사용자가 새 어플리케이션 생성 명령을 포털에서 하든 명령줄인터페이스로 하든 Azure REST API로 하든 상관없이 Azure의 중앙제어부(management.azure.com)로 생성 요청을 보내는 역할입니다. Azure 리소스 관리자 (Azure Resource Manager; 이하 ARM. bit.ly/2i6UD07)는 사용자의 여러가지 리소스를 하나의 그룹으로 관리할 수 있도록 합니다. 여러분이 ARM에서 사용하는 API에 대해서 말하자면, ARM으로 리소스를 제어할 때 사용하는 API는 ARM이 직접 관리하는게 아닙니다. Azure는 서비스 별로 관리용 API가 있고, 여러분이 ARM에 요청하면 ARM이 각 서비스의 API를 호출하는 식입니다. 앱 서비스의 경우 ARM이 받는 모든 API 요청은 Geo-Master로 포워딩됩니다. Geo-Master는 전세계의 모든 확장 단위를 파악하고 있으므로 여러분이 새 웹사이트나 웹 작업 같은 앱 서비스 어플리케이션 생성을 요청하면 Geo-Master가 최적의 확장 단위를 찾은 후, 그 확장 단위에 생성 요청을 포워딩합니다. 확장 단위가 생성 요청을 받으면 생성할 앱을 실행할 공간과 인프라를 확보한 후(프로비저닝이라고 합니다) 앱 실행에 필요한 리소스를 할당합니다. 아래 그림 1은 Azure에서 새 앱을 만드는 과정입니다.

Global Distribution of App Service Scale Units
그림 1 전세계에 분산된 앱서비스 확장 단위

새 앱을 만드는 과정은 다음과 같습니다.

사용자가 새 웹사이트 생성을 요청합니다.
ARM은 사용자가 리소스에 대한 접근과 작업 권한이 있는지 확인합니다. 이번 작업은 ‘생성하기’에 대한 권한입니다. 권한 확인이 끝나면 해당 요청을 앱서비스의 Geo-Master로 포워딩합니다.
Geo-Master는 사용자 요청에 가장 알맞은 확장 단위를 찾아서 해당 요청을 포워딩합니다.
하나의 확장 단위에 새 어플리케이션을 만듭니다.
Geo-Master는 요청에 대한 성공 여부를 리포트합니다.

앱서비스가 얼마나 많은 확장 단위로 이루어져있든 여러분의 어플리케이션은 대부분의 경우 단 하나의 앱서비스 확장 단위에서 동작합니다. Azure 트래픽관리자를 이용해서 여러 지역에서 앱이 실행되고 있다면 여러 개의 독립된 확장 단위에서 동작합니다. 확장 단위는 지역에 종속되어있기 때문입니다. 다시 말해, 여러분의 앱은 하나의 확장 단위에 종속되어있다고 볼 수 있습니다.

앱서비스 확장 단위란?

앱서비스 확장 단위(App Service scale unit)는 어플리케이션을 호스트하고 실행하는 여러 개의 서버를 하나로 묶은 단위입니다. 보통 한 단위는 1,000개 이상의 서버로 이루어져 있습니다. 서버를 클러스터로 구성하면 규모의 경제를 실현하고 인프라의 재사용성을 높일 수 있습니다. 앱서비스 확장 단위를 구성하는 시스템은 Azure 클라우드서비스(역자주: Cloud Service는 Azure 제품 이름 중 하나입니다) 배포로 이루어집니다. 지금은 Azure 클라우드서비스가 클래식 취급을 받지만 앱서비스를 처음 런칭했을 때는 2012년 6월이었습니다. 확장 단위를 만들고 제어하는 과정은 모두 자동화되어있습니다.

확장 단위의 부분 별 설명

확장 단위의 역할은 기본적으로 사용자의 어플리케이션을 호스팅하고 실행하는 것입니다. 어플리케이션은 윈도우 서버에서 구동되고 웹 작업자(Web Workers; 줄여서 ‘작업자’)는 구동 중인 어플리케이션을 참조합니다. 확장 단위 안에 있는 서버의 대부분은 작업자입니다. 확장 단위에는 작업자 외에 앱서비스의 여러 기능을 처리하는 지원 서버(support server)도 있습니다. 지원 서버마다 역할이 있고 각각의 지원서버는 여러 인스턴스에 배포되어 확장을 보다 수월하게 합니다.

프론트엔드

프론트엔드는 Layer-7 부하분산 장치입니다. 프록시와 같은 개념이며, 들어오는 HTTP 요청을 여러 어플리케이션과 어플리케이션에 속한 작업자에 분배합니다. 현재 앱서비스는 단순한 라운드로빈(Round-robin) 알고리즘으로 구현되어 있습니다. (역자주: 라운드로빈은 새가 한 번 날개짓 할 때마다 오르락내리락하는 것처럼 1-2-3-1-2-3…순서로 하나씩 돌아가며 수행하는 방식입니다)

웹 작업자 (Web Workers)

작업자는 앱서비스 확장 단위의 핵심입니다. 앱 그 자체를 구동합니다.

앱 서비스에서는 어플리케이션을 어떻게 실행할지 선택할 수 있습니다. 예를 들어, 공유(shared) 서버 또는 단독(dedicated) 서버를 ‘앱 서비스 계획(App Service Plan)’에서 선택할 수 있습니다. 앱 서비스 계획은 서버 할당, 기능, 용량 등을 정의한 묶음입니다. 공유 작업자는 여러 고객들의 어플리케이션을 호스팅하고 단독 작업자는 단 하나의 고객을 위한 어플리케이션을 호스팅합니다. 단독 작업자가 올라가 있는 단독 서버는 유형과 크기를 선택할 수 있습니다. 서버 사이즈가 클 수록 더 많은 CPU와 메모리 지원을 사용할 수 있습니다. 앱 서비스 계획은 어플리케이션을 실행하기 위해 서버를 미리 할당해놓습니다.

앱 서비스 확장 단위는 미리 프로비전한 작업자 풀을 가지고 있어서 그림 2의 첫번째 그림처럼 여러분의 어플리케이션을 받아들일 준비를 하고 있습니다. 여러분이 앱 서비스 계획에서 서버 두 대를 사용하겠다고 지정하면 그림 2의 두번째 그림처럼 앱 서비스는 두 대의 서버를 할당합니다. 그 다음, 그림 2의 세번째 그림처럼 앱서비스 계획에서 서버 두 대를 수평확장(scale-out)하겠다고 하면 작업자 풀에서 즉시 작업자를 할당합니다. 작업자를 미리 프로비전했고 워밍업까지 되어있으므로 여러분의 어플리케이션을 작업자가 배포받기만 하면 됩니다. 어플리케이션이 배포되면 작업자가 본격적으로 돌기 시작하고 프론트엔드는 트래픽을 받습니다. 이 모든 과정이 단 몇 초 내로 끝납니다.

Server Application Process in App Service Scale Unit
그림 2 앱 서비스 확장 단위에서 서버 어플리케이션을 실행하는 단계

그림 2의 네번째 그림은 여러 개의 앱서비스 계획을 각기 다른 색으로 표시하고 있습니다. 다른 색은 서로 다른 고객에 속한 앱 서비스 계획을 의미합니다.

파일 서버

앱은 콘텐츠를 보존할 저장소가 있어야 합니다. 콘텐츠는 HTML, .js, 이미지, 코드 등 어플리케이션을 구동하는데 필요한 파일을 말합니다. 파일 서버는 Azure 저장소 blob을 마운트하고 작업자에게 네트워크 드라이브로 보이도록 합니다. 작업자는 네트워크 드라이브를 로컬 드라이브로 맵핑합니다. 이렇게 하면 작업자가 취급하는 어플리케이션에서는 로컬드라이브를 다루는 것과 똑같아집니다. 어플리케이션에서 이루어지는 모든 파일 읽기/쓰기 작업은 파일서버를 거칩니다.

API 콘트롤러

API 콘트롤러는 Geo-Master가 앱 서비스를 조작할 때 사용됩니다. Geo-Master가 모든 확장 단위를 알고 있지만 여러분의 어플리케이션을 직접 관리하는 작업은 API 콘트롤러로 이루어집니다. 다시 말해, Geo-Master는 해당 확장 단위의 API 콘트롤러를 대행(delegate)할 뿐입니다. 예를 들어, Geo-Master에서 앱을 생성하라는 API 요청을 받으면 이 요청을 한 확장 단위의 API 콘트롤러로 넘기고 API 콘트롤러는 이 작업에 필요한 모든 단계를 처리합니다. Azure 포털에서 여러분이 만든 앱 서비스에 ‘재설정(Reset)’ 버튼을 누르면 API 콘트롤러가 그 앱에 할당된 모든 웹 작업자에 알림을 보내서 앱을 재시작합니다.

게시자 (Publishers)

Azure 앱 서비스는 FTP 접속을 지원하며 FTP로 앱 콘텐츠에 접근할 수 있습니다. 앞에서 언급했듯 앱 콘텐츠는 Azure 저장소 Blob에 저장되어있고 파일 서버는 이를 로컬 드라이브로 매핑하고 있는데, 게시자는 FTP 기능을 외부에 노출해서 앱 콘텐츠에 접근할 수 있게 합니다. 여러분은 게시자가 열어주는 FTP로 앱 콘텐츠 뿐만 아니라 로그도 접근할 수 있습니다.

앱 서비스에 앱을 배포하는데는 FTP 외에 여러가지 방법이 있습니다. 대표적으로 Visual Studio에서 Web Deploy를 이용하는 방법이 있고, 그 외에 Visual Studio 릴리즈 매니저의 지속 배포 기능이나 GitHub을 이용할 수도 있습니다.

SQL Azure

앱 서비스 확장 단위는 Azure SQL 데이터베이스에 메타데이터를 저장합니다. 어플리케이션 별로 저장 영역이 있고 그 안에는 어플리케이션에 대한 실행 정보도 저장되어 있습니다.

데이터 역할 (Data Role)

모든 역할에는 데이터베이스에 저장해야하는 데이터가 있기 마련입니다. 예를 들어, 웹 작업자는 앱을 런칭할 때 사이트 설정 정보가 있어야 하고 프론트엔드는 어떤 서버가 앱을 실행하고 있는지 알아야 HTTP 요청을 앱에 정확하게 전달할 수 있습니다. API 콘트롤러 또한 사용자가 명령한 정보를 읽고 데이터베이스에 저장하고 있습니다. 여기서 데이터 역할은, 확장 단위마다 있는 SQL 데이터베이스와 여러 역할 사이의 캐시(cache)입니다. 다른 여러 역할에서의 데이터 레이어(SQL 데이터베이스)를 추상화해서 확장성을 높이고 성능을 끌어올립니다. 뿐만 아니라, 소프트웨어 개발과 유지보수도 더 단순해집니다.

더 확실하게 알기 위한 사례

여기까지 여러분은 Azure 앱 서비스가 어떻게 구성되어있는지 알 수 있었습니다. 이제 이를 바탕으로 앱 서비스 팀이 정리한 팁을 살펴보겠습니다. 지금부터 나올 내용은 앱 서비스 엔지니어링 팀이 사용자들과 함께 일을 진행해보면서 얻은 지식입니다.

밀집도 조절하기

대부분의 사용자는 하나의 앱서비스 계획에 10개 이하로 적은 수의 어플리케이션을 실행합니다. 아주 많은 어플리케이션을 실행하는 사용자도 있는데, 이 때 서버의 연산 능력을 넘지 않도록 조심해야 합니다.

예를 들어가며 어플리케이션의 구성과 계산 리소스(CPU/메모리/트래픽의 조합)와의 관계에 대해 살펴봅시다. 웹앱 2개와 모바일 백엔드 앱 1개가 앱 서비스 계획에 있다고 가정합시다. 이 때 앱서비스 계획은 서버 2대로 설정했습니다.

기본적으로 앱 서비스 계획에 있는 어플리케이션은 그 앱 서비스 계획이 제공하는 서버 리소스 전체를 사용합니다. 앱 서비스 계획이 단 하나의 서버만 실행하고 있다면 그저 단일 서버에서 모든 어플리케이션이 구동하고 있다고 이해하면 됩니다.

앱 서비스 계획에 계산 리소스가 여러 개일 때는 더 깊은 이해가 필요합니다. 하나의 앱 서비스 계획에 10개의 계산 리소스가 있다면 어플리케이션은 10개의 계산 리소스마다 실행됩니다. 다시 말해, 하나의 앱 서비스 계획에서 50개의 앱을 서버 10개로 설정했다면 첫 서버에 50개, 두번째 서버도 50개 등등 10개의 서버 모두 50개씩 실행하고 있는 것입니다.

앱 서비스 계획에서 여러 어플리케이션을 실행하다가 그 중 한 어플리케이션에 HTTP 요청이 많아져서 더 많은 계산 리소스가 필요할 때가 있습니다. 이 때 어플리케이션을 실행할 서버 수만 늘리면 해결될거라 생각해서 서버를 한 대에서 여러 대로 확장하면 별 효과를 보지 못할 수 있습니다. 왜냐하면 서버 수는 늘어나지만 그 안에 다른 어플리케이션이 차지하는 CPU/메모리 또한 서버 수만큼 확장되기 때문입니다.

이보다는 각 어플리케이션의 사용량과 트래픽을 고려해서 적은 자원이 필요한 앱끼리 묶고 높은 사용량을 보이는 앱끼리 묶어서 앱 서비스 계획을 분리하는 편이 낫습니다. 50개의 어플리케이션이 실행 중이라면 아래와 같이 계산 리소스를 구분할 수 있습니다:

낮은 사용량의 40개 어플리케이션은 단일 앱 서비스 계획에 둡니다.
중간 정도 사용량을 보이는 5개는 두번째 앱 서비스 계획을 만들고 단일 서버로 설정합니다.
사용량이 높은 5개 어플리케이션은 각각 별도의 앱 서비스 계획에 둡니다. 그리고 자동 크기 조정 기능을 설정하고 최저는 1대, 최고는 각 사용량에 맞춰서 설정합니다.

위와 같이 하면 50개의 어플리케이션을 7개의 계산 리소스에 담은 기본적인 설정이 됩니다. 이제 사용량이 높은 5개의 어플리케이션은 필요에 따라 독립적으로 확장할 수 있습니다.

앱 단위로 확장하기

많은 어플리케이션을 앱 서비스 계획에서 효율적으로 관리하는 방법으로는 밀집도 조절 외에 앱 단위로 확장하는 방법도 있습니다. 자세한 내용은 이 링크(bit.ly/2iQUm1S)에서 볼 수 있습니다. 앱 단위로 확장하면 어플리케이션이 실행되는 서버 수의 최대치를 조절할 수 있을 뿐만 아니라 어플리케이션 단위로도 조절할 수 있습니다. 어플리케이션 단위로 조절하면 사용 가능한 모든 서버에서 실행되는 것이 아닌, 직접 설정한 최대한의 서버 수 내에서 실행할 수 있게 됩니다.

앞서 예를 든 50개의 앱을 앱 단위 확장 방법으로 설정하면 모두 하나의 앱 서비스 계획에 담고 각각의 앱을 다음과 같이 설정할 수 있습니다:

낮은 사용량의 40개 어플리케이션은 최대 1개의 서버에서 실행하도록 각각 설정합니다.
중간 정도 사용량의 5개 어플리케이션은 각각 최대 2개의 서버에서 실행하도록 설정합니다.
나머지 높은 사용량을 가진 5개의 어플리케이션은 최대 10개의 서버에서 실행하도록 설정합니다.

위와 같이 하면 앱 서비스 계획은 최소 5개의 서버(높은 사용량에 최소치를 맞추어)로 시작할 수 있습니다. 그 후 CPU/메모리 사용량에 따라 자동 크기 조정 규칙을 만들면 됩니다.

이렇게 설정하면 Azure 앱 서비스는 어플리케이션이 필요한 컴퓨터 자원을 자동으로 할당합니다. 그리고 앱 서비스는 각 어플리케이션에 설정된 최대한의 작업자 숫자에 맞춰 어플리케이션 인스턴스 수를 제한할 것입니다. 결론적으로, 앱 서비스 계획에 작업자 숫자를 늘린다고 50개 앱이 모든 곳에서 실행되지 않게 됩니다.

요약하면, 앱 단위 확장은 앱 서비스 계획 위에서 도는 어플리케이션을 모든 서버로 흘러넘치지 않게 해줍니다. 그래서 모든 어플리케이션이 모든 계산 리소스에서 돌지 않도록 합니다.

어플리케이션 슬롯

앱 서비스에는 배포 슬롯이라는 것이 있습니다. 자세한 내용은 다음 링크(bit.ly/2iJzv3f)에서 볼 수 있습니다. 배포 슬롯은 프로덕션으로 동작 중인 어플리케이션과는 구분된 별개의 어플리케이션을 ‘슬롯’이라는 개념으로 만든 것입니다. 새로 만든 어플리케이션은 프로덕션으로 교체하기 전에 테스트용으로 활용할 수 있습니다.

어플리케이션 슬롯은 앱 서비스에서 가장 많이 쓰이는 기능입니다. 각각의 어플리케이션 슬롯은 사실상 완전히 독립된 어플리케이션입니다. 즉, 커스텀 도메인, 별개의 SSL 인증서, 별개의 어플리케이션 설정값 등 모든 요소가 독립적입니다. 나아가 앱 서비스 계획조차 프로덕션 슬롯과는 별개로 다룰 수 있다는 뜻이기도 합니다.

기본적으로 각 어플리케이션 슬롯은 동일한 앱 서비스 계획 안에 만들어집니다. 낮은 사용량의 어플리케이션은 리소스 사용량이 낮으므로 같은 앱 서비스 계획 안에 만들어도 괜찮습니다.

하지만, 하나의 앱 서비스 계획에 담긴 모든 어플리케이션은 동일한 서버에서 실행되므로 프로덕션 어플리케이션과 같은 서버에 있게 됩니다. 프로덕션이 아닌 어플리케이션 슬롯에 부하테스트를 해도 프로덕션 어플리케이션까지 영향을 받게 되는 문제가 있습니다.

부하테스트를 할 때 프로덕션 슬롯에 주는 영향 없이 리소스 사용량을 점검하고 싶다면, 새 앱 서비스 계획을 만든 후 해당 슬롯을 그 계획으로 옮기면 됩니다. 다음과 같이 해보세요:

테스트용 슬롯을 옮길 새 앱 서비스 계획을 만듭니다. 주의사항: 앱 서비스 계획은 프로덕션 슬롯이 있는 앱 서비스 계획과 같은 리소스 그룹, 같은 지역에 있어야 합니다.
테스트용 슬롯을 위 단계에서 만든 앱 서비스 계획으로 옮깁니다. 이제 계산 리소스는 프로덕션 슬롯과 완전히 다릅니다.
이제 테스트 슬롯에 마음껏 테스트를 하세요. 앱 서비스 계획이 다르므로 프로덕션 슬롯의 리소스에는 영향을 주지 않습니다.
테스트를 마친 후 프로덕션 슬롯으로 교체하고 싶다면 테스트 했던 슬롯을 다시 프로덕션 슬롯이 있는 앱 서비스 계획으로 옮긴 후에 전환(swap)을 하세요.

무중단 프로덕션 배포

어떤 개발팀은 어플리케이션을 운영하면서 매일 업데이트를 배포하기도 합니다. 이 때, 여러분은 프로덕션에 바로 업데이트를 하고 싶진 않을 것입니다. 배포할 때 서비스 중단을 최소화할 수만 있다면 더욱 좋겠지요. 어플리케이션 슬롯을 잘 활용하면 충분히 가능합니다. ‘pre-production’이라는 슬롯을 하나 만든 후 가장 최근의 소스코드를 배포하고 프로덕션 설정과 동일하게 맞춥니다. 테스트를 충분히 했다면 전환(swap) 버튼을 눌러서 프로덕션 슬롯과 바꿉니다. 교체 작업은 어플리케이션을 재시작하지 않고 콘트롤러가 프론트엔드 부하분산장치(load balancer)에 알림을 줘서 트래픽을 최신 슬롯으로 리다이렉트하도록 합니다.

프로덕션의 트래픽을 받기 전에 워밍업을 해야 하는 어플리케이션도 있습니다. 예를 들면 캐시를 생성해야 하거나 .NET 어플리케이션의 경우 .NET 런타임이 JIT 처리를 해야하는 경우입니다. 프로덕션으로 전환하기 전에 미리 슬롯을 워밍업할 수 있습니다.

pre-production 슬롯으로 테스트와 워밍업을 동시에 하는 사용자도 있습니다. Visual Studio Release Manager 같은 지속 배포 도구를 사용하면 슬롯 전환 전에 pre-production 슬롯에 코드를 배포하자마자 테스트를 실행해서 문제가 없는지 확인한 후 워밍업 수행까지 한 흐름에 할 수 있습니다.

확장 단위의 네트워크 설정

앱 서비스의 확장 단위는 클라우드 서비스를 통해 배포됩니다. 이와 관련한 네트워크 설정과 특징을 이해하면 여러분의 앱이 네트워크에 어떤 영향을 주고받는지 더 깊게 이해할 수 있습니다.

확장 단위는 하나의 가상 IP (VIP)만 노출하고 있습니다. 한 확장 단위 안에 있는 모든 어플리케이션은 이 VIP를 통해 트래픽을 받습니다. 또한, 이 VIP는 앱 서비스 확장 단위가 배포된 클라우드 서비스를 나타낸 것이기도 합니다.

앱 서비스 어플리케이션은 HTTP(80 포트)와 HTTPS(443 포트)로 오는 트래픽만 받습니다. 기본적으로 모든 어플리케이션은 HTTPS를 지원하는 azurewebsites.net 도메인이 있습니다. 뿐만 아니라 앱 서비스는 Server Name Indication(SNI)와 IP기반 Secure Socket Layer(SSL)를 모두 지원합니다. IP기반 SSL의 경우, 인바운드 트래픽에 대한 IP만 할당받으며, 이 IP가 클라우드 서비스 배포본과 엮여있습니다. 참고로 HTTPS로 요청받는 모든 SSL 연결은 프론트엔드에서 끝나고, 프론트엔드는 그 트래픽을 특정 어플리케이션이 있는 작업자로 포워딩합니다. (역자주: 프론트엔드에서 인증서기반 암호화/복호화를 처리하며, 프론트엔드와 작업자 사이는 일반 HTTP 통신입니다. 더 자세한 내용은 다음 글을 참고하세요. http://stackoverflow.com/a/43132372/361100)

공개 VIP

기본적으로 한 확장 단위의 모든 인바운드 HTTP 트래픽에는 1개의 공개 VIP를 사용합니다. 즉, 어떤 앱이든 하나의 VIP로 지정할 수 있습니다. 앱 서비스에 1개의 앱만 있다면, nslookup 명령을 실행해보세요. 아래는 그 결과 예입니다.

#1 PS C:\> nslookup awesomewebapp.azurewebsites.net
#2 Server: UnKnown
#3 Address: 10.221.0.3
#4 Non-authoritative answer:
#5 Name: waws-prod-bay-001.cloudapp.net
#6 Address: 168.62.20.37
#7 Aliases: awesomewebapp.azurewebsites.net

한 줄씩 awesomewebapp.azurewebsites.net에 대한 결과를 살펴보겠습니다.

줄 #1 nslookup에서 awseomwebapp.azurewebsites.net 을 쿼리한 결과입니다.
줄 #5 어플리케이션 awseomwebapp을 호스팅하는 확장 단위의 도메인 이름을 볼 수 있습니다. cloudapp이라는 이름에서 알 수 있듯이 앱 서비스 확장 단위는 Azure 클라우드서비스에 배포되어있다는 것을 알 수 있습니다. WAWS는 Windows Azure Web Sites의 약자입니다. 과거에 Azure가 Windows Azure라고 불렸으며 앱 서비스는 Web Sites로 불렸던 적이 있습니다.
줄 #6 확장 단위의 VIP를 볼 수 있습니다. 줄 #5에서 언급한 waws-prod-bay-001는 호스팅하는 모든 어플리케이션을 하나의 공개 VIP로 지정할 수 있습니다.
줄 #7 같은 IP 주소에 매핑된 모든 도메인 별칭입니다.

아웃바운드 VIP

보통의 어플리케이션은 다른 Azure 서비스와 연결하거나 Azure가 아닌 외부 서비스와 통신할 때가 많습니다. 이 때 어플리케이션이 속해 있는 확장 단위를 넘어서 외부 네트워크로 연결을 해야 하는데 이를 아웃바운드 네트워크라고 합니다. Azure 서비스인 SQL 데이터베이스나 저장소에 연결하는 것도 아웃바운드 네트워크입니다. 아웃바운드 통신에는 최대 5개의 가상IP (VIP; Virtual IP)를 사용할 수 있습니다. 하나는 공용 VIP이며, 나머지 4개는 아웃바운드 전용입니다. 하나의 확장 단위에 있는 모든 어플리케이션은 이 5개의 IP를 사용하는데, 여러분이 어떤 VIP를 사용할지 선택할 수는 없습니다. 그러므로, 여러분이 접속할 서비스에 화이트리스트 IP를 등록하고 싶다면 5개를 모두 등록해야합니다. 여러분의 어플리케이션이 놓여있는 확장 단위의 IP 주소를 확인하려면 아래 그림 3과 같이 포털의 앱 서비스 속성에서 볼 수 있습니다.

App Service Application Outbound IP Address View in Azure Portal
그림 3 Azure 포털에서 앱 서비스 어플리케이션의 아웃바운드 IP 주소를 볼 수 있습니다

인바운드와 아웃바운드의 모든 IP를 단독으로 할당받으려면 이 링크(bit.ly/2hVRSlR)의 앱 서비스 환경(App Service Environment) 문서를 참고해주세요.

IP와 SNI SSL

앱 서비스는 IP기반 SSL 인증서를 지원합니다. IP-SSL을 사용하려면 HTTP 트래픽을 받기 위한 인바운드용 IP 주소를 지정받아야(dedicated IP) 합니다.

Azure에서 제공하는 지정 IP 주소와는 달리 앱 서비스의 IP-SSL은 여러분이 앱을 사용하고 있는 동안만 유효합니다. 다시 말해, IP 주소를 지정받았으되 고정적으로 가지고 있을 수는 없습니다. 여러분이 IP-SSL을 삭제하면 지정받았던 IP 주소를 잃고, 그 IP 주소는 다른 어플리케이션에 할당됩니다.

앱 서비스는 SNI SSL도 지원합니다. SNI SSL은 IP를 지정받을 필요가 없고 대부분의 브라우저에서 지원하므로 SNI SSL 사용을 권장합니다.

아웃바운드 네트워크에서의 포트 허용량과 그 한계

보통의 어플리케이션은 외부 네트워크에 아웃바운드로 연결할 일이 많습니다. 앞서 언급했듯 Azure 내부 서비스인 SQL 데이터베이스나 저장소에 접속하는 것 뿐만 아니라 HTTP/HTTPS API에 접속하기도 합니다. Bing 검색 API를 이용하거나 비즈니스 로직을 구현한 백엔드 API 어플리케이션에 접속하는 경우가 그 예입니다.

위의 경우는 모두 앱 서비스가 외부로 나가는 네트워크 소켓을 열고 아웃바운드 요청을 만드는 작업이며, Azure 네트워크 관점에서는 원격(remote) 접속입니다. 그러므로, 앱 서비스에서 원격 엔드포인트로 나가는 요청은 Azure 네트워킹 설정과 관련이 있으며, 네트워크주소변환(Network Address Translation; NAT) 테이블의 매핑작업으로 관리되고 있습니다.

하나의 앱 서비스 확장 단위에서 NAT 매핑을 새로 만드는 작업은 시간도 걸리지만 만들 수 있는 최대 NAT 매핑 갯수도 명확한 한계값이 있습니다. 그러므로, 앱 서비스의 아웃바운드 연결은 제약을 받을 수도 있고 더 이상 만들 수 없는 경우도 있습니다.

연결 수의 한계는 다음과 같습니다:

B1/S1/P1 인스턴스 당 1,920 연결
B2/S2/P2 인스턴스 당 3,968 연결
B3/S3/P3 인스턴스 당 8,064 연결
앱 서비스 환경 당 최대 64K 연결

연결 관리를 잘 못하는 어플리케이션은 접속 제한 문제를 늘 겪습니다. 보통은 많은 부하를 받을 때 외부 접속도 많아지므로 이런 문제가 있는 어플리케이션은 부하가 많아질 시점에 원격 접속 실패 메시지도 그만큼 자주 나오곤 합니다. 접속 실패시 다음과 같은 메시지를 보게 됩니다: “액세스 권한에 의해 숨겨진 소켓에 액세스를 시도했습니다. aaa.bbb.ccc.ddd (An attempt was made to access a socket in a way forbidden by its access permissions aaa.bbb.ccc.ddd)”

이런 문제를 줄이기 위한 몇가지 방법이 있습니다:

ADO.NET/EF를 사용하는 .NET 어플리케이션은 데이터베이스 연결 풀링을 사용하세요.
php/MySql의 경우 지속적인 데이터베이스 접속(persistent database connections)을 사용하세요.
Node.js에서 아웃바운드 HTTP/HTTPS 요청을 할 때는 keep-alives를 설정해서 연결을 재사용하세요. 설정에 대한 자세한 내용은 다음 링크(bit.ly/2iGrcoo)를 참고하세요.
.NET 어플리케이션에서 아웃바운드 HTTP/HTTPS 요청을 할 때는 System.Net.Http.HttpClient 인스턴스를 이용해서 연결 풀을 재사용하거나 System.Net.HttpWebRequest 사용할 때 Keep-alive 연결로 설정하세요. 참고: System.Net.ServicePointManager.DefaultConnectionLimit 숫자를 늘리세요. 기본값은 하나의 엔드포인트마다 2개의 동시접속으로 제한되어 있습니다.

App Service 샌드박스에는 몇 가지 제약이 더 있습니다. 지금까지 언급했던 제약보다 저수준의 제약 사항이며 자세한 내용은 다음 링크(bit.ly/2hXJ6lL)를 참고하시기 바랍니다.

정리하기

Azure 앱 서비스는 웹, 모바일, API 어플리케이션에 알맞은 PaaS 입니다. 앱 서비스 내부는 유동적인 요소가 많지만 개발자가 어플리케이션 개발에만 집중할 수 있도록 추상화했습니다. 이제 여러분들이 전세계로 어플리케이션을 확장하는데 필요한 복잡한 고민은 앱 서비스가 처리해줄 것입니다.

우리가 꼽는 앱 서비스의 모범적인 사례는 대부분 어플리케이션 확장에 대한 내용입니다. 앱 서비스 계획 안에서 어플리케이션이 웹 작업자와 어떻게 매핑되는지 잘 이해할 수록 확장 규모를 최적화하는데 도움이 됩니다.

Azure와 Azure 앱 서비스는 우리가 클라우드-퍼스트를 제창한 이래 빠르게 발전하고 있습니다. 2017년에도 새로운 혁신은 계속 될 것입니다.

덧붙임: 확장 단위 내의 구성요소 관계에 대해

이 글을 읽으면 확장 단위의 각 요소가 매우 강한 의존관계에 있는 것처럼 보일 수 있습니다. 하지만 설계상 각 요소는 느슨하게 연결되어 있습니다. 웹 작업자 외에 다른 역할이 비정상적인 상태여도 HTTP 트래픽을 처리하고 있는 어플리케이션은 계속 HTTP 트래픽을 처리할 수 있습니다.

예를 들어, 게시자가 정상동작 하지 않으면 FTP 접속을 할 수는 없지만 어플리케이션의 HTTP 트래픽에는 영향이 없고 다른 배포 기능에도 영향이 없습니다. API 콘트롤러에 있는 버그로 새 어플리케이션을 만들 수는 없더라도 이미 확장 단위에 있는 어플리케이션은 문제없이 동작합니다.

Yochay Kiriaty Microsoft Azure 팀의 principal program manager 입니다. 앱 서비스 플랫폼에서 웹, 모바일, API, functions를 이끌고 있습니다. Kiriaty는 90년대 후반부터 웹 기술 분야에서 일을 했고 성능과 확장을 중요하게 생각합니다. 이메일: yochay@microsoft.com 트위터: @yochayk

Stefan Schackow Azure 앱 서비스 팀의 program manager 입니다. Azure 웹앱을 처음 클라우드 서비스로 선보일 때부터 일했습니다. 현재는 Azure 앱 서비스의 배포와 개발을 책임지는 program manager들을 이끌고 있으며, Microsoft의 온프레미스/하이브리드 제품군(Azure Pack 및 Azure Stack) 개발도 책임지고 있습니다. 이메일: stefsch@microsoft.com

이 문서의 리뷰를 맡아준 Eduardo Laureano와 Nir Mashkowski에게 감사드립니다.

이 문서를 번역한 김영재 교육서비스 바로풀기의 개발사 Bapul의 CTO로서 기술로 교육에 새로운 시각을 주기 위해 열심히 개발하고 있습니다.

번역자를 위한 우리말 공부

2017년 3월 21일 youngjaekim 책 이야기 번역

번역자를 위한 우리말 공부
이강룡 저

번역가이자 글쓰기 교육 전문가인 이강룡이 쓴『번역자를 위한 우리말 공부』(유유)는 한국어 실력을 제대로 갖추어야 훌륭한 번역자가 될 수 있다고 말하는 책이다. 원서를 분석하고 외국어 공부를 하는 것 말고, 평소 한국어 의사소통 습관을 잘 들여야 번역자에게 좋은 글쓰기 태도가 몸에 밴다고 그는 주장한다….

이 책은 그동안 내가 읽었던 번역 관련 책 중에서 가장 핵심만 요약한 다이제스트판이라고 말하고 싶다. 다시 말해, 내가 번역에 대한 세미나를 한다면 이 책으로 골격을 잡은 후 여러 예시를 들 수 있겠다.

그동안 읽은 번역 책들의 거의 모든 내용을 담고 있으면서도 얇고 가볍다. 얇은 이유는 예시가 적기 때문이기도 하다. 이전에 자세한 책을 읽었던지라 다행이라는 생각도 들었다. 이 책을 먼저 읽었다면 너무 간단히 아는 상태에서 다른 책은 지루해했을테니까 말이다.

캐주얼한 번역에 대한 책은 이로써 거의 다 읽었고, 이 다음은 보다 전문적인 내용을 읽을 차례다. 예를 들어, ISO 표준에 대한 것이나 번역학에 대한 전문서적들이다. 원래 없던 목표인데, 기술번역에 대한 세미나를 한 번 해도 괜찮을 것 같다. 그리고, 올해 말에 한 권 정도는 더 번역을 해도 좋은 경험이겠다는 생각을 했다.

번역은 외국어 실력에서 시작하여 한국어 실력에서 완성된다. [10p]

위의 문장은 서론에 나온 말이다. 둘 다 어설퍼서 내가 번역을 할 깜냥이 되는지 걱정이 된다. 더 많은 책을 읽으며 공부해야겠다.

위기 관려 능력이란 미련 관리 능력이나 욕심 관리 능력인 셈이다. [20p]

주제를 잘 선택하자는 말이다. 원본을 잘 잡아야 번역도 잘된다. 원본에 ‘삘’이 꽂히지 않으면 안하는게 낫겠다.

말이 원뜻과 다르게 변질되어 쓰이도록 만든 사회풍토와 제도를 나무라야지 애먼 용어를 탓하면 안 된다. 비판하고 제안하자 그러면 후손들은 더 좋은 표현을 보고 배운다. [74p]

번역자는 늘 보편적인 표현을 궁리해야 한다. 그래야 번역문이 더 오래 사랑받을 수 있다. [81p]

위의 문장은, 아마도 이 책에서 건진 가장 값진 문장이다. 시간을 빠르게 훑는 기술번역이라도 후손들이 더 좋은 표현을 보고 배울거라는 사명감을 가져야겠다.

항공기 조종 견습생에게 계기판은 혼잡하고 두려운 대상이지만 능숙한 조종사에게 계기판은 복잡할 뿐 혼잡하지 않다. 필요한 지식을 습득했기 때문이다. 모르면 혼잡하고 두렵지만 알면 복잡하더라도 두렵지 않다. [98p]

위 문장은, UX 관점에서는 좋지 않은 표현일 수 있지만 사실은 사실일게다. 내가 만드는 수 많은 툴도 사실 뭐…나만 편한 경우가 많다. 나 혼자 숙련자이기 때문이다.

“번역은 사랑과 비슷하다. 무엇이 사랑인지 아는 건 어렵다. 그러나 무엇이 사랑이 아닌지 아는 건 어렵지 않다.” (translation is like love; I do not know what it is, but I think I know what is not) [141p]

피터 뉴마크(Peter Newmark)라는 사람의 ‘번역 교과서’에 나오는 말이라고 한다.

우주는 ‘집 우, 집 주’처럼 동의어를 나열한 게 아니라 각기 공간과 시간을 가리키는 동격인 상대어 모음이다. (…) 문장 성분 사이의 격이 자연스럽게 맞추어진 글은 대개 믿을 만하다. [163p]

내가 이 책을 본 후 실제 번역에서 가장 큰 영향을 준 문장이다. 이 문장을 본 이후로 우리말:우리말, 한자어:한자어 처럼 격을 맞추기 시작했다.

…그랬기에 활발한 비판도 일어난 것이다. 전에 쓰인 적 없는 한국어 표현을 처음 만드는 건 무거운 책임이 따르는 어려운 일이다. 좁은 문으로 가겠다고 다짐한 번역자는 그 짐을 기꺼이 떠안는다. 성심껏 한국어로 옮긴 번역자의 모자란 지식은 동료 번역자나 꼼꼼한 독자가 채워 주면 된다. 그렇지만 외국어를 그대로 두거나 엉뚱한 외국어로 바꿔치기하면 욕을 먹어도 싸다. [175p]

이 책의 저자가 자주 쓰는 표현이 ‘좁은 문으로 들어가라’는거다. 번역을 일이나 직업이 아닌 도를 닦는(?) 것이라고 말한다.

나는 번역문을 첨삭하면서 관형격 조서 ‘~의’가 제대로 쓰였는지 유심히 본다. 외국어 투 문장을 양산하는 주범이기 때문이다. [182p]

일본어 투 표현인 ‘~에 있어서’는 한국어 문장에 어울리지 않는다. [188p]

주어를 강조하려면 대개 조사 ‘이/가’를 붙이고 술어의 내용을 강조하려면 ‘은/는’을 붙인다. [189p]

나는 ‘~의’ 사용을 의식적으로 자제하는 편이므로 다행이지만, 나의 단점은 ‘~에’로 잘 못 쓸 때가 종종 있다.

번역자는 원문을 수없이 읽어 본 사람이므로 독자에겐 훌륭한 선생이거나 안내자다. (…) 좋은 번역자는 일반 독자들이 쉽게 이해할 수 있는 용어로 글을 쓰며, 가벼운 표현에 무거운 메시지를 담는다. (…) 번역자는 독자에게 3~4백쪽 본문 내용을 서른 줄로도 설명할 수 있고, 서너 줄로도 요약해 줄 수 있어야 한다. [251-252p]

번역자의 역할에 대해 마음에 드는 표현이다.

건축가 정기용의 이야기를 담은 다큐멘터리 ‘말하는 건축가’에 이런 대목이 나온다. “건축가로서 내 관심은 원래 거기 있던 사람들의 요구를 공간으로 번역하는 것이다.” 그는 훌륭한 번역자였다. [262p]

번역자란, 넓은 의미로는 글에서 글로 옮기는 사람이 아닌 자신의 직업에서 하나의 의미를 다른 의미로 은유하여 옮길 줄 아는 사람이라고 저자는 말한다. 인상적인 표현이다. 나는 어떤 사람이 될 수 있을까? 나는, 좁은 의미든 넓은 의미든 어떤 번역자로 남게 될까.

번역의 탄생

2016년 10월 30일2016년 10월 30일 youngjaekim 책 이야기 번역

번역의 탄생
이희재 저

“번역이란 외국어를 옮기는 작업이 아니라, 한국어를 바로 세우는 작업이다.” 한국간행물윤리위원회 ‘2008 우수저작 및 출판 지원사업’ 당선작. 영어와 한국어의 차이를 공시적이고 통시적으로 바라보면서, 단순히 어떻게 번역해야 하는가의 문제가 아니라 좀 더 깊숙이 언어 구조의 차이를 들여다본다. 기존 번역 지침서가 어구를 옮기는 번역의 기술에 치중하면서 하나하나의 테크닉을 나열하는 데 그쳤다면, 이 책은 뿔뿔이 흩어진 단편적 문제를 나열하는 게 아니라 번역의 기본 원칙과 우리말에 대한 이해에 대해 정리된 안목을 일관…

번역을 잘 하고 싶어서 읽은 세번째 책, 추천받아서 읽었지만 한편으로는 정말 힘들게 읽은 책이었다.

모든 내용이 너무 진지하고 훌륭해서 한글자씩 떼어다 읽느라 오래걸렸달까.

이전에 읽은 ‘갈등하는 번역‘은 저자와 함께 공부한다는 느낌을 주는 독특한 구성이 돋보였다면, 이 책은 내일 은퇴하는 노교수가 앞에 처음 앉은 나에게 그동안의 모든 지식을 전달하기 위해서 가끔씩 숨을 가쁘게 쉬며 가르치는 느낌이 들었다.

만약에 영국인이 한국어로 된 책일 많이 번역했다고 가정해볼까요. … 가령 “He said nothing”이라고 쓰지 않고 “Said nothing”이라고 쓰는 영국 작가가 많이 생겨났을 것입니다. [67p]

위의 문장이 재미난 이유는, 내가 실제로 영어를 주어를 생략해서 쓸 때가 있기 때문이다. 물론 다시 읽을 때 고치곤 하지만 손 가는대로 머리 가는대로 쓸 때는 종종 주어를 빼먹는다.

영어 동사를 한국어로 번역할 때는 달랑 한국어 동사 하나로만 번역하지 말고 한국어 부사를 덧붙일 수 있으면 과감히 덧붙여라. [120p]

이 책을 읽으면서 얻은 가장 큰 수확은 위에서 언급한 부사의 재발견이었다. 그래서 이번에 번역한 글에서는 순우리말 부사를 등장시키려고 애썼다. 예를 들어, “수 십년간 개발자들은 이벤트에 대해서 그다지 중요하게 생각하지 않았습니다.”, “이벤트소싱이 딱히 쓸모있지 않다고 생각해도 괜찮습니다.” 등이다.

이제 번역 관련 서적은 여기까지 읽고 또 다른 주제의 책을 읽어야겠다. 이 책은 정보가 너무 많아서 내가 직접 번역하면서 체득하기엔 경험이 더 필요하다.

[번역] 최신 기술 – Event Sourcing 처음 적용하기

2016년 10월 20일2016년 10월 30일 youngjaekim 본격 강좌, 기술 이야기 CQRS, 번역, 이벤트소싱, MSDN

원문: https://msdn.microsoft.com/magazine/mt422577

뭐든 큰 변화없이 언제나 뻔하다고 생각하면 어느새 신경도 쓰지 않게 됩니다. 데이터 저장소를 생각할 때 우리는 당연히 데이터의 현재 상태가 저장되어 있겠거니 합니다. 보험, 금융과 같이 큰 규모의 프로젝트는 모든 이력을 정확히 추적하고 기록해야하지만, 그렇지 않은 대부분의 어플리케이션과 웹사이트는 현재 상태만 저장해도 충분합니다.

이처럼 현재 상태를 저장하는 방식은, 시스템의 현재 상태를 스냅샷으로 찍어서 보존한다고 표현할 수 있습니다. 데이터는 보통 관계형데이터베이스에 저장합니다. 이렇게만 해도 새 트랜젝션을 만들고 과거의 트랜젝션 결과를 가져올 수 있습니다. 여기까지가 지난 수 십년간의 ‘뻔한 것’이었습니다.

오늘날 비즈니스는 따라오기 벅찰 정도로 빠르게 변하고 있습니다. 그래서 비즈니스와 도메인에서 일어나는 이벤트를 정확하게 추적해야 하는 경우도 많아졌습니다. 이벤트소싱(ES; Event Sourcing)은 스토리지 설계와 데이터를 저장하고 가져오는 방식에 영향을 주는 패턴입니다. 또한, 도메인에서 비즈니스 이벤트를 저장하고 보는 수준에 그치지 않고 데이터 프로젝션까지 즉시 만들 수 있는 패턴입니다.

이벤트소싱은 비즈니스를 기록하고 살펴보기에 똑똑하고 멋진 방법입니다. 데이터 저장 모델로는 꽤 새로운 이론이며 관계형 모델이 처음 등장했을 때만큼 참신합니다. 최근 등장한 NoSQL 보다 큰 변화를 줄 수도 있습니다. 물론 이벤트소싱은 현재 활발히 사용 중인 관계형이나 NoSQL을 대체하는게 목적은 아니며, 여러분은 이벤트소싱을 이들 둘의 상위 개념으로 구현할 수 있습니다. 이벤트소싱은 특정 시점의 상태로만 취급했던 데이터를 이벤트 단위로 다룹니다. 이벤트소싱을 사용할 수록 우리는 데이터에 대한 시각도 새로워질 것입니다.

이벤트소싱을 적용하면 무엇이 좋은가?

현재 상태만 저장하는 저장 모델에서 한 단계 발전한 형태로 갱신 이력을 추적하는 모델이 있습니다. 서점관리 프로그램을 생각해봅시다. 책마다 설명 속성이 있고 여러분은 속성 수정 권한이 있습니다. 이 때 속성에 대한 수정 이력을 보존해야할까요?

요구사항은 상황마다 다르겠지만, 이번 예시에서는 이러한 변경내역 추적이 중요한 기능이라고 합시다. 어떻게 구현할 수 있을까요? 한가지 방법은, 현재 상태를 저장하는 테이블 하나와 변경 내역을 저장하는 별도의 테이블로 구성하는 것입니다. 업데이트할 때마다 하나의 레코드가 추가되며 업데이트 기록에는 변경한 컬럼과 변경한 내용을 저장합니다.

다른 방법으로 시도해볼까요? 하나의 테이블에 하나의 책에 대해서도 여러 개의 레코드를 기록합니다. 각 레코드는 그림 1과 같이 타임스탬프와 현재 상태를 순서대로 저장합니다.

Multiple Records Hold Entity History
그림 1 엔티티 변경 내역을 여러 개의 레코드로 저장하는 형태

위와 같이 구성하면 현재 상태를 가져오기 위한 별도의 API를 만들어야 합니다. 단순히 레코드ID로 쿼리해서는 최신 상태를 가져올 수 없고 타임스탬프 상의 최신이거나 업데이트카운트가 가장 큰 값을 가져오도록 만들어야 합니다. 입력한 데이터 엔티티에 대한 모든 이벤트는 하나의 흐름으로 표현할 수 있는데, 이처럼 이벤트를 흐름으로 표현하는 것이 이벤트소싱의 핵심입니다. 그러므로 이벤트를 원활하게 추적하는 시스템을 구현하고 싶다면 이벤트소싱이 정답입니다.

기존의 개념 중 이벤트소싱과 관련있어 보이지만 다른 개념도 있습니다. 이벤트소싱이 로깅이나 감시 기능과 유사하다고 생각할 수 있지만, 로깅은 예외 상황이나 프로파일링까지 고려한다는 점에서 다릅니다. 이벤트소싱은 비즈니스 이벤트에 대해서만 다룹니다. 그러므로, 로깅 기능을 구성할 때처럼 여러 도메인과 구조를 관통하는 공통된 역할을 콤포넌트화 하는 작업과도 다릅니다. 이처럼 공통 부분을 정의하는 과정을 Aspect-orient 소프트웨어에서는 공통의 관심사(cross-cutting concern; 횡단관심사라고도 함)라고 하는데 이와는 다른 의미입니다. 이벤트소싱은 데이터를 어떤 구조로 설계하고 저장하는지에 대한 내용으로 봐야 합니다.

이벤트소싱이란

이벤트소싱은 이벤트를 데이터 소스로 간주합니다. 수 십년간 개발자들은 이벤트에 대해서 그다지 중요하게 생각하지 않았습니다. 어쩌면 그런 이유로 이벤트소싱이 주목받지 못했는지도 모릅니다. 이벤트소싱이 딱히 쓸모있지 않다고 생각해도 괜찮습니다. 아직 필요하지 않을 뿐입니다.

이벤트소싱은 도메인 전문가가 이벤트를 순서대로 추적하고 싶을 때 특히 유용합니다. 소극적으로 사용한다면, 워크플로우를 표현하거나 비즈니스 로직을 일원화할 때도 유용합니다. 다만 이처럼 소극적으로 사용할 경우에는 이벤트를 보존할 필요성도 적고 이벤트를 최우선 순위로 취급하지도 않습니다. 이 정도가 요즘 흔히 사용하는 이벤트소싱 시나리오입니다. 이 글에서는 이벤트를 데이터 소스로 사용하도록 하겠습니다. 이벤트소스를 도입하려면 저장소에서 두 가지를 고려해야 합니다. 보존과 쿼리입니다. 여기서 보존이라함은 세가지 핵심 작업과 관련되어 있습니다. 바로 삽입/갱신/삭제입니다. 이벤트소싱 시나리오에서의 삽입은 현재 상태만 보존하는 통상의 시스템과 다를 바 없습니다. 요청을 받으면 새 이벤트로 저장합니다. 이벤트에는 GUID와 같은 고유식별자를 함께 기록하며, 그 외에 해당 이벤트의 타입 이름과 코드, 타임스탬프, 기타 정보도 저장합니다.

이벤트소싱에서 갱신 작업은 삽입의 다른 표현일 뿐입니다. 어떤 프로퍼티가 변경되었고 새 값은 무엇인지, 관련된 비즈니스 도메인이 무엇인지, 그 외에 변경 사유 등을 기록합니다. 갱신이 한 번 일어난 저장소의 데이터는 그림 2와 같습니다.

A New Record Indicates Update to Entity with ID #1
그림 2 Entity ID #1에 대해 갱신이 일어났음

이와 마찬가지로 삭제 작업은 해당 엔티티를 삭제했다는 정보를 ‘삽입’합니다.

갱신 작업은 쿼리할 때 새로운 고민거리를 줍니다. 갱신하기 전에 갱신할 대상이 이미 있는지, 현재 상태가 어떤지는 어떻게 알 수 있을까요? 먼저 간단한 쿼리 레이어를 하나 만들어서 ID를 조회하고, 그 다음 현재의 값에 기반하여 새 값으로 갱신하는 이벤트를 삽입해야 합니다.

예를 들면, Created 이벤트를 먼저 가져온 후 그 내용에 맞추어 새 데이터를 추가하는 방법입니다. 현재 상태의 값은 해당 ID에 대한 모든 이벤트를 조회한 후 처음부터 짚어나가면 구할 수 있습니다. 이런 방법을 ‘이벤트 리플레이’라고 합니다. 하지만 단순히 모든 이벤트를 재생해서 상태를 재구성하는 방법으로는 성능에 큰 문제가 발생합니다. 은행 계좌의 현재 잔액을 알려면 수 년 전의 계좌 개설일부터 현재까지의 모든 거래를 가져와야 할테니까요. 그리 좋은 방법은 아닙니다.

그래서 이와 같이 모든 이벤트를 가져와야 하는 문제를 해결하는 방법 중 하나로 스냅샷을 만드는게 있습니다. 스냅샷은 특정 시점의 상태를 저장한 레코드입니다. 스냅샷을 만들면 적어도 모든 이벤트를 리플레이할 필요는 없습니다.

구현에 있어서, 이벤트소싱은 특정 기술이나 제품이 아닙니다. 그러므로 관계형 데이터베이스를 사용하든 NoSQL을 사용하든 상관 없습니다. 그 대신, 이벤트소싱을 소프트웨어 콤포넌트 개념으로 본다면 ‘이벤트 저장소(event store)’를 구현한다고 말할 수 있겠습니다. 이벤트 저장소는 이벤트 로그를 구현하는 작업과 별반 다를 바 없습니다. 그러므로 최소한의 기능만 충족한다면 데이터베이스가 제공하는 API를 이용하여 직접 만들어도 무방합니다.

이벤트 저장소는 두 가지 전제를 가지고 있습니다. 먼저, 추가만 가능하고 갱신은 없습니다. 삭제 또한 삭제 표식을 추가할 뿐 이벤트를 지우지 않습니다. 둘째, 요청하는 이벤트 ID에 맞게 이벤트 스트림을 반환할 수 있어야 합니다. 이 두가지 기능만 있으면 이벤트 저장소의 기본 요건은 충족됩니다.

이벤스 저장소 구현 시 고려사항

앞서 말했듯이, 이벤트 저장소는 기본 기능만 충족하면 특정 기술과 상관없이 구현할 수 있습니다. 데이터를 보존하는 부분은 보통 관계형 데이터베이스나 NoSQL을 사용합니다. 관계형데이터베이스로 구현한다면 한 이벤트마다 하나의 레코드를 가지도록 하고 하나의 테이블은 하나의 엔티티 타입을 가지도록 구현하는 식입니다.

이벤트는 다양한 포멧이 있습니다. 예를 들어, 모든 이벤트에 공통된 속성도 있지만 그렇지 않을 수도 있습니다. 물론 이벤트가 최대한 공통된 속성을 가질 수록 구현하기에 좋습니다. 그렇게 하기 어렵다면 행 단위(row)로 레코드를 쌓지 않고 SQL Server 2014에 추가된 기능인 Column Store Index를 이용하여 열 단위, 즉 컬럼 하나씩 쌓도록 테이블을 구성할 수도 있습니다. 또 다른 방법이라면, 이벤트를 JSON 오브젝트로 만든 후 이를 문자열로 직렬화하여 하나의 문자열 컬럼에 넣을 수도 있습니다.

NoSQL에서는 다양한 속성을 담은 하나의 레코드를 “도큐먼트”라는 단위로 저장합니다. 일부 NoSQL 제품은 이러한 도큐먼트 저장에 특화되어있습니다. 개발자 입장에서는 클래스를 만들고, 값을 채우고, 그대로 저장하면 끝나므로 아주 간편합니다. 보통은 각 이벤트의 유형 별로 클래스를 만들어서 저장하도록 구현합니다.

진행 중인 프로젝트

이벤트소싱은 아직 구조적으로 성숙한 단계는 아닙니다. 무엇 하나 표준화된 규약이 없기 때문에 이벤트 저장소와 이를 이용한 개발 경험은 계속 발전해나갈 여지가 많습니다. 그러므로 이벤트소싱 솔루션은 직접 만들어도 좋습니다. 이 섹션에서는 이벤트 저장소를 좀 더 구조적으로 만들고 편리하게 다룰 수 있는 도구를 몇가지 소개하겠습니다.

이벤트소싱에 최적화된 이벤트 저장소를 사용하면 이벤트 기록과 읽기 작업에만 집중할 수 있어서 보다 효율적인 개발이 가능합니다. NEventStore (neventstore.org) 프로젝트는 이런 시도 중 하나입니다. 간단히 이벤트를 기록하고 다시 읽을 수 있고, 가장 중요한 점이라면 특정 저장소에 의존하지 않고 이를 선택할 수 있다는 점입니다. 아래 예시는 저장소로 SQL을 사용하고 있습니다.

var store = Wireup.Init()
  .UsingSqlPersistence("connection")
  .InitializeStorageEngine()
  .UsingJsonSerialization()
  .Build();
var stream = store.CreateStream(aggregateId);
stream.Add(new EventMessage { Body = eventToSave });
stream.CommitChanges(aggregateId);

위의 예시는 이벤트를 기록할 때이며, 이벤트를 읽을 때는 스트림을 열고 커밋된 이벤트 컬렉션을 한 흐름으로 볼 수 있습니다.

또 다른 프로젝트로 Event Store (geteventstore.com) 프로젝트가 있습니다. .NET과 HTTP API를 제공하며, 이 API로 이벤트를 취합하고 하나의 스트림으로 관리할 수 있습니다. 이벤트 스트림을 가지고 크게 세 가지의 작업을 할 수 있습니다. (1) 이벤트 쓰기 (2) 가장 최근의 이벤트 또는 이벤트의 특정 구간 읽기 (3) 갱신할 때 받아보기가 가능합니다.

받아보기(subscription) 기능은 기본적으로 스트림에 이벤트를 추가할 때마다 콜백 함수를 호출하지만 그 방식은 세가지로 나뉩니다.

Volatile: 설정 시점 이전의 이벤트는 무시합니다. 새로 입력한 이벤트부터 받습니다.
Catch-up: 정해진 시작 지점부터 이벤트를 받습니다. 이미 입력된 이벤트도 받을 수 있습니다.
Persistent: 하나의 이벤트를 여러 곳에서 받을 수 있습니다. 여러 곳에서 받을 경우에도 최소 한 번(at-least-once)을 보장하며 순서에 상관없이 여러번 받을 수도 있습니다.

(역자 주: 더 자세한 정보는 Event Store 기술문서를 참고해주세요.)

정리

이벤트소싱은 이벤트를 어플리케이션의 데이터소스로 사용합니다. 어플리케이션을 만들 때 데이터의 마지막 상태만 다루는게 아닌 비즈니스 이벤트의 흐름을 기준으로 설계하고 개발할 수 있습니다. 저장하는 이벤트 데이터는 아주 저수준의 정보이므로 현재 상태를 알기 위해서는 별도의 투사(projection) 과정을 거쳐야 합니다. 투사란, 이벤트 리플레이를 하면서 특정 시점에 대한 데이터의 상태값을 만드는 일련의 처리 과정을 말합니다. 이벤트를 이용하면 어떤 형태로든 다양한 형식의 투사 결과를 만들 수 있습니다. 그리하여, 현재의 상태값 또한 다양한 형식으로 맞춰서 구할 수 있습니다.

Dino Esposito “Microsoft .NET: Architecting Applications for the Enterprise” (Microsoft Press, 2014), “Programming ASP.NET MVC 5” (Microsoft Press, 2014)의 공동저자입니다. JetBrains에서 .NET과 안드로이드 분야의 기술 에반젤리스트이며, 세계 곳곳의 여러 행사에서 연사로 활동하고 있습니다. Esposito의 소프트웨어에 대한 비전은 다음 링크에서 볼 수 있습니다. software2cents.wordpress.com, 트위터: @despos.

이 문서의 리뷰를 한 Microsoft 기술 전문가 Jon Arne Saeteras에게 감사드립니다.

이 문서를 번역한 김영재 교육서비스 바로풀기의 개발사 Bapul의 CTO로서 기술로 교육에 새로운 시각을 주기 위해 열심히 개발하고 있습니다.

[번역] 최신 기술 – CQRS 처음 도입하기

2016년 9월 12일2016년 9월 18일 youngjaekim 본격 강좌, 기술 이야기 CQRS, 번역, 이벤트소싱, MSDN

원문: https://msdn.microsoft.com/magazine/mt147237

도메인 주도 개발(이하 DDD;Domain-driven design)은 십여년 전부터 소프트웨어 개발자와 아키텍트들에게 많은 영향을 주었습니다. 분명한 장점과 단점을 모두 가진 DDD이지만, 객체지향 개발자들은 이를 통해 오래된 꿈을 실현하려고 했습니다. 그 꿈은 바로, 모든 이해관계자의 요구사항을 해소해주는 온전한 오브젝트 모델로 응용 프로그램을 만드는 것이지요.

지난 수십 년간, 많은 개발자들은 DDD 가이드라인에 따라 프로젝트를 수행했습니다. 그 중에는 성공한 프로젝트도 실패한 프로젝트도 있습니다. 결국 깨달은 진실이 있다면, 소프트웨어에서 기능적인 요소든 그 외의 요소든 모든 것을 아우른 오브젝트 모델이란 그저 환상일 뿐이라는 것입니다. 특히 요즘처럼 고차원의 UX, 급변하는 비즈니스 모델, 시도때도 없이 달라지는 요구사항이 들이닥치는 바쁜 세상에서 견고하고 안정적인 오브젝트 모델을 만들려는 것은 더 허황된 꿈처럼 느껴집니다.

최근 이에 대한 남다른 해결법으로 주목을 끌고 있는 용어가 있습니다. 바로 Command and Query Responsibility Segregation (CQRS; 명령과 쿼리의 역할구분) 입니다. CQRS가 소프트웨어 개발 방법론에서 새롭게 등장한 개념은 아닙니다. 구현도 그리 복잡하지 않습니다. CQRS는 그저 소프트웨어의 생애주기나 복잡도에 구애받지 않으면서 대부분의 소프트웨어 개발에 적용하기에 적합한 구현 패턴일 뿐입니다.

CQRS를 구현하는 방법은 취향따라 최소 세가지가 있습니다. 여러분이 뭐라고 이름 붙이든 상관없습니다. 호텔방이나 음료수를 구분할 때처럼 일반/프리미엄/디럭스로 이름붙여 봅시다. CQRS로 검색해서 나오는 대부분의 예시와 내용은 대부분 디럭스급이라고 보면 됩니다. 그런 것들은 평범한 어플리케이션에 적용하기엔 너무 복잡하고 과분합니다.

CQRS는 프로젝트의 복잡도와 상관없이 성공적으로 적용할 수 있는 소프트웨어 개발 방법론입니다. 최종적으로 CQRS는 전통적인 다층 레이어 아키텍처를 좀 더 많은 변화를 받아들이도록 재구성하는 것입니다.

명령과 쿼리

버트란드 마이어(Bertrand Meyer)가 1980년대에 Eiffel이라는 프로그래밍 언어를 개발할 때, 소프트웨어는 시스템의 상태를 바꾸는 것과 시스템의 상태를 읽는 두가지의 명령으로 나뉜다고 했습니다. 모든 소프트웨어 명령어는 명령과 쿼리 둘 중 하나라고 말입니다. 둘의 조합된 형태도 아니고 반드시 둘 중 하나에 속해야 합니다. 좀 더 세련된 표현으로 말하자면, 질문을 아무리 해도 답변은 변하지 않아야 합니다. CQRS는 이 이론을 현대적으로 복기한 것입니다. 명령과 쿼리를 구별하여 별개로 구현합니다.

명령과 쿼리를 논리적으로 나누기란 어려운 일입니다. 특히 둘 모두가 동일한 프로그래밍 스택과 동일한 모델을 사용한다면 더더욱 어렵습니다. 복잡한 비즈니스 시나리오에서는 더 어려운데, 왜냐하면 오브젝트든 함수형이든 뭐든간에 어떤 모델이라도 금세 손 쓸 수 없을 정도로 복잡해지곤 하기 때문입니다. 이렇게 모델이 급격하게 커지고 복잡해지면 시간과 예산을 잡아먹고 원래 의도했던대로 동작하지도 않을 것입니다.

CQRS는 기본적으로 쿼리 작업은 쿼리 작업끼리 한 레이어에, 명령 작업은 또 다른 레이어에 그룹핑해서 구분합니다. 각 레이어는 독립적인 데이터 모델과 서비스를 사용하고 독자적인 패턴과 기술을 조합해서 구현합니다. 중요한 점은, 두 레이어를 각자 고유의 2-tier로 구현할 수 있고 최적화도 구분해서 적용함으로써 서로에게 영향을 주지 않도록 하는 것입니다. 그림 1은 CQRS 구조의 기초적인 부분을 보여줍니다.

A Canonical and Multi-Layered CQRS Architecture

그림 1 기본적인 다층 레이어의 CQRS 구조

명령과 쿼리를 별개로 인식하면 소프트웨어 구조에 큰 변화를 줄 수 있습니다. 일례로, 각자의 도메인 레이어에 대해서만 모델링하고 코딩하기 때문에 훨씬 단순합니다. 명령 스택은 데이터, 비즈니스, 보안 규칙만 고려해서 개발하고, 쿼리 스택은 가장 간단하게는 DB 커넥션에 SQL 쿼리문만 작성하면 됩니다.

프레젠테이션 계층에 보안 규칙을 넣는다면, 쿼리 스택은 Entity Framework와 같은 ORM을 얇게 감싸고 데이터를 조회하는 수준일겁니다. 도메인 레이어마다 데이터를 해당 도메인의 요구사항에 최대한 맞춰서 표현하기에도 수월합니다. 데이터를 굳이 복사하거나 누더기로 만들지 않고도 말입니다.

DDD가 처음 나왔을 때는 소프트웨어 개발의 복잡함을 따져보려는 의미가 컸습니다. DDD를 시도하는 개발자들은 꾸준히 이 복잡함과 씨름해왔습니다. 대부분은 비즈니스 도메인에 대한 이야기였습니다. 하지만 대부분의 복잡한 것들은 명령과 쿼리의 곱집합 때문이었습니다. 쿼리에서 명령 부분을 떼어내면 복잡도가 한자릿수로 줄어듭니다. 단순히 수학적으로 표현하자면, 통상적인 도메인모델 기반으로 구현한 복잡도가 NxN이라면 CQRS는 N+N인 셈입니다.

CQRS 시작하기

기존의 CRUD 시스템도 얼마든지 CQRS 형태로 바꿀 수 있습니다. 예를 들어 사용자가 다양한 정보를 입력하는 폼이 있는 전통적인 ASP.NET MVC 웹 어플리케이션이 있다고 합시다. 대부분의 어플리케이션이 하는 일이기에 아키텍트들은 어떻게 해야 이런 어플리케이션을 빠르고 효율적으로 만들지 잘 알고 있습니다. 이제 여러분은 이를 CQRS로 재해석해서 만들어볼 것입니다. 아마도 바뀔 부분이 거의 없어서 놀랄 것입니다. 그에 비해 얻는 장점은 너무나 많습니다.

기존의 시스템은 대부분 여러 계층으로 이루어져 있습니다. 여러분의 시스템에 콘트롤러에서 직접 호출하는 어플리케이션 서비스가 있다고 가정해봅시다. 콘트롤러와 어플리케이션 서비스는 웹 서버 안에 있습니다. 그림 1과 같이, 어플리케이션 서비스는 어플리케이션 계층을 이룹니다. 그래서 어플리케이션 계층은 시스템에 명령과 쿼리를 실행하는 플랫폼이기도 합니다. CQRS를 적용한다는 말은 곧 역할이 둘로 구분된 중간계층을 가진다는 말이기도 합니다. 하나는 시스템 상태를 바꾸는 명령에 대한 것이고, 다른 하나는 데이터를 가져오는 것입니다. 그림 2는 이에 따라 ASP.NET MVC 프로젝트의 구조를 나타낸 다이어그램입니다.

The CQRS Architecture for an ASP.NET MVC Project
그림 2 ASP.NET MVC 프로젝트에서의 CQRS 구조

먼저 두 개의 클래스 라이브러리 프로젝트를 만듭니다. 쿼리 스택과 명령 스택 라이브러리입니다. 그리고 웹 서버 프로젝트에 모두 참조로 추가합니다.

쿼리 스택

쿼리 스택 클래스는 데이터를 가져오기만 합니다. 개발을 할 때 프리젠테이션 레이어에 최대한 일치하도록 데이터 모델을 만듭니다. 이 때 비즈니스 규칙은 거의 고려할 필요가 없습니다. 왜냐하면 비즈니스 규칙이란 주로 상태를 바꾸는 것이므로 명령 스택에서 구현하기 때문입니다.

DDD에서 유행한 도메인 모델 패턴은 도메인 로직을 조직하는 방법에 대한 것이었습니다. 이렇게 복잡하게 갈 필요 없이, 시스템의 프론트엔드에서 실행할 쿼리를 만들 때는 단지 어플리케이션 로직의 일부와 사용 시나리오만 신경쓰면 됩니다. 실상 ‘비즈니스 로직’이라는 말은, 변하지 않는 도메인 로직 위에 어플리케이션 별 로직을 엮은 결과물입니다. 보여주는 정보의 정해진 형식과 프레젠테이션 포멧을 알면 그저 SQL 쿼리로 나온 데이터를 매핑하는 작업만 해주면 됩니다.

어플리케이션 계층에서 실행하는 모든 코드는 시스템의 비즈니스 도메인을 반영한 결과입니다. 그러므로 시스템의 핵심 로직에 대한 API는 변하지 않아야 합니다. 이상적으로는, 핵심 로직에서 노출된 API는 그 자체로 완전무결해야 합니다. 즉, 어떠한 불일치도 없고 일관된 규칙을 가집니다. 쿼리 스택의 본질은 읽기전용이므로 아래 코드와 같이 Entity Framework 콘텍스트를 간단히 감싸고 있는 클래스를 만들 수 있습니다. 이제 감쌌다는 의미로 wrapper 클래스라고 부르겠습니다.

public class Database : IDisposable
{
  private readonly QueryDbContext _context = new QueryDbContext();
  public IQueryable<Customer> Customers
  {
    get { return _context.Customers; }
  }
  public void Dispose()
  {
   _context.Dispose();
  }
}

위 코드에서 QueryDbContext 클래스는 DbContext 클래스를 상속받았으며, DbSet<T> 콜렉션이 들어있습니다. 여기서는 QueryDbContext 클래스가 데이터베이스의 모든 테이블에 엑세스 할 수 있다고 가정합시다. 이렇게 하면 Linq to Entities 기능으로 쿼리를 수행할 수 있습니다.

쿼리 파이프라인을 만드는 첫 단계는 데이터베이스에 쿼리만 할 수 있도록 설정하는 것입니다. wrapper 클래스가 바로 이런 역할을 합니다. Database 가 IQueryable<T>만 노출하고 있기 때문입니다. 이로써 Database라는 wrapper 클래스를 사용하는 어플리케이션 계층은 쿼리를 구현해서 프리젠테이션으로 데이터를 보낼 수 있게 됩니다.

var model = new RegisterViewModel();
using (var db = new Database())
{
  var list = (from m in db.Customers select m).ToList();
  model.ExistingCustomers = list;
}

위 코드와 같이 데이터 원본과 프리젠테이션은 직접 연결되어있습니다. 이제 데이터를 표시하기 위한 용도로 데이터 읽기와 형식만 다루면 됩니다. 로그인 기능이나 UI에 제한을 둬서 데이터 접근을 제어하고 싶다면, 그저 데이터 접근까지 레이어를 더 추가하거나 IQueryable로 가져오는 데이터 콜렉션을 조절해서 구현할 수 있습니다. 데이터 모델은 데이터베이스와 동일하므로 1:1 관계입니다. 이렇게 IQueryable을 노출한 데이터 모델은 Layered Expression Trees (LET)라는 개념을 적용할 때도 유용하게 사용할 수 있습니다. (*역자주: LET는 Linq를 최대한 활용하여 데이터 모델을 풍부하게 표현하는 방법 중 하나입니다)

지금까지 논의한 내용 중 핵심 몇 가지를 정리해봅시다. 우선, 읽기전용 파이프라인에는 비즈니스 규칙이 없다는 것입니다. 인증 규칙과 필터링 외에는 특별히 고려할게 없습니다. 그리고 인증 규칙이나 필터링은 어플리케이션 계층에서 이미 잘 파악하고 있습니다. 데이터 전송 오브젝트(Data Transfer Object; DTO)를 복잡하게 다루지도 않습니다. 뷰에 표시하는데에 단 하나의 모델과 그 안에 실제 데이터만 있습니다. 그러므로, 어플리케이션 서비스는 아래와 같은 패턴일 것입니다.

var model = SpecificUseCaseViewModel();
model.SomeCollection = new Database()
     .SomeQueryableCollection
     .Where(m => SomeCondition1)
     .Where(m => SomeCondition2)
     .Where(m => SomeCondition3)
     .Select(m => new SpecificUseCaseDto
       {
         // Fill up
       })
     .ToList();
return model;

코드에 있는 데이터 전송 오브젝트는 프리젠테이션 전용으로만 사용하게 됩니다. 클래스를 만드는건 어쩔 수 없지만 그 클래스에는 사용자가 뷰에서 보고 싶어하는 정보만 있습니다. Where 절을 교체하는 IQueryable 확장메소드를 구현해서 그때그때마다 다른 것으로 볼 수 있도록 할 수도 있습니다. 이렇게 하면 특정 도메인에 대해 대화형으로 구현할 수도 있습니다.

쿼리 스택에서 고려할 점이 또 하나 있다면 데이터의 일관성(persistence)입니다. 간단한 형태의 CQRS는 명령과 쿼리 스택을 하나의 데이터베이스로 사용합니다. 이런 공용 구조는 CQRS로 구현해도 전통적인 CRUD 시스템과 유사해보입니다. 그러므로 변화에 저항감이 있는 개발자들에게는 CQRS를 도입하기에 보다 쉬워 보일 수 있습니다. 하지만 나중에는 명령과 쿼리 스택이 별개의 데이터베이스를 사용하도록 백엔드를 디자인해야 합니다. 각자의 목적에 맞도록 최적화해야 하기 때문입니다. 두 데이터베이스의 동기화는 다른 문제이므로 이 글에서 다루지는 않겠습니다.

명령 스택

CQRS 에서 명령 스택은 어플리케이션의 상태를 바꾸는 작업만 합니다. 어플리케이션 계층이 프리젠테이션에서 요청을 받으면 하나의 명령으로 구성한 후 이 명령을 파이프라인에 푸시합니다. 여기서 ‘명령을 파이프라인에 푸시한다’는 표현은 CQRS를 특징짓는 말이기도 합니다.

가장 단순하게는 트랜젝션 스크립트를 실행하는 것이 곧 명령을 푸시하는 것입니다. 트랜젝션 스크립트는 작업에 필요한 모든 과정을 처리한 워크플로우입니다. 그래서 어플리케이션 계층에서 명령을 푸시하는 작업은 아래 코드와 같이 구현할 수 있습니다.

public void Register(RegisterInputModel input)
{
  // Push a command through the stack
  using (var db = new CommandDbContext())
  {
    var c = new Customer {
      FirstName = input.FirstName,
      LastName = input.LastName };
    db.Customers.Add(c);
    db.SaveChanges();
  }
}

비즈니스 로직을 구현한 서비스 도메인 계층과 그에 관련된 도메인 모델을 좀 더 적극적으로 이용하면 보다 복잡한 구성을 만들 수도 있습니다. 하지만 CQRS를 구현하는데 반드시 DDD와 엮을 필요는 없습니다. DDD에서 언급하는 도메인 모델의 집합, 팩토리, 값 오브젝트와 같은 개념을 굳이 다루지 않아도 CQRS 구현에 문제되지 않습니다. 그저 명령과 쿼리의 구분을 명확히 해서 도메인 모델로 인해 만들어지는 복잡성을 줄일 수만 있다면, 그것이 바로 CQRS 도입의 장점일 것입니다.

CQRS 다음은 무엇일까

CQRS의 장점은 명령과 쿼리 파이프라인을 원하는대로 최적화할 수 있으면서도 다른 요소가 깨질 위험은 거의 없다는 것입니다. CQRS를 가장 기초적으로 시도하려면 단일 데이터베이스를 공유하고 어플리케이션 레이어에서 읽기와 쓰기를 별개의 라이브러리로 수행하는 방법이 있습니다.

좀 더 제대로 하려면 여러 개의 데이터베이스를 혼용하여 폴리글랏 저장소로 만들고 쿼리할 때나 이벤트 소싱에 대응하여 조합하는 것입니다. 이벤트 소싱은 명령을 백엔드에 보낼 때 더 유연하게 처리할 수 있으므로 중요합니다. 명령을 버스에 보내고 이를 이벤트로 배포하면 어떤 작업을 새로 정의하거나 수정하는 경우에 이를 플로우 차트를 다루듯이 관리할 수 있기 때문에 보다 유연합니다. 이와 동시에 버스의 성능과 기능을 추가하면 수직적으로 확장하는 효과를 얻을 수도 있습니다.

많은 개발자들이 CQRS에 찬사를 보내지만 대규모의 고차원적인 어플리케이션에만 어울린다고 생각하곤 합니다. CQRS 그 자체는 고수준의 아키텍처도 아니고 특정 기술에 종속적이지도 않습니다. 일부 디자인 패턴에 종속적일 수는 있지만, 단지 디자인 패턴일 뿐입니다. CQRS는 단순하고 강력하며 대부분의 어플리케이션에 잘 맞습니다.

이 문서의 리뷰를 한 Microsoft 기술 전문가 Jon Arne Saeteras에게 감사드립니다.

이 문서를 번역한 김영재 교육서비스 바로풀기의 개발사 Bapul의 CTO로서 기술로 교육에 새로운 시각을 주기 위해 열심히 개발하고 있습니다.

갈등하는 번역

2016년 8월 11일2017년 8월 7일 youngjaekim 책 이야기 번역

갈등하는 번역
윤영삼 저

번역가의 블랙박스를 열다……출발 언어를 도착 언어로 옮기기까지번역가의 머릿속에서는 무슨 일이 벌어질까?전문 번역가로 활동하는 동시에 출판기획, 저술, 편집, 강의 등 번역과 관련된 여러 활동을 해온 저자가 쓴 『갈등하는 번역』은, 그 제목이 여실히 말해주듯 이리 고민하고 저리 고민할 수밖에 없는 ‘번역’ 행위에 대한 책이다. 번역이란 무엇일까? 단순히 어떤 텍스트를 한국어로 옮기기만 하면 되는 걸까? 그렇다면 구글 번역기야말로 세상에서 가장 훌륭한 번역가일 테고, 같은 원문을 놓고 서로 다른 번역본이 서너 권씩 나오는 일도 없었을 …

번역에 대해 보다 체계적인 학습을 하고 싶어서 서점에 가서 책을 찾던 도중 집어든 책이다. 두께는 적당히 두툼한 수준으로, 416페이지 정도다. 대상 독자는 번역을 직업이자 전공으로 하고 싶은 사람들로, 어찌보면 내용은 번역학 개론이기도 하다.

저자는 꾸준히 ‘커뮤니케이션 번역’, ‘커뮤니케이터로서의 번역가’라는 표현을 쓰는데, 번역자의 역할을 매우 능동적인 위치로 두고 있다. 저자와 시간차이를 두고 있는 또다른 저자의 위상과도 같다.

이 책에서 가장 도움을 준 장은 ’22장. 독자를 낚는 그물을 짜는 기술: 표층결속성’과 ’26장. 혼돈 속에서 탄생한 질서: 한국어의 기둥 은/는’이다. 22장은 문장을 시각화한 것이 인상깊고, 26장은 구정보/신정보로 나눈 후 그에 따라 단어와 절의 배치를 가르친다.

또한 이 책의 가치는, 무엇이 좋은 번역이고 어떤 글은 왜 안읽히는지에 대해 정량적으로 분석하고 있다. 표를 제시하면서 각 번역문에 대해 비교한 것은 글을 보다 논리적으로 볼 수 있게 해준다.

물론 우리가 이런 작업을 대화에서 능숙하게, 어려움을 전혀 느끼지 못하고 해낼 수 있는 것은 상대방의 즉각적인 피드백이 있기 때문이다. 하지만 글에서는 그러한 피드백이 없다. 그래서 많은 사람이 글은 혼자 쓰는 것이라고 착각한다. 자기 생각을 늘어놓으면 저절로 글이 된다고 생각한다. 물론 일기나 개인 블로그에 끄저이는 단편적인 감상 같은 것들은 물론 그렇게 써도 상관없을 것이다. (그런 글을 쓰는 것이 ‘글쓰기’에 그다지 도움 되지 않는 것은 이 때문이다). [246p]

블로그를 열심히 하면 뭔가 글쓰기가 나아질거라 생각했는데 다시 돌아보게 하는 글이다.

번역은 언어를 바꾸는 작업이 아니라 목표 독자를 바꾸는 작업이다. 다시 말해 번역이란 가상 독자를 바꿔 글을 다시 쓰는 작업이다. 이것이 바로 번역이다! [296p]

글에서 거의 유일하게 느낌표를 사용한 문장이다.

화제는 동사를 선택하는 기준이 될 뿐만 아니라 글의 전개 방향을 알려주는 깃발과도 같다. [154p]

이 책에서 배운 내용 중 가장 많이 배운 주제가 있다면 화제어, 구정보/신정보다.

원래 이 책을 읽은 후 ‘번역의 탄생’이라는 책을 읽으려고 했는데 너무 많은 내용을 배워서 (마치 한 학기 강의를 들은 것처럼) 한동안 말랑말랑한 내용의 책을 읽어야겠다.

이 책을 읽은 후 문제라면, 기존에 취미로 하던 번역에 대해 한 문장도 쉽게 나가지 못하는거랄까.

[번역] 최신 기술 – 이력을 기록하는 CRUD 구현하기 2부

2016년 7월 19일2016년 7월 21일 youngjaekim 본격 강좌, 기술 이야기 CQRS, 데이터베이스, 번역, 이벤트소싱

원본: https://msdn.microsoft.com/en-us/magazine/mt707524

개념만 보면, 이력을 기록하는 CRUD는 기존 CRUD에서 하나의 파라미터가 추가된 것입니다. 바로 시간입니다. 이력을 기록하는 CRUD는 데이터베이스 레코드의 추가, 갱신, 삭제를 수행한 특정 시점과 상태를 알 수 있습니다. 이를 통해 여러분의 응용 프로그램은 보다 나은 분석과 리포팅 기능으로 비즈니스 인텔리전스를 이룰 수 있습니다.

지난번 컬럼(원문: msdn.com/magazine/mt703431, 번역: youngjaekim.wordpress.com)에서는 이력을 기록하는 CRUD에 대한 이론적 기반을 설명했습니다. 이번 글에서는 구체적인 예시를 보여주고자 합니다.

예시 시나리오

이 문서에서는 간단한 회의실 예약 시스템을 예시로 들겠습니다. 이 회의실 예약 시스템은 사내에 직원들이 이용할 수 있다고 가정합시다. 이 소프트웨어는 단순한 CRUD 기반으로 구현되어 있으며 회의실 예약을 할 때 새 레코드를 생성합니다. 사용자가 해당 예약을 변경하거나 미팅을 취소했을 때는 동일한 레코드가 갱신됩니다.

일반적인 CRUD 기반으로 예약 시스템을 만들면 시스템의 마지막 상태는 알고 있지만 삭제되거나 갱신된 정보는 잃게 됩니다. 이게 정말 문제일까요? 뭐, 경우에 따라 다르겠지요. 실제 비즈니스 환경에서는 별 문제가 되지 않기도 합니다. 하지만 사용하는 직원들의 전반적인 능률 면에서는 이력을 기록하는 CRUD를 적용하면 지나치게 많은 미팅 취소와 변경은 비효율적인 행동이라고 판단하고 사내 프로세스를 개선할 수도 있습니다.

그림 1은 빈 회의실 예약 시스템의 UI 예시입니다. 데이터베이스로는 SQL을 사용했습니다. 데이터베이스 테이블은 Rooms와 Bookings가 연결된 형태입니다. The Front-End UI for a Booking System
그림 1 예약 시스템의 프론트엔드 UI

예시로 든 응용 프로그램은 ASP.NET MVC로 만들었습니다. 사용자가 “Place request (장소 예약)” 버튼을 클릭하면, 콘트롤러 메소드가 실행되고 관련 정보를 전송합니다. 아래 코드는 요청을 받는 서버 코드를 간소화한 것입니다:

[HttpPost]
public ActionResult Add(RoomRequest room)
{
  service.AddBooking(room); 
  return RedirectToAction("index", "home");
}

이 메소드는 BookingController 클래스에 있는 것이며, 인젝션된 워커 서비스 클래스를 실행합니다. 워커 서비스는 여러 작업의 묶음으로 이해하셔도 좋습니다. 이 메소드 구현에서 주목할 점은, 예약을 생성한 후에 그림 1에서 본 첫페이지로 리디력션하는 것입니다. 예약 추가 작업을 수행한 후에 별도로 뷰를 생성하지 않습니다. 이것은 CQRS(Command Query Responsibility Segregation) 구조를 택했기에 나온 영향입니다. 예약 추가 명령이 백엔드에 전송되면, 시스템에 상태를 변경하고 끝입니다. 예시 프로그램이 AJAX를 사용하여 전송하기 때문에 새로고침할 필요도 없습니다. 명령 그 자체는 별도의 작업이 아니기 때문에 어떤 명시적인 링크도 UI에 나오지 않습니다.

기존 CRUD와 이력을 기록하는 CRUD의 가장 중요한 차이점은, 이력을 기록하는 CRUD는 시스템의 시작부터 상태를 변경하는 모든 작업을 기록으로 가지고 있다는 것입니다. 이력을 기록하는 CRUD를 만들기 위해서는 우선 비즈니스 작업은 모두 명령 단위로 만들어야 한다는 것을 명심하세요. 그렇게 해야 각 명령마다 추적 가능한 매커니즘을 만들 수 있습니다. 시스템에 전달되는 각 명령은 상태를 바꾸고 이력을 기록하는 CRUD는 그 때마다 시스템의 상태를 저장합니다. 변경된 상태는 무조건 이벤트로 저장합니다. 이벤트란 단지 어떤 일이 일어났다는 불변의 정보입니다. 이렇게 쌓인 이벤트로 목록이 만들어지면, 이를 이용해서 여러 형태의 데이터 투사체(projection)를 만들 수 있습니다. 가장 흔한 투사체라면, 단순히 엔티티의 현재 상태를 보여주는게 있겠습니다. 보통 응용 프로그램에서 이벤트는 사용자가 직접 내린 명령이거나, 다른 명령이나 외부 입력이 만들어낸 간접적인 명령입니다. 이 글의 예시 시나리오에서는 사용자가 예약 요청 버튼을 클릭하는 행위라고 할 수 있습니다.

명령을 처리하기

AddBooking 메소드는 아래와 같이 구현할 수 있을 것입니다:

public void AddBooking(RoomRequest request)
{
  var command = new RequestBookingCommand(request);
  var saga = new BookingSaga();
  var response = saga.AddBooking(command);
  // Do something based on the outcome of the command
}

RoomRequest 클래스는 전송된 데이터가 ASP.NET MVC에 의해 바인딩 된 단순한 DTO (Data-Transfer Object; 데이터 전송 오브젝트) 입니다. 그에 비해 RequestBookingCommand 클래스는 명령을 실행하는데 필요한 파라미터입니다. 이런 단순한 시나리오에서는 두 클래스는 거의 동일합니다. 이제 명령을 어떻게 처리할까요? 그림 2는 명령을 실행하는 3단계를 보여줍니다.

The Chain of Core Steps to Process a Command

그림 2 명령을 처리하는 연쇄적인 단계

핸들러는 명령을 받고 수행하는 콤포넌트입니다. 아래의 코드와 같이, 핸들러는 워커 서비스의 코드에서 호출되어 인메모리에서 직접 실행될 수 있으며, 버스를 통해서 할 수도 있습니다.

public void AddBooking(RoomRequest request)
{
  var command = new RequestBookingCommand(request);
  // Place the command on the bus for
  // registered components to pick it up
  BookingApplication.Bus.Send(command);
}

버스를 사용하면 몇가지 장점이 있습니다. 하나는, 동일한 명령에 대해 여러 개의 핸들러가 관여할 때 보다 쉽게 제어할 수 있습니다. 또 하나는, 버스로 안정적인 메시징 도구를 사용하면 메시지 전송을 신뢰할 수 있고 접속 문제도 극복할 수 있습니다. 마지막으로, 버스는 그 자체로 명령을 로깅하는 콤포넌트가 될 수 있습니다. (역자주: 버스 구현에 대하여, 온프레미스는 RabbitMQ, 클라우드 기반은 Azure Service Bus를 고려할 수 있습니다)

핸들러는 보통 일회성 콤포넌트로 하나의 요청에 한 번 시작하고 종료합니다. 하지만, 몇시간에서 몇 일간 실행하는 아주 긴 워크플로우일 수도 있고 사람이 직접 승인해줄 때까지 기다리는 형태일 수도 있습니다. 단순히 일회성 콤포넌트가 아닌 경우는 saga(긴 이야기)라고 불리기도 합니다.

통상적으로 버스나 큐를 사용하는건 확장성이나 신뢰성을 도모하고자 할 때입니다. 단지 기존의 CRUD 대신 이력을 기록하는 CRUD를 구현하기 위해 버스를 사용할 필요는 없습니다. 버스의 사용 여부와는 상관 없이, 어쨌거나 명령은 일회성 핸들러나 긴 작업 핸들러에 도달할테고 어떤 형태의 작업을 수행할 것이고, 이런 대부분의 작업은 데이터베이스의 주요 작업의 집합일 것입니다.

명령 로깅하기

전통적인 CRUD에서 데이터베이스에 정보를 기록하는 것은 입력 값을 포장한 후에 새 레코드로 추가하는 작업을 의미했습니다. 이력을 기록하는 CRUD의 관점에서 새 레코드는 새 이벤트의 생성을 의미합니다. 즉, 우리 예시에서는 새 예약 이벤트입니다. 예약 이벤트는 독립적이면서도 불변의 정보 조각으로 이벤트의 고유 ID, 타임스탬프, 이벤트 명, 이벤트 관련 변수를 포함합니다. 여기서 새 예약 이벤트 관련 변수는 전통적인 CRUD의 Bookings 테이블에 새 예약 레코드를 추가할 때 사용하는 모든 컬럼의 값입니다. 갱신 이벤트에 대한 변수는 갱신하는 필드만 해당됩니다. 그러므로, 모든 갱신 이벤트에 같은 필드가 있지는 않을 것입니다. 끝으로, 삭제 이벤트는 예약 ID 값만 있어도 충분합니다.

이력을 기록하는 CRUD는 두 단계로 동작합니다.

이벤트와 그 관련 정보를 로깅
현재 시스템 상태가 빠르게 쿼리할 수 있는지 확인

이 방법이면 시스템의 현재 상태는 언제나 최신 정보이며, 이로 인한 다음 작업도 확신을 가지고 할 수 있습니다. 참고로 기존의 전통적인 CRUD에서는 ‘시스템의 현재 상태’만 있었고 ‘시스템의 과거 상태’ 는 없었습니다. 기존 CRUD 시스템을 이력을 기록하는 CRUD로 발전시킬 때, 이벤트 로깅 단계와 시스템 상태 업데이트를 일관되게 처리하려면 하나의 트랜젝션으로 묶어야 하며, 그 결과는 그림 3과 같습니다.

using (var tx = new TransactionScope())
{
  // Create the "regular" booking in the Bookings table   
  var booking = _bookingRepository.AddBooking(
    command.RoomId, ...);
  if (booking == null)
  {
    tx.Dispose();   
    return CommandResponse.Fail;
  }
  // Track that a booking was created
  var eventToLog = command.ToEvent(booking.Id);
    eventRepository.Store(eventToLog);
  tx.Complete();
  return CommandResponse.Ok;
}

그림 3 이벤트 로깅과 시스템 업데이트

매번 예약 기록을 추가/수정/삭제할 때마다 현재 상태를 정확한 순서대로 알면서 예약 목록을 최신으로 유지할 수 있습니다. 그림 4는 예시 시나리오에 사용된 두 SQL 서버 테이블이며, 추가와 업데이트 과정을 겪은 후의 모습입니다.

Bookings and LoggedEvents Tables Side by Side
그림 4 Bookings와 LoggedEvents 테이블 비교

Bookings 테이블은 개별 예약 목록을 가지고 있으며, 각각은 현재 상태를 가지고 있습니다. LoggedEvents 테이블에는 모든 예약에서 발생한 모든 이벤트가 시간 순서대로 기록되어 있습니다. 예를 들어, 예약 #54는 예약을 만든 다음 몇 일 후에 수정했음을 알 수 있습니다. 그림의 예시에서, Cargo 열은 실행한 명령의 JSON 문자열을 그대로 직렬화해서 저장하고 있습니다.

UI로 로깅된 이벤트 보기

인증된 사용자가 예약에 대한 상세 정보를 보고 싶다고 가정해봅시다. 아마도 사용자는 달력에서 예약 정보를 불러오거나 기간 설정을 하여 쿼리할 것입니다. 두 경우 모두 기본적으로는 사용자가 언제/얼마나/누가 예약을 했는지는 알고 있으므로, 이런 상세 정보는 별로 안쓰일 것입니다. 그 대신 그림 5와 같이 예약에 대한 전체 히스토리를 보여준다면 꽤 도움이 될 것입니다.

Consuming Logged Events in the UI
그림 5 UI로 로깅된 이벤트 보기

로깅된 이벤트를 쭉 불러오면 한 엔티티(Booking 54)에 대한 상태의 목록을 표시하는 뷰 모델을 만들 수 있습니다. 예시에서, 사용자가 예약 상세 정보를 보려고 클릭하면 JSON이 백그라운드에서 다운로드되고 모달(modal) 팝업이 열립니다. 이 때 JSON을 주는 메소드는 아래와 같습니다.

public JsonResult BookingHistory(int id)
{
  var history = _service.History(id);
  var dto = history.ToJavaScriptSlotHistory();
  return Json(dto, JsonRequestBehavior.AllowGet);
}

서비스 내에 History 메소드를 실행하는 것이 전부입니다. 이 동작은 특정 예약 ID에 대한 이벤트를 쿼리해서 모두 가져옵니다.

var events = new EventRepository().All(aggregateId);
foreach (var e in events)
{
  var slot = new SlotInfo();
  switch (e.Action)
  {
    :
  }
  history.Changelist.Add(slot);
}

로깅된 이벤트를 하나씩 넘기면서, 적절한 오브젝트를 DTO에 덧붙여서 반환합니다. 그림 5에서 보이는 ToJavaScriptSlotHistory(팝업창)에는 두 상태의 차이점을 신속하게 보여주기 위한 변환 작업이 있습니다.

주목할 점은, 이벤트를 CRUD만 이용해서 로깅해도 UI가 더 나아질 수 있다는 것입니다. 여러분은 이제 시스템에서 일어나는 모든 상황을 알 수 있으며 언제든 원하는 형태, 원하는 시점으로 데이터를 투사해서 볼 수 있습니다. 예를 들어, 갱신과 삭제 작업에 대한 통계를 만들어서 애널리스트에게 회사의 회의실 예약이 얼마나 비효율적인지를 파악하게 할 수 있습니다. 또는, 특정 날짜의 예약 정보를 쿼리하고 연관된 이벤트를 산출할 수도 있습니다. 한 마디로, 이력을 기록하는 CRUD는 응용 프로그램에 완전히 새로운 가능성을 열어줍니다.

정리

이력을 기록하는 CRUD는 기존의 단순한 CRUD 응용 프로그램을 보다 똑똑하게 발전시키는 방법입니다. 이 글에서는 최근에 유행하는 CQRS, 이벤트소싱, 버스와 큐, 메시지 기반 비즈니스 로직 등 몇 가지 단어와 패턴도 언급했습니다. 이 글이 도움이 됐다면, 저의 이전 글인 2015년 7월의 글(msdn.com/magazine/mt238399)과 2015년 8월 글(msdn.com/magazine/mt185569)도 한 번 읽어보세요. 이번 예시에 이어서 더 많은 영감을 줄 것입니다!

Dino Esposito “Microsoft .NET: Architecting Applications for the Enterprise” (Microsoft Press, 2014), “Modern Web Applications with ASP.NET” (Microsoft Press, 2016)의 저자입니다. JetBrains에서 .NET과 안드로이드 분야의 기술 에반젤리스트이며, 세계 곳곳의 여러 행사에서 연사로 활동하고 있습니다. Esposito의 소프트웨어에 대한 비전은 다음 링크에서 볼 수 있습니다. software2cents.wordpress.com, 트위터: @despos.

이 문서의 리뷰를 한 Microsoft 기술 전문가 Jon Arne Saeteras에게 감사드립니다.

이 문서를 번역한 김영재 교육서비스 바로풀기의 개발사 Bapul의 CTO로서 기술로 교육에 새로운 시각을 주기 위해 열심히 개발하고 있습니다.

MSDN Magazine 포럼에서 이 문서에 대한 토론 보기 (영문)

[번역] 최신 기술 – 이력을 기록하는 CRUD 구현하기 1부

2016년 7월 9일2016년 7월 19일 youngjaekim 본격 강좌, 기술 이야기 CQRS, 데이터베이스, 번역, 이벤트소싱

원문: https://msdn.microsoft.com/ko-kr/magazine/mt703431
참고: 2부도 있습니다 [번역] 최신 기술 – 이력을 기록하는 CRUD 구현하기 2부

*역자주: 원문은 Historical CRUD이며, 몇몇 개발자 분들과의 논의 끝에 ‘이력을 기록하는 CRUD’로 번역했습니다. [대화 보기]

관계형 데이터베이스가 1970년대에 나온 후, 여러 세대의 개발자들이 커리어를 시작하고 끝냈지만 데이터 저장에 대한 대안은 딱히 학습하거나 고려할 필요가 없었습니다. 하지만 최근에 등장한 대규모 소셜네트워크는 관계형 데이터베이스가 모든 비즈니스 시나리오에 적합하지는 않다는 근거를 마련해줬습니다. 스키마가 정형적이지 않은 초대형 데이터를 다루는 경우 데이터베이스는 데이터 흐름을 만드는 파이프의 역할이 아닌 병목이 되었던 것입니다.

어떻게 해야 수백만 개의 관계형 데이터베이스 레코드에서 어느 포스트의 코멘트에 대해 ‘좋아요’를 누른 친구들의 수를 순식간에 카운트할 수 있을까요? 포스트 하나에 대한 스키마를 어떻게 확정하고 정의하는가부터 고민거리가 됩니다. 소셜 네트워크는 비즈니스의 생존 여부만 따지던 것과는 다른 관점을 가지고 성장했고 데이터 저장에 대해서도 관계형 데이터베이스와 비(非)관계형 데이터를 섞어서 사용하는데 관심을 가지기 시작했습니다. 그 결과 데이터에 대해서도 폴리글랏의 개념이 탄생했습니다.

소셜네트워크의 소프트웨어 구조를 통해 배운 것이 있다면, 데이터를 온전한 상태로 저장하는 것이 비즈니스 관점에서 꼭 이상적인 것만은 아니라는 점입니다. 입력받은 데이터를 단순히 저장하지 않고, 그 대신 세부 이벤트와 그 이벤트에 관여하는 데이터를 저장하는 편이 더 나은 방법이기도 합니다.

이 글에서는, 이벤트소싱과 그것을 이용한 비즈니스에 대한 기초를 다룰 것입니다. 이벤트 로그를 데이터의 주체로 보는 것입니다. 그 다음, 기존의 CRUD 기술을 이벤트로 재구성하는 것을 논하겠습니다. 여기서는 왜 이벤트 소싱이 필요한지에 대해서는 논하지 않겠습니다. 단지 언제 이벤트 소싱이 필요하고 어떻게 코드로 표현하는지에 대해서 말하겠습니다.

동적 데이터 모델로 전환

폴리글랏 데이터는 요즘 뜨거운 주제입니다. 관계형 데이터베이스는 구조적인 데이터에, NoSQL은 덜 구조적인 데이터에, 키-값 쌍의 딕셔너리는 취향(preference) 정보와 로그에, 그래프 데이터베이스는 상호관계성 표현 등을 저장하는 식입니다. 여러가지 저장 모델을 서로 비교하는 것이 글의 서두에는 맞다고 생각합니다만, 실제 상황에서 일어나는 문제점에 대해 이야기하는 것이 더 나을 것 같습니다.

관계형 모델은 수십 년간 데이터의 읽기/쓰기에 대해 균형감있는 장점을 가지고 있었습니다. 관계형 모델은 질의와 정보 갱신이 쉽고 극한의 상황에서도 괜찮게 동작했습니다. 전체적인 성능은 수백만 개의 레코드에 수백 개의 열이 있어도 납득할 정도로만 떨어졌습니다. 하지만, 데이터의 스키마는 고정적이고 즉석에서 빠르게 질의하기 전에 데이터베이스 구조부터 명확히 알아야 했습니다. 다시 말해, 오늘날 여러분이 작성하는 코드는 ‘모델’로 모든 것을 해석하다가 초대형 관계형 모델이 되기도 하고, 나중에는 표현에 제약을 가지거나 여러분의 프로그래밍 능력에도 한계를 만들 수도 있습니다. 최종적으로 모델은 그저 모델일 뿐이고 실제 세상에서 볼 수 있는 그 무엇도 아니게 됩니다. 사실 실제 세상에는 모델이라는게 없습니다. 대신, 이해하기 쉽고 어떤 반복된 형태로 만들려는 것을 모델을 사용해서 캡슐화할 뿐입니다. 이렇게 되면, 여러분이 실제 세상에서 관찰한 이벤트가 있어도 이벤트 관련 정보를 또다시 제약이 있는 관계형 모델에 담으려고 할 것입니다. 이벤트를 관계형 모델에 담는 것이 힘들다는 것을 알았다면, 이제 스키마와 인덱스의 제약에서 좀 더 자유로운 저장 모델을 대안으로 알아볼 때입니다.

이벤트 기반 저장 모델

십여 년간, 엔티티의 현재 상태만 저장하는 것만으로도 충분했습니다. 어떤 상태를 받아서 저장하면, 단지 기존 상태에 덮어쓰고 예전 정보는 잃어버립니다. 그래도 어떤 칭찬이든 불평이든 없었습니다. 수 년간 이런 저장 모델은 효율적인 방법이고 많은 호응을 얻었습니다. 오직 과거의 상태를 잃으면 안되는 특정 비즈니스 분야에서만 과거 상태에 대해 고려했습니다. 사실은 대부분의 비즈니스는 계속 이렇게 해왔습니다. 하지만 요즘 추세는 비즈니스의 모든 히스토리를 추적하고 싶어합니다. 이제 CRUD라고 불리운 것- 단지 생성하고 (Create), 읽고 (Read), 갱신하고 (Update), 삭제하는 (Delete) 작업-과 관계형 테이블 기반으로 모델링 하는 것은 ‘이력을 기록하는 CRUD’로 진화하고 있습니다. 이력을 기록하는 CRUD란, CRUD 코드 기반에 모든 목록의 변화를 추적할 수 있는 구현체입니다.

실제 상황에서 사용 중인 비즈니스 기간업무 시스템(일명 LoB; Line-of-Business)은 각자의 도메인에 맞는 방식으로 이벤트를 추적하고 있습니다. 수십 년간 이런 류의 클래스와 어플리케이션은 있었습니다. 어떤 것은 COBOL이나 Visual Basic 6로 작성되어 있을 정도로 오래된 것입니다. 당연하겠지만, 회계관련 응용 프로그램은 송장에서 일어나는 모든 변화를 추적합니다. 주소나 날짜의 변경, 신용장 발행 등등 말이죠. 어떤 비즈니스 상황에서는 이벤트 추적을 감사(auditing) 기능의 하나로 취급하여 개발 시작단계부터 요구사항에 넣기도 합니다. 그러므로, 소프트웨어에서 비즈니스 이벤트에 대한 감사 기능은 그리 새로운 개념은 아닙니다. 수 십년간 개발자들은 같은 문제를 해결하기 위해 반복에 반복을 거듭했습니다. 알려진 기술을 다시 작업하고 쪼개다가 최선의 방법을 발견하곤 했습니다. 그 결과, 지난 날의 비즈니스 이벤트 감사 기능은 오늘날 이벤트 소싱(Event Sourcing)이라는 이름으로 새롭게 주목받게 되었습니다.

비즈니스 이벤트 코딩하기

예를 들어 봅시다. 단순한 미팅룸 예약 프로그램을 만든다고 생각해보겠습니다. 사용자가 예약 상황을 확인할 때, 현재 상태 뿐만 아니라 예약한 후부터 업데이트된 목록 전체를 봐야할 때도 있습니다. 그림 1은 이에 대해 시간 축으로 보여주는 뷰입니다.

A Timeline-Based View for the Entire History of a Booking

그림 1 시간축으로 보는 예약과정의 전체 히스토리

어떻게 해야 예약 데이터 모델을 단순한 상태 기반의 CRUD 대신 히스토리 CRUD로 디자인할 수 있을까요? 테이블에 몇 개의 열을 추가하는 것으로는 부족합니다. CRUD와 히스토리 CRUD의 중요한 차이점은, 후자의 경우 같은 엔티티에 대해 여러 개의 복제본이 저장될 수도 있다는 것입니다. 각각은 해당 시간에 대한 비즈니스 이벤트입니다. 그림 2는 이에 대해 관계형 데이터베이스에서 구현할 수 있는 새로운 예약 테이블 구조입니다.

A Possible Relational Data Model for a Historical CRUD Application

그림 2 관계형 데이터 모델을 이용한 히스토리 CRUD 응용 프로그램 예시

그림 2는 비즈니스 엔티티에 대한 상태 정보와 몇 가지 추가 정보를 가진 컬럼의 집합을 보여주는 예시입니다. 최소한 여기에는 각 행을 식별할 수 있는 고유키가 있을 것입니다. 그 다음 타임스탬프 열이 있어서 데이터베이스의 처리 시간 또는 비즈니스 요청이 일어난 시간을 기록할 것입니다. 일반적으로 타임스탬프 열은 엔티티 상태가 온전히 보존되어있는 시각을 의미합니다. 끝으로, 이벤트의 상세 정보를 기록한 열이 있을 것입니다.

이것은 관계형 테이블일 뿐이고 여전히 응용 프로그램이 요구하는 예약 목록을 관리하고 있습니다. 새로운 기술을 사용하지도 않았습니다. 하지만, 개념적으로 그림 2의 테이블 스키마는 전통적인 CRUD 구현에 비해 비약적으로 새로워졌습니다. 새 테이블에 데이터를 추가하는 것은 간단합니다. 시스템에서 일어나는 변경내역을 추적할 수 있도록 관련 정보를 채우고 데이터베이스에 추가만 하면 됩니다. CRUD에 C(Create)는 이렇게 처리했다면, 다른 작업은 어떨까요?

이력을 기록하는 CRUD에서의 수정과 삭제

전통적인 관계형 테이블을 이력을 기록하는 이벤트 기반 테이블로 바꾸면, 기존의 갱신과 삭제 작업은 그 역할과 관계에 있어서 매우 크게 달라집니다. 우선, 갱신은 없습니다. 엔티티의 논리적인 상태를 바꾸는 어떤 갱신 작업이든 새 레코드를 추가하는 형태로 구현합니다.

삭제 작업은 모호하게 보일 수 있습니다만, 결국에는 ‘비즈니스 도메인과 상황따라 다릅니다’라고 말하고 싶습니다. 이상적인 이벤트 기반 시스템이라면 삭제 작업이란게 없습니다. 데이터를 추가만 하기 때문에 ‘해당 엔티티가 (논리적으로는) 존재하지 않는다’는 이벤트를 추가하는 것으로 삭제를 구현합니다. 하지만, 물리적으로 데이터를 삭제하는 것은 금지하고 있다해도 여전히 그런 경우가 있을 수 있습니다. 이럴 때, 이벤트 기반 시나리오에서의 엔티티는 그림 2와 같이 하나의 엔티티에 대해서 하나의 레코드가 아닌 여러 개의 레코드가 만들어진다는 것을 알아야 합니다. 그러므로, 엔티티를 삭제하려면 해당 엔티티와 연관된 모든 이벤트와 레코드를 삭제해야 할 것입니다.

엔티티의 상태 읽기

여러분의 응용 프로그램에서 비즈니스 이벤트를 로깅해서 얻는 가장 큰 장점은 그 어떤 데이터도 잃지 않는다는 것입니다. 언제라도 시스템의 상태를 추적할 수 있고 현재 상태까지 어떻게 변화했는지 정확한 흐름을 파악할 수 있습니다. 또한 이벤트의 특정 부분이나 모든 것을 과거로 되돌릴 수 있습니다. 이는 그 자체만으로도 비즈니스 인텔리전스를 확보하는 것이며 비즈니스 분석에서 다양한 시나리오의 가설을 세우는데 활용할 수도 있습니다. 정확히 말하면, 이런 기능이 아무 수고없이 나오는 것은 아닙니다. 일단은 현재 응용 프로그램에서 이런 기능을 구현할 수 있는 모든 데이터를 확보하는데에 의미가 있는 것입니다.

이력을 기록하는 CRUD에서 가장 힘든 부분이 데이터를 읽는 것입니다. 이제 여러분은 예시로 든 예약 시스템에서 예약과 관련된 모든 비즈니스 이벤트를 추적할 수 있다고 합시다. 하지만 현재 예약된 전체 목록을 가져오기 위한 쉽고 빠른 방법은 없습니다. 예를 들어, 다음 주 예약은 얼마나 많은지 구하는 것도 쉽지 않습니다. 이 때 투사(projection)라는 개념이 등장합니다. 그림 3은 기존의 CRUD에서 이력을 기록하는 CRUD로 발전했을 때의 전체 시스템 아키텍처를 요약한 것입니다.

Architecture of an Historical CRUD System

그림 3 이력을 기록하는 CRUD 시스템 아키텍처

이벤트 기반 시스템에서는 필연적으로 명령과 쿼리 스택을 깔끔하게 구분해서 구현해야 합니다. 표시 계층(presentation layer)에서는 사용자가 작업을 트리거합니다. 트리거된 작업은 관련된 모든 비즈니스 로직 콤포넌트를 이용하여 응용 프로그램 레이어부터 도메인 레이어까지 처리합니다. 명령(command)은 현재 상태를 바꾸는 비즈니스 작업을 트리거하는 것으로, 이 때는 반드시 현재의 상태가 논리적으로 변경된 다른 어떤 상태로 적용되어야 합니다. 앞서 언급했듯이, 이벤트 기반 시스템에서는 단순한 CRUD로 구현된 시스템일지라도 상태의 변경은 (예약의 생성이든 갱신이든) 새 레코드를 추가하는 것입니다. 그림 3의 “Event Repository”는 이벤트를 보존하는 작업과 관련된 코드가 있는 계층을 의미합니다. 구체적인 기술로 말하자면, 이벤트 리포지토리는 엔티티프레임워크 기반의 리포지토리 클래스거나 도큐먼트 데이터베이스 (Azure DocumentDB, RavenDB, MongoDB) 상위 래퍼(wrapper)가 될 수 있습니다. 더 나아가 EventStore 또는 NEventStore와 같은 이벤트 저장 API의 래퍼도 가능합니다.

이벤트 기반 구조에서는 엔티티의 현재 상태를 가져올 때 알고리즘을 이용하여 계산합니다. 이 과정에서는 이벤트 리플레이라는 작업을 통해 관련된 모든 이벤트를 질의하고 새로운 엔티티 클래스의 인스턴스를 만들어서 취합한 모든 정보를 적용합니다. 이렇게 만들어진 엔티티 인스턴스는 모든 이벤트를 훑은 셈이므로 가장 최신의 정보가 들어있습니다.

좀 더 일반적으로는, 이벤트 로그를 처리할 때 데이터의 투사체를 만드는데, 다량의 저 수준 데이터에서 동적 데이터 모델로 만드는 것입니다 (*역자주: data projection이라고 하며, 프로젝터가 쏘는 빛에 공간의 먼지가 떠다니면 스크린에는 2차원의 점으로 보이게 되고 이를 스케치북에 옮겨 그리는 것과 유사합니다). 이것이 그림 3에 있는 읽기 모델(Read Model) 입니다. 동일한 이벤트 로그를 앞단의 요구사항에 따라 다양한 데이터 모델로 제공할 수도 있습니다. SQL 개념으로 설명한다면, 데이터의 투사체를 만드는 것은 관계형 테이블에서 뷰를 만드는 것과 같습니다.

엔티티의 현재 상태를 알기 위해 이벤트를 질의하고 다시 재생하는 것은 해볼만한 일이지만 매우 비효율적입니다. 시간에 따라 이벤트는 계속 증가하기 때문입니다. 매번마다 수 천개의 레코드를 거치면서 은행잔고를 확인해야 하거나 예약 상황을 확인하기 위해 백여개의 이벤트를 모두 거쳐야 할 것입니다. 통상적으로 이런 문제를 해결할 때는 읽기 모델에서 전통적인 관계형 테이블에 로깅된 이벤트를 동기화하는 프로그램을 별도로 만들어서 처리합니다.

마무리

아직도 대부분의 응용 프로그램은 극도로 정돈된 형태의 CRUD 앱입니다. Facebook이라고 할지라도 평균보다 큰 규모일 뿐 CRUD의 한 형태로 표현하고 있을 뿐입니다. 대부분의 사용자는 마지막의 상태만 알면 충분하다고 생각하지만, 그것만으로는 불충분하다고 생각하는 사람들도 점차 늘어나고 있습니다. 다음에는 그런 사람들이 여러분의 고객이 될 것입니다. 이 문서는 이력을 기록하는 CRUD에 대한 기본적인 내용만 다루었습니다. 다음 달에는 구체적인 예시로 다시 찾아뵙겠습니다.

이 문서의 리뷰를 한 Microsoft 기술 전문가 Jon Arne Saeteras에게 감사드립니다.

이 문서를 번역한 김영재 교육서비스 바로풀기의 개발사 Bapul의 CTO로서 기술로 교육에 새로운 시각을 주기 위해 열심히 개발하고 있습니다.

MSDN Magazine 포럼에서 이 문서에 대한 토론 보기 (영문)