기본 콘텐츠로 건너뛰기

[웹, http] 실시간 웹, real time web

source: http://thinkr.egloos.com/2488915

리얼타임 웹이란 무엇일까요? 웹의 기본 프로토콜인 HTTP 프로토콜을 기반으로 하여 그 위에 실시간성의 어떤 것들을 가미한 것이 리얼타임 웹이겠죠?

흔히 사용되는 기법 중 하나는 주기적으로 폴링(polling)을 하는 것입니다. 매 시간, 예를 들면 1분 간격으로 서버에 요청을보내고 다시 응답을 받고 하는 과정을 반복하면서 새로운 이벤트가 감지되면 응답에 실어 클라이언트 브라우저로 보내는 방법입니다.주로 Ajax 호출을 사용하기 때문에 흔히 Ajax Polling이라고도 부릅니다. 

이 방법이 간단하긴 하지만 몇 가지 문제가 있습니다. 폴링 주기를 어떻게 주느냐에 따라 실시간성이 조금 떨어질 수 있고 또 폴링 주기를 짧게 가져갈수록 서버의 처리 부담이 커지는 문제가 대표적입니다.

그래서 나온 생각들이 웹 상에서 푸시(PUSH)를 구현하자는 것이고, 이렇게 웹 서버가 클라이언트 브라우저로 푸시하는 기법들을 총칭하여 'Comet'이라고 부릅니다.

Comet은 그 구현방법이 아주 다양합니다만, 크게 보면 스트리밍(Streaming) 방식과 롱폴링(Long Polling) 방식으로흔히 구별할 수 있습니다. 그 중 스트리밍 방식은 하나의 웹 요청에 대해 웹 접속(connection)을 계속 열어두고서, 새로무언가 이벤트가 발생하면 그 때 마다 부분적인 응답을 브라우저로 보내는 방식입니다.

다른 한 가지는 롱폴링(Long Polling)인데, 이 방식은 앞서 설명한 주기적 폴링과 비슷하지만, 서버 측에서 접속을열어두는 시간이 길다는 차이점이 있습니다. 왼쪽 그림에서 보면 노란색 선으로 표시된 부분이 서버의 접속 시간입니다. 앞서보여드린 주기적 폴링과 비교하면 확실히 접속 시간이 깁니다. 롱폴링에서는 이벤트가 발생하면 바로 응답이 이루어지기 때문에실시간성이 아주 높으며, 스트리밍 방식과 달리 웹 브라우저 환경에 관계없이 사용할 수 있기 때문에 흔히 사용되는 방식입니다.

Comet을 처리하는 서버는 Apache나 Tomcat 같은 통상적인 HTTP 서버 보다는 이벤트 기반 I/O를 사용하는 서버들이 성능상 유리합니다.

Comet이 총체적 개념이다 보니 다양한 구현체들이 존재할 수 밖에 없으며, 아직 어느 것이 어느 것보다 우수하다 아니다고 말하기에는조금 이른 상태입니다. 여기 소개한 구현기술들은 그 중 일부에 불과하며 보다 상세한 목록과 내용은 참고자료를 참고하면 됩니다

한 가지 유의할 점은 Comet의 구현은 서버측과 클라이언트측에서 동시에 이루어져야 하며, 어느 한 측만으로는 작동하지 않는다는 점입니다.

이 그림은 실제로 웹 애플리케이션 프레임워크와 함께 Comet을 통합할 경우 구성할 수 있는 시스템 아키텍처 중 하나입니다. 여기서는 파이썬의 Twisted 기반 Comet 구현체인 Orbited를 사용하고 있으며, 메시징 프로코톨로는 표준 프로토콜인 STOMP를 사용하여 MQ로 메시지를 처리합니다. 

Comet과는 관계가 없지만, 흔히 리얼타임 처리에 사용되는 기법 중에 WebHook이라는 것이 있습니다. 이 방식은 몇 년 전PayPal에서 사용한 이후로 많은 웹 서비스들에서 사용하는 방식인데, 웹 요청이 서버로 들어오면 서버에서는 미리 지정해 둔별개의 URL(일종의 Callback입니다)로 POST 요청을 보냄으로써 실시간 통합을 처리할 수가 있습니다.

구글의 오픈소스 프로젝트 중 하나인 PubsubHubbub역시 이 기법에 기반하고 있으니, 관심있는 분들은 참고 바랍니다.

다음으로 소개할 기술은 XMPP입니다. XMPP는 HTTP 프로토콜과 동일한 수준의 프로토콜이며, HTTP와는 달리 XML 기반의연결지향 프로토콜입니다. XMPP는 Message, Presense, Iq라고 하는 세 가지 stanza로 주고 받는 모든메시지를 표시할 수 있는 확장성이 아주 높은 프로토콜입니다.

XMPP는 그 자체로도 방대한 내용을 가지고 있기 때문에 자세한 설명은 생략합니다.

XMPP는 원래 Jabber라는 이름으로 2001년에 처음 선보인 프로토콜이지만 더 유명해 진 것은 구글이 Google Talk에서자체적으로 구현한 XMPP를 웹에 적용하면서 부터입니다. 이후 Facebook의 채팅서비스, 최근의 구글 Wave 등에서도XMPP가 큰 몫을 차지하고 있습니다.

XMPP자체는 웹을 기반으로 하는 프로토콜이 아니기 때문에 웹과 연계하기 위해서는 별도의 기법들이 필요합니다. XMPP의 확장(XEP)중 BOSH라고 하는 표준 명세(spec)가 있는데, 이 명세에서 XMPP와 HTTP 간의 연계 방식을 규정해 두고 있습니다.

자세한 내용을 모두 설명드릴 순 없지만, 클라이언트와 XMPP 서버 간에 접속 관리자(CM)라는 일종의 프록시를 두어 패킷스위칭을 처리합니다. 서버에서 클라이언트 측으로 PUSH를 하기 때문에 BOSH 역시 일종의 Comet입니다.

리얼타임 웹의 구현 방법은 다양하며, 루비온레일스 기반 애플리케이션에서라면 Juggernaut 이라고 하는 플러그인을 사용하기도 합니다.

이 플러그인은 클라이언트측에서 플래시 socket 객체와 자바스크립트 코드를 사용하여 일종의 Comet을 구현합니다. Juggernaut은 EventMachine 기반의 자체적인 서버를 가집니다.

아주 아주 오래 전 웹 초창기부터 사용해 오던 방식으로는, 자바 애플릿이 있습니다. 애플릿에서는 소켓통신으로 서버와 연동을 하여리얼타임 웹을 구현하게 됩니다. 사실 오늘날의 자바가 있게 만든 일등공신인 애플릿은 지금도 여전히 많은 곳에서 사용되고 있는기술이기도 합니다.

어떻게 이 모든 것들이 따지고 보면 HTTP 프로토콜 자체가 연결이 없는(connectionless) 프로토콜이며, 브라우저에서 소켓과 같은 것을 지원하지 않기 때문에 생겨난 발명들이라 할 수 있습니다.

앞으로 나올 HTML5에서는 WebSocket이 적용됩니다. 아직 HTML5가 적용된 브라우저가 흔치 않은 탓에 현재로서는Comet을 사용하는 것이 가장 현실적인 대안이 아닐까 생각합니다만, 언젠가는 더 간단하고 편리한 세상이 오겠죠?

* 참고: Comet is dead long live websockets

================최신 동향===============

HTML5의 웹소켓을 통해 기존 stateless http protocol의 태생적 한계를 극복했음.

댓글

댓글 쓰기

이 블로그의 인기 게시물

[인코딩] MS949부터 유니코드까지

UHC = Unified Hangul Code = 통합형 한글 코드 = ks_c_5601-1987 이는 MS사가 기존 한글 2,350자밖에 지원하지 않던 KS X 1001이라는 한국 산업 표준 문자세트를 확장해 만든 것으로, 원래 문자세트의 기존 내용은 보존한 상태로 앞뒤에 부족한 부분을 채워넣었다. (따라서 KS X 1001에 대한 하위 호환성을 가짐) 그럼, cp949는 무엇일까? cp949는 본래 코드 페이지(code page)라는 뜻이라 문자세트라 생각하기 십상이지만, 실제로는 인코딩 방식이다. 즉, MS사가 만든 "확장 완성형 한글 ( 공식명칭 ks_c_5601-1987 ) "이라는 문자세트를 인코딩하는 MS사 만의 방식인 셈이다. cp949 인코딩은 표준 인코딩이 아니라, 인터넷 상의 문자 송수신에 사용되지는 않는다. 하지만, "확장 완성형 한글" 자체가 "완성형 한글"에 대한 하위 호환성을 고려해 고안됐듯, cp949는 euc-kr에 대해 (하위) 호환성을 가진다. 즉 cp949는 euc-kr을 포괄한다. 따라서, 윈도우즈에서 작성되어 cp949로 인코딩 되어있는 한글 문서들(txt, jsp 등등)은 사실, euc-kr 인코딩 방식으로 인터넷 전송이 가능하다. 아니, euc-kr로 전송해야만 한다.(UTF-8 인코딩도 있는데 이것은 엄밀히 말해서 한국어 인코딩은 아니고 전세계의 모든 문자들을 한꺼번에 인코딩하는 것이므로 euc-kr이 한국어 문자세트를 인코딩할 수 있는 유일한 방식임은 변하지 않는 사실이다.) 물론 이를 받아보는 사람도 euc-kr로 디코딩을 해야만 문자가 깨지지 않을 것이다. KS X 1001을 인코딩하는 표준 방식은 euc-kr이며 인터넷 상에서 사용 가능하며, 또한 인터넷상에서 문자를 송수신할때만 사용.(로컬하드에 저장하는데 사용하는 인코딩방식으로는 쓰이지 않는 듯하나, *nix계열의 운영체제에서는 LANG을 euc-kr로 설정 가능하기도 한걸

[linux] 뻔하지 않은 파일 퍼미션(file permissions) 끄적임. 정말 속속들이 아니?

1. [특수w]내 명의의 디렉토리라면 제아무리 루트가 만든 파일에 rwxrwxrwx 퍼미션이라 할지라도 맘대로 지울 수 있다. 즉 내 폴더안의 파일은 뭐든 지울 수 있다. 2. [일반rx]하지만 읽기와 쓰기는 other의 권한을 따른다. 3.[일반rwx]단 남의 계정 폴더는 그 폴더의 퍼미션을 따른다. 4.[일반]만약 굳이 sudo로 내 소유로 파일을 넣어놓더라도 달라지는건 없고, 단지 그 폴더의 other퍼미션에 write권한이 있으면 파일을 만들고 삭제할 수 있다. 5.디렉토리의 r권한은 내부의 파일이름 정도만 볼 수있다. 하지만 ls 명령의 경우 소유자, 그룹, 파일크기 등의 정보를 보는 명령어므로 정상적인 실행은 불가능하고, 부분적으로 실행됨. frank@localhost:/export/frankdir$ ls rootdir/ ls: cannot access rootdir/root: 허가 거부 ls: cannot access rootdir/fa: 허가 거부 fa  root #이처럼 속한 파일(폴더)만 딸랑 보여준다. frank@localhost:/export/frankdir$ ls -al rootdir/ # al옵션이 모두 물음표 처리된다.. ls: cannot access rootdir/root: 허가 거부 ls: cannot access rootdir/..: 허가 거부 ls: cannot access rootdir/.: 허가 거부 ls: cannot access rootdir/fa: 허가 거부 합계 0 d????????? ? ? ? ?             ? . d????????? ? ? ? ?             ? .. -????????? ? ? ? ?             ? fa -????????? ? ? ? ?             ? root 하지만 웃긴건, r에는 읽기 기능이 가능하므로 그 폴더 안으로 cd가 되는 x권한이 없더라도 어떤 파일이 있는지 목록 정도는 알 수 있다. 하지만 r이라고

[hooking, 후킹, 훅킹] Hooking이란?

source: http://jinhokwon.blogspot.kr/2013/01/hooking.html Hooking 이란? [출처] http://blog.daum.net/guyya/2444691 훅킹(Hooking)이란 이미 작성되어 있는 코드의 특정 지점을 가로채서 동작 방식에 변화를 주는 일체의 기술 이다. 훅이란 낚시바늘같은 갈고리 모양을 가지는데 여기서는 코드의 중간 부분을 낚아채는 도구라는 뜻으로 사용된다. 대상 코드의 소스를 수정하지 않고 원하는 동작을 하도록 해야 하므로 기술적으로 어렵기도 하고 운영체제의 통상적인 실행 흐름을 조작해야 하므로 때로는 위험하기도 하다. 훅킹을 하는 방법에는 여러 가지가 있는데 과거 도스 시절에 흔히 사용하던 인터럽터 가로채기 기법이나 바로 앞에서 알아본 서브클래싱도 훅킹 기법의 하나라고 할 수 있다. 이외에도 미리 약속된 레지스트리 위치에 훅 DLL의 이름을 적어 주거나 BHO(Browser Helper Object)나 응용 프로그램 고유의 추가 DLL(Add in)을 등록하는 간단한 방법도 있고 PE 파일의 임포트 함수 테이블을 자신의 함수로 변경하기, CreateRemoteThread 함수로 다른 프로세스의 주소 공간에 DLL을 주입(Injection)하는 방법, 메모리의 표준 함수 주소를 덮어 쓰는 꽤 어려운 방법들도 있다. 이런 고급 훅킹 기술은 이 책의 범위를 벗어나므로 여기서는 소개만 하고 다루지는 않기로 한다. 이 절에서 알아볼 메시지 훅은 윈도우로 전달되는 메시지를 가로채는 기법으로 다양한 훅킹 방법중의 하나이다. 메시지 기반의 윈도우즈에서는 운영체제와 응용 프로그램, 또는 응용 프로그램 사이나 응용 프로그램 내부의 컨트롤끼리도 많은 메시지들을 주고 받는다. 훅(Hook)이란 메시지가 목표 윈도우로 전달되기 전에 메시지를 가로채는 특수한 프로시저이다. 오고 가는 메시지를 감시하기 위한 일종의 덫(Trap)인 셈인데 일단 응용 프로그램이 훅 프로시저를 설치하면 메시지가 윈도우로 보내지기