Tuesday, August 9, 2011

R을 배우기 시작한 지난 2~3 주를 돌아보며

먼저 툴 관련해서...

업무에 적용하려고 통계를 공부해보려다가, R을 알게 되고, R을 알게 되면서 Sweave와 noweb을 그리고 곁다리로 dot과 dot2tex, 그리고 오늘은 끝내 R-Studio까지 써보게 되었습니다. 얼마 전에 TeXLive 2011과 지난 주에 koTeX 2011이 발표되었지만, TeXLive2010과 2011이 크게 차이가 없어보여 아직 업그레이드 하지는 않았습니다.

툴을 정리해보자면:
LaTeX (TeXLive2010, koTeX2010)
R-2.13.1, R-Studio: v0.94.92
dot, dot2tex

위 정도면 공부를 하든 지, 논문을 쓰든 지, 일을 하든 지, 매뉴얼을 쓰고 번역하든 지 하고 싶은 것을 별 불편없이 할 수 있는 개발 환경이 된 것 같습니다.

=======================================================================

R관련 한글 문서에 관심을 가지게 된 것은 지난 금요일 정도부터 입니다. (08-05-2011) 영어판을 읽다가 혹시나 하다가 한글판 문서를 찾아 출력을 했더니, R 초보자 입장에서 내용보다 먼저 눈에 띄는 것은 아무래도 문서 typesetting인데, 약간 정리가 안된 느낌이랄까요? (만드시느라 고생하신 분들께는 죄송하지만) 하여간  겉모양이 좀 맘에 안 들었습니다. 제가 2년 전부터 LaTeX을 쓰기 시작하면서 문서 겉모양을 좀 따집니다. (같잖은 게 까다로와서 죄송합니다.)

하여간 제 소견에 R은 FSF/GNU project이라 반드시 Free Software/Free Document가 저에게 GPL과 GFDL로 보장한 "Free" (공짜가 아니라 자유, Freedom)에 의거해 source를 가지고 제 맘대로 굴려보고, 바꿔보고, 배포할 권리가 있다고 믿고 한글 문서 source를 찾게 된 것이지요. 제 자유를 누려보고 싶어졌습니다. (음... 이렇게 고생할 줄 알았으면 조용히 있을 거였는 데... 바보같이)

다행히 gnustats님께서 대부분 LaTeX source를 갖고 계셔서 쉽게 문서의 대부분을 복구할 수 있게 되었습니다. (08-09-2011 저녁에 R-Studio로 첫 컴파일을 마침)

=======================================================================

지난 2~3일 어떤 source format으로 시작해야할 지 다양한 툴을 사용한 (4~5시간만 자면서)엄청난 시행착오와 과거 문서 검토, 열띤 토론으로 잠정적으로 제 결정은 LaTeX(koTeX)을 다시 쓰는 것으로 정했습니다. 그렇지만 단순히 LaTeX/koTeX만 쓰는 것이 아니라 Sweave를 overlay하기로 하는 것은 "제 결정"입니다. 이것은 제가 그렇게 하고 싶기 때문입니다.

=======================================================================

그럼 이제 왜 Sweave를 overlay하는가 얘기하고자 합니다. "내 자유니가 내 맘대로 하겠다."하는 것도 필요한 이유가 될 수 있지만, 그런 것은 참으로 유치한 얘기고, 그렇게 하고 싶은 이유가 나름대로 충분히 있다는 것입니다.

우선 문제점을 보면, 대부분의 현존 문서가 정적이라는 것입니다. CRAN에서 제공되는 모든 문서는 texinfo가 그 원천이니 동일한 R command에 동일한 (이미 .eps 파일이나 .pdf파일로 출력된) 결과를 짜깁기한 것이지요. 아마 누군가가 한 번은 R에서 실행시켜본 결과겠지만, 매번 그렇다고 할 수는 없고 문서가 만들어질 때마다 그렇다고 할 수도 없지요.

1. Sweave를 overlay하면 문서가 살아 꿈틀거리게 됩니다. 물로 pdf로 다운받아 보는 분들도 계시겠지만, 제 생각에는 저처럼 Sweave source를 가지고 컴파일 하시고 싶어하시는 분들도 계실 거라는 거지요. 생각해 보세요. 물론 문서 내용은 대동소이하지만 자신의 컴퓨터 환경에서 스스로 만들어낸 자신만의 unique한 문서가 동일한 source에서 생겨나는 것입니다.

2. 믿으라할 필요없이 실행 결과를 볼 수 있는 것입니다. 기존 문서를 보다보면 command만 입력하게 하고 출력화면이 없는 경우가 종종 있는 데... 그 거 저는 싫습니다. 실감나지 않으니 지루하고 믿기지 않습니다. Sweave를 쓰면 좀더 실감나게, 그리고 생생히 가감없이 R이 어떻게 동작되는 지 보여줄 수 있습니다.

3. 더 많은 Feedback이 예상되고 더 자주 업데이트 가능할 것입니다. 실제로 R이 실행되는 것이 문서에 담기기 때문에, 기능이 없어지거나 더해지는 경우에 누구나 더 쉽게 알 수 있게 될 것입니다.

R을 배우기 시작한 지난 2~3주를 정리해 봤습니다.

No comments:

Post a Comment