Agile2robust
Be agile to be robust

Chempedia의 새로운 시작

By lordmiss on 2009/11/04

화합물 정보와 관한 한, 데이터베이스가 부족하다고 느끼는 사람은 거의 없을 것이다. 이미 PubChem과 ChemSpider가 있고, Wikipedia 내에도 상당히 많은 화합물 정보가 존재한다. Wikipedia의 경우에는 정보들을 체계적으로 분류하고 의미화하는 작업까지 진행되고 있다.

그렇다면, 이 글에서 소개하고자 하는 Chempedia는 어떤 장점을 갖는 데이터베이스일까?

Chempedia

Chempedia

정보의 질

Chempedia처럼 겨우 300개도 안되는 화합물만이 등록되어 있는 데이터베이스 시스템이라면, 수천만개의 화합물을 다루는 위에서 언급한 데이터베이스들과 비교조차 할 수 없는 것임이 분명하다.

그러나, 내 생각에는, 데이터베이스의 크기만으로 승부를 볼 수 있는 시점은 이미 지났다고 생각된다. 중요한 것은 데이터베이스의 질이다. 얼마나 높은 품질의 데이터를 관리하고 있는가가 요점이다. 모든 화학 관련 데이터베이스들이 나름대로의 데이터 관리 방법을 가지고 있고, 제공되는 정보의 품질을 높이기 위해 고심을 하고 있지만, 공통적으로 느끼는 점은 결국은 전문가들이 최대한 참여해야만 데이터의 질이 보장된다는 것이다. Chempedia에서는 이를 위해서 peer-review 방식을 도입하고 있다. 간단히 말하면, 사용자들이 다른 사용자들에 의해 평가되고, 이 점수를 통해 정보의 신뢰도를 평가할 수 있다는 것이다. 이런 종류의 방식이 얼마나 효과적일지 예측하기는 어렵지만, 최소한 이 서비스를 이용할 사람들의 배경이나 의도를 감안해 보면, 한국의 여러 게시판에서와 같은 회원 등급 방식보다는 잘 작동하지 않을까 하는 생각이 든다.

참여와 공유

정보의 질과 양을 모두 만족시키기 위해서는 결국 많은 전문가들의 참여가 필수적이다. 전문가들을 이런 시스템에 참여시킬 수 있는 방법이 무엇이 있을까? 참여와 공유를 모토로 하고 있는 Web2.0 기반의 모든 서비스들이 가지고 있는 이 어려움을 어떻게 해결할 수 있을까?

참여와 관련하여 Chempedia가 생각하는 것은, 적극적인 유인책을 고안하는 것보다는 참여를 막는 귀찮은 장벽들을 최대한 제거하는데 초점이 맞추어져 있는 듯 하다. 이런 생각이 가장 잘 드러나 있는 부분은 바로 회원 가입 부분이다. 이 사이트에서는 아예 회원 가입을 받지 않는다. 로그인은 OpenID를 가지고 할 수 있다. 구글이나 야후, AOL 등에 아이디를 가지고 있다면 그 아이디로 그냥 로그인을 할 수 있다. 아래 그림을 보면 이해가 빠를 것이다. 결국, 누구도 이 사이트를 이용하기 위해 자신의 개인 정보를 넘겨주는 일이 없을 뿐더러 따로 아이디와 비밀번호를 기억할 필요도 없는 것이다.

Chempedia login

Chempedia login

공유와 관련해서는, 이 데이터베이스의 모든 내용을 모든 사람들이 다 다운로드 받아서 사용할 수 있도록 데이터를 완전히 오픈할 것이라고 천명하고 있다. 저작권은 CC0을 따르고 있는데, 쉽게 말하면 그냥 조건없는 완전 무료라고 말할 수 있다.

ChemWriter

그러나 무엇보다 중요한 장점은 바로 이 ChemWriter라고 생각된다. ChemWriter는 자바로 만들어진 분자 그리는 프로그램으로서, 내가 사용해 본 모든 분자 그리는 프로그램 중에 가장 쉽고 편리하며 예쁜 그림을 만들어 준다. 이 예쁘다는 말은 굉장히 주관적인 평가를 담고 있는 말이기는 하지만, 논문에 실려 있는 그림을 보면서 ‘그림을 왜 이따위로 그렸어?’라는 불평을 해 본 적이 있는 사람이라면 이 주관적인 요소가 얼마나 중요한 요소인지 잘 알 것이다. 화학정보학에 있어서 가장 중요한 정보는 화합물의 구조이며, 이 구조를 가장 아름답게 표시하는 것이 어떻게 보면 가장 중요한 일 중의 하나일 수 있는 것이다. 게다가 이 프로그램은 크기가 작아서 빠르며, 웹 표준을 준수하므로 (거의) 모든 웹 브라우저에서 잘 돌아간다. (eMolecules 데이터베이스를 써 본 사람이라면 이미 이 프로그램을 사용해 봤을 것이다.)

ChemWriter

ChemWriter

Chempedia GSID

이 데이터베이스에 등록된 모든 화합물은 고유의 식별자인 Chempedia Global Identifier를 갖게 된다. 내가 최근에 등록한 화합물인 Sclareol의 경우에는 3-6711-1505-7723이라는 식별자를 갖고 있다. 이 식별자로 검색을 하면 현재 구글에서는 아무런 검색 결과도 돌려주지 않는다. (이 글을 쓰는 시점은 등록 후 겨우 6시간 후이다) 거꾸로 생각해 보면, 구글 봇이 이 사이트를 한 번 인덱싱하고 나면 구글 검색에서 오로지 이 화합물의 정보만이 보일 것이라는 사실을 유추할 수 있다. Sclareol이라는 검색어가 얼마나 쓸데없는 정보들을 많이 보여주고 있는지를 생각해 보면 (심지어는 다른 검색어를 제안해 주기도 한다) 구글 검색을 통해 쉽게 정보를 찾을 수 있다는 사실은 생각보다 매우 중요한 장점이 된다.

이런 장점은 InChIKey와 유사하다고 볼 수 있는데, GSID는 제안되고 사용되는 것이 처음인데다가 그 기술적인 내용이 아직 공개되지 않았으므로 어느 것이 좋고 나쁜지에 대해 판단할 수 있는 근거는 아직 없다고 볼 수 있다. (다만 InChIKey의 경우 거의 모든 화학 데이터베이스에서 기본적으로 사용하고 있는 표준이나 GSID는 그 미래가 불투명하다는 점은 인지를 할 필요가 있다.)

결론

구슬이 서말이라도 꿰어야 보배라는 말이 있다. 많은 화학자들은 매일 수많은 화합물 구조 속에서 살아간다고 해도 과언이 아니다. 매번 그린 그림을 또 그려야 하는 사실을 당연하게 생각할 수도 있다. 그러나, (최소한 훈련 목적으로 해야 할 때를 제외하고) 그런 비창조적인 일에 자신의 시간을 낭비하는 것은 큰 손실이 아닐 수 없다. 그림은 제대로 한 번만 그리고 활용하는 것이 좋다. 그런 측면에서 PubChem의 못생긴 그림은 마음에 들지 않는다는 생각을 해 본 사람이라면, 지금이라도 Chempedia를 사용해 보는 것은 어떨까? 한 번 입력해 놓은 화합물은 언제든 mol 파일로 다운로드 받던지, 아니면 자유롭게 확대 축소가 가능한 그림으로 전환할 수 있다 (이 링크를 확인해 보라).

Chempedia는 장점이 뚜렷한 시스템이다. 이런 서비스들이 다 그렇듯이, 어떻게 효율적으로 활용하느냐에 따라 큰 가치를 줄 수 있는 가능성을 가지고 있다고 본다. 문제는 얼마나 참여하는가에 있다.

Posted in 화학정보학 | Tagged chemical database, Chempedia, chemwriter, Web2.0 | Leave a response

« Previous Next »

Pages

  • 이 블로그는 개점 휴업?
  • 이 블로그에 대해
  • 피드버너를 중지합니다.

Categories

  • 과학 일반
  • 기타
  • 분자모델링
  • 소프트웨어
  • 신약개발
  • 화학정보학

Archives

Tag cloud

wikipedia 위키 공유 java QSAR CAS number Depth-first cheminformatics 블로그 open source chemical database 과학 화학정보학 집단지성 생합성 데이터베이스 youtube 자바 protein structure Jmol rcdk ruby 신약개발 데이터 Nature python 화학 openbabel 구글 Pipeline Pilot SMILES 파이어폭스 PDB 문헌 저널 pubchem 롱테일 비디오 sdf Grid Computing InCHI 단백질 Chempedia Web2.0 논문

RSS Calm Shouting

  • 창조론과 진화론 – 어떤 짧은 논쟁 (2)
  • 창조론과 진화론 – 어떤 짧은 논쟁
  • 윈도우에서 Typinator 기능 사용하기
  • 윈도우에서 스크롤 방향 바꾸기
  • Momolog 데이터를 Momento로 옮기기

Meta

  • Log in
  • Entries RSS
  • Comments RSS
  • WordPress.org

Copyright © 2012 Agile2robust.

Powered by WordPress and Hybrid.

Array