이름 : 한국금석문 종합영상정보시스템

기관 : 국립문화재연구소

주소 : http://gsm.nricp.go.kr



2002년부터 한국의 문화재를 전담하는 국가기관인 국립문화재연구소에서 고대부터 조선시대에 이르는 자료를 연구자와 일반인 모두가 편리한 접근과 신속한 활용을 목적으로 국내에 산재한 금석문 자료를 수집하여 일반인은 물론이고 학술논문을 작성할 때 인터넷자료를 직접 인용할 수 있는 온라인 환경을 제공한다.


바로 : 정말 논문에 직접적으로 인용할 수 있을 정도의 품질을 보여준다. 현존하는 학술시스템에서 필요한 거의 대부분의 사항을 만족시켜주고 있다. 특히 금석문의 다양한 소장처와 판독 및 해석을 통합적으로 보여주는 것은 너무나 유용하다. 다만 API 등의 DB 공유를 지원하지 않아서 아쉽다. 그리고 웹표준 좀 지켜라!!!! IE에서만 제대로 돌아가!!!! 크왕!







* DH 리뷰는 DH스터디를 간략하게 요약한 내용입니다. DH스터디는 한국학중앙연구원에서 진행되며 모든 분들의 참가를 환영합니다. DH스터디에 관한 문의 사항은 ddokbaro@gmail.com 으로 언제든지 연락해주시기 바랍니다.






서울특별시 외국어 표기 사전 : http://dictionary.seoul.go.kr/


서울시는 2002년부터 외국어표준화 사업을 시작하여 각종 안내 표지판과 홍보물 등에 사용되는 연문 표기를 표준화해 영문표기 사전을 배포해오고 있었다. 그러나 검색이 아닌 문서로 배포하고 있었기에 사용에 일정한 제한이 있어왔다.

서울시는 이에 8월 1일부터 "서울특별시 외국어 표기 사전" 홈페이지를 오픈하였다. 본 싸이트는 기존의 영문표기뿐만이 아니라 중국어와 일본어까지 지원하며, 표준화된 외국어 표기를 제공함으로서 외국인 관광객에게는 정확한 정보를 전달하고, 내국인들에게는 관광사업에서 큰 효과를 발휘할 것으로 보인다. 솔직히 공무원의 마인드에서 나왔다고는 상상도 못할 실용적인 싸이트라고 할 수 있다[각주:1].

기본적으로 국립국어원 표준국어대사전과 서울시가 그 동안 축적한 데이터를 바탕으로 하고, 음식명은 한국관광공사의 표기 기준, 문화재는 문화재청의 표기 기준, 도로명은 안전행정부의 표기 기준을 통합하여 제공하고 있다.

번역기준은 "우리나라 지명이나 도로명의 경우에는 현재 사용하고 있는 한자를 가능한 그대로 반영하도록 했으며, 한자가 없는 경우에는 최대한 의미역하여 그 유래를 보존하기로 했다. 그러나 유래가 명확하지 않거나, 동일한 음의 지명이 있는 경우 등 예외 조항을 두어 음역도 함께 병행하는 것"으로 하였다. 물론 이러한 번역원칙에 대해서 반론이 있을 수도 있지만, 번역원칙을 명확하게 하여 통일성을 주는 것은 칭찬받아 마땅한 방식이라고 본다.

그 뿐만이 아니라 단어 검색시 오류를 발견할 경우 바로 오류접수를 할 수 있도록 UI가 전면에 배치되어 있는 것도 특색이라고 할 수 있다. 무엇보다 서울시는 외국어 표기 데이터 베이스를 서울시 열린 데이터 광장을 통해서 8월 말부터 공개할 예정이다. 다시 말해서 공공의 차원에서 만들어진 데이터이기에 공공에 서비스를 한다는 너무나 당연해보이지만 실제로는 힘든 일을 했다.


그리고 역시 당연하다면 당연한 것이지만 IE(익스플로우)가 아닌 FF(파이어폭스)나 크롬에서도 정상적으로 작동한다[각주:2]. UI면에서도 내용자체가 간략하다면 간략할 수도  있지만, 검색 UI의 기본적인 기능을 충실하게 구현하고 있어서 사용자들이 편안하게 자신들이 원하는 내용을 찾아볼 수 있도록 배려하고 있다.

작은 나라라고 할 수 있는 서울의 외국어 표기사전은 단순히 서울시만의 데이터가 아니라 한국 전체에 파급력을 가져다 줄수 있는 성공적인 프로젝트가 될 것으로 보인다.



다만 체계적이고 지속가능한 유지보수 시스템이 구비되어 있기를 진심으로 소망한다. 이미 2002년부터 지속적으로 발전한 사업인만큼 유지보수에 큰 문제가 없을 것이라고 생각하지만, 그 동안 수 많은 공공사업들이 발표만 하고 정작 더욱 중요할 수 있는 유지보수에 무관심 했던 수 많은 사례를 생각하면 당부를 하지 않을 수 없다. 그리고 조그마한 부분이지만, 검색 결과의 표기 숫자가 10개로 고정되어 있는데, 이를 사용자가 선택할 수 있게 해주면 더욱 좋을듯 하다.


  1. 번역이라는 수 많은 이견이 있을 수 있는 곳에서 표준화를 추구하는 것 자체는 공무원 마인드라고도 할 수 있겠지만...반대로 생각하면 논란이 될 것이고 피곤할 일인데 굳이 하는 것은 공무원 마인드라고는 할 수 없는 것이다. [본문으로]
  2. 사실 이런 것에 기뻐해야되는 것 자체가 싫다. ㅠㅠ [본문으로]




词库下载-拼音加加输入法


Sogou만큼은 아니지만 중국어 입력기 부분에서 매니아층을 형성하고 있는 핀인쟈쟈(拼音加加)에서 공개한 전문분야별 단어데이터이다. 형식은 그냥 단어들이 나열되어 있는 형태로 되어 있다. 하지만 특별한 부분의 단어를 추가하려고 할 때 유용하게 사용될 수 있다.


그러나 인터넷에서 자발적으로 작성된 것이라 전문분야에서 사용하려고 할 경우 직접적으로 사용하기보다는 일정한 단어 추가-수정-삭제 처리를 하는 것을 추천한다.


세부적인 내용은 해당 데이터를 이용하려는 사람은 기본적으로 중국어를 구사할 수 있을 것으로 판단하여 생략하도록 하겠다. 만약 중국어에 자신이 없는데 해당 데이터를 다루실 분들은 연락을 주시면 도와드리도록 하겠다.







Sogou는 현재 중국 최대 사용자를 보유하고 있는 중국어 입력기를 서비스하고 있는 회사이다. Sogou는 자신들의 서비스에서 추출된 중국어 단어들을 대상으로 무료로 단어 데이터(Word DB)을 서비스하고 있다.


한국어로 설명을 할까도 생각을 했지만, 해당 DB을 사용할 사람들은 기본적으로 중국어를 할 수 있다고 생각되어서 설명을 생략하도록 하겠다. 혹시 설명이 필요하신 분들이 있다면 연락을 주시면 상세 설명을 추가하도록 하겠다.


互联网词库(SogouW)(2006) : 중국어 단어 데이터이다. 단순한 단어 데이터 뿐만이 아니라 단어의 속성까지 명시해주고 있다. 다만 조사 시간이 2006년 10월이어서 최신 데이터를 구했으면 하는 아쉬움이 있다. 


中文词语搭配库(SogouR)(2006) : 중국어 단어 연결 데이터이다.  어떤 단어 뒤에 어떤 단어가 자주오는지를 분석한 결과이다. 단어 데이터와 마찬가지로 최신 데이터가 있으면 더욱 좋았을 것 같다.


互联网语料库(SogouT)(2012) : 중국어로 작성된 1.3억개의 웹페이지의 정보를 모아둔 자료이다. 압축 전 용량이 5TB이며, 압축을 해도 2.13TB이다. 현재 중국에 관하여 데이타 마이닝을 할 경우에 적합한 빅데이터라고 할 수 있다.


본인은 현재 한국 고대문헌들에 대한 텍스트 마이닝을 시도하고 있다. 위의 자료는 단어 데이터를 찾으려고 발악하다가 찾게 된 것으로서 필요하신 분들이 있을 것 같아서 자료 공유차원에서 올려본다.......다시 말해서.....혹시 한자로 된 고대문헌에 대한 자연어처리를 지원하는 패키지 아시는 분?! 아무리 찾아도 없어. ㅠㅠ



영국 셰필드 대학과 허트포드셔 대학이 편찬한 'London Lives[각주:1]'이다.  이곳에는 1690년부터 1800년 사이에 영국 런던 거주민의 삶에 관계된 고문서 240,000 건이 집적되어 있다[각주:2].  교회 교구의 기록물을 비롯해 범죄와 재판에 관한 기록, 병원의 진료 기록과 검시 보고서, 상공인 조합의 기록, 빈민 구제에 관한 기록 등이다. 이 데이터 속에는 모두 3백35만 개의 인명이 포함되어 있는데, 데이터베이스 편찬자는 그 가운데 동일 인물들을 추적하여 18세기 런던의 하층민으로 살았던 수많은 사람들의 생애를 재구성할 수 있게 하였다. 이 데이터베이스의 효용을 가늠하는 사례로, 그 속에서 찾아진 한 고아 소년에 관한 기록을 살펴보기로 하자.




London Lives, 1690-1800: www.londonlives.org



John Conway는 1775년 6월 7일 St Clement Danes 교구회에 맡겨졌다. 교구 기록에는 그의 나이가 3년 6개월이고, 글을 읽고 주기도문을 욀 수 있다고 적혔다.  간호사 Hill이 주급 2 실링 6 펜스를 받고 그를 보육하였다. 1778년 John은 가난한 소년들에게 일거리와 숙식을 제공하는 구빈원(救貧元)으로 옮겨진다. (이 때 그의 나이는 2 살이 늘어난 8살로 기록된다.) 그는 이곳에서 걸레에 쓰는 실을 짜는 일을 했다. 교구의 도제 등록부에 의하면, John은 1783년 8월 30일 Essex 지방의 Barking에 사는 어부 Morris Jones의 도제(徒弟)로 보내진다. 이 때 만들어진 고용계약서에는 7주 후에 마스터인 Morris Jones가 2 파운드를 받고, 3년간의 고용 기간이 만료되면 2 파운드 2 실링을 더 받는 것으로 되어 있다. John은 3년 동안 일한 후에 옷 한 벌을 받기로 하였다. 1785년 4월 18일에 John은 다시 St Clement Danes 구빈원의 명부에 올랐다. 하지만 4월 22일에 열린 입원 자격 심사에서 그가 도제 생활을 한 지 9달 만에 도망쳤던 사실이 드러나 입원이 거부되었고, 다음날 그는 Barking으로 추방되었다. 1786년 3월 15일, John은 14살이라고 나이를 속이고 다시 구빈원에 들어오려고 했지만, 이번에도 심사를 통과하지 못했다. 3월 17일, 존은 다시 Barking으로 돌려보내졌다[각주:3]



본 내용은 한국학중앙연구원 인문정보학 김현 교수의 "디지털 인문학: 인문학과 문화콘텐츠의 상생 구도에 관한 구상"의 일부를 발췌한 내용입니다.


바로 : 이 프로젝트의 경우 세부적인 인물에 대한 ID값이 제대로 부여되지 않았기에 빅데이타 분석으로는 한계점이 보인다. 그러나 설령 그렇다고 하더라도 일단 모아놓으면 뭔가 된다. 다만 처음부터 제대로 설계했으면 더 좋은 결과가 있었을 것이다.




  1. London Lives, 1690-1800: http://www.londonlives.org, version 1.1, 24 April 2012. [본문으로]
  2. London Lives는 런던시의 8개 아카이브에 소장된 자료를 담은 15개 기존 데이터베이스를 이용하여 만들어졌다. [본문으로]
  3. London Lives: http://www.londonlives.org/static/ConwayJohn1775-1786.jsp [본문으로]

미국의 스텐포드 대학에서 수행한 ‘Mapping the Republic of Letters’ 프로젝트[각주:1]의 결과물이다. ‘편지 공화국’(Republic of Letters)이란 17, 18세기 유럽과 미국에서 원거리 편지 교신으로 지식과 감성의 공감대을 형성해 온 문화적 공동체를 지칭하는 표현이다. Mapping the Republic of Letters는 볼테르(Voltaire), 라이프니츠(Leibniz), 루소(Rousseau), 뉴톤(Newton), 디드로(Diderot) 등 계몽주의 시대의 인물들이 남긴 수 많은 편지의 발신지와 수신지, 발신 날짜로 기록된 공간, 시간 정보를 시각적으로 재현한 다이내믹 디지털 콘텐츠이다.


Mapping the Republic of Letters

http://www.stanford.edu/group/toolingup/rplviz/rplviz.swf

 
  예시 화면에서 보이듯이 특정 시간대에 주고받은 편지의 수발신 위치가 세계 지도 상에 표시되고 있다. 이 네트워크 그래프의 한 노드를 클릭하면 그것에 해당하는 편지의 목록이 나오고, 다시 클릭하면 개별 편지의 내용을 확인할 수 있게 된다.  이러한 수준의 고기능 시각화 프로그램은 스텐포드에서 컴퓨터 공학을 전공하는 학생들의 노력으로 만들어졌다. 하지만 그러한 응용이 가능했던 것은 방대한 규모의 유럽 계몽기 편지 데이터베이스가 인문학자들에 의해 먼저 구축되었기 때문이다. 


  ‘Mapping the Republic of Letters’에서 사용한 모든 데이터는 영국의 옥스퍼드 대학에서 만든 ‘Electronic Enlightenment[각주:2]’  데이터베이스에서 끌어온 것이다. 이 데이터베이스는 17세기 초에서 19세기 중반까지 약 200년의 기간 동안 7,476명의 사람들에 의해 쓰여진 60,647건의 역사적인 기록물을 담고 있다. 단순히 원문을 디지털화 한 것이 아니라, 본문에 270,000여 건의 주석을 부가하고, 관련 있는 사람들을 연결시키고, 중요한 키워드는 옥스퍼드 인명사전 등 50여 개의 다른 데이터베이스에 하이퍼링크로 연결되도록 하였다.



본 내용은 한국학중앙연구원 인문정보학 김현 교수의 "디지털 인문학: 인문학과 문화콘텐츠의 상생 구도에 관한 구상"의 일부를 발췌한 내용입니다.


바로 : 같은 시각화를 한국에 남아 있는 수 많은 서찰을 대상으로 진행했다고 생각해보자. 재미있을 것 같지 않은가? 문제는 무엇이냐...이런 시각화를 할 DB가 없어 ㅠㅠ 부분적으로 지금 만들고 있는 프로젝트가 있긴 하지만...기본적으로 없어. 사실 표준 공간정보DB도 없어서 확장도 제한적이야 ㅠㅠ



  1. Mapping the Republic of Letters: http://republicofletters.stanford.edu/, Stanford University [본문으로]
  2. Electronic Enlightenment Project: http://www.e-enlightenment.com/, Bodleian Libraries, University of Oxford [본문으로]

미국의 메사추세츠 공대(MIT)에서 수행하는 'Visualizing Cultures' 프로젝트는 “이미지가 이끄는 학술”(Image Driven Scholarship)을 표방하는 디지털 환경의 인문 교육 교재 개발 사업이다[각주:1].  역사적 사실에 관한 그림, 사진 등의 이미지 자료를 디지털 영상으로 제작하고[각주:2], 영상 자료의 구석 구석에 담긴 지식의 모티브를 찾아 학술적인 설명을 부가하는 방법으로 시각적인 스토리텔링을 구현하고 있다.




Visualizing Cultures: http://www.visualizingasia.com



이 저작물은 모두 월드 와이드 웹(World Wide Web)을 통해 공개되고 있으며 MIT의 온라인 교육 프로그램으로 활용되고 있다. ‘중국 광동 무역의 흥망’(Rise & Fall of the Canton Trade System), ‘흑선과 사무라이’(Black Ship & Samurai) 등 20개 주제에 관한 45개의 코스웨어 유닛이 만들어져 있는데, 흥미로운 사실은 그것이 모두 아시아의 근대에 관한 내용이라는 것이다. MIT의  Visualizing Cultures Project는 2010년부터 예일대학(Yale University)의 동아시아학위원회(Council of East Asian Studies)와 함께 'Visualizing Asia in the Modern World'라는 이름의 컨퍼런스를 개최해 오고 있다[각주:3]시각적인 자료를 통해 아시아의 역사와 문화를 연구한 것이나  아시아의 문화와 자연을 담은 멀티미디어 데이터베이스 등이 이 컨퍼런스를 통해 소개되고 있는데, 이러한 주제들이 앞으로 MIT의 Visualizing Cultures Project의 외연을 넓혀 갈 것으로 예상된다.



본 내용은 한국학중앙연구원 인문정보학 김현 교수의 "디지털 인문학: 인문학과 문화콘텐츠의 상생 구도에 관한 구상"의 일부를 발췌한 내용입니다.



바로 : 인문학 시각화의 훌륭한 예시이다. 그러나 기존의 인문학 교육내용을 억지로 컴퓨터로 옮겨놓은 느낌이다. 전체적인 UI가 좀 답답하다. 누가봐도 교.육.용.이라고 적혀 있기 때문이다. 인터넷 유져들은 교육용이라는 느낌이 들면 떠나간다. 그런 의미에서 구글의 역사적 순간의 UI나 접근이 더 좋지 않나 싶다.


  1. Vusualizing Cultures: http://ocw.mit.edu/ans7870/21f/21f.027/home/index.html, Massachusetts Institute of Technology [본문으로]
  2. Visualizing Cultures 프로젝트에서 활용하는 이미지는 대부분 미국과 일본의 유명 박물관에서 유물로 보존하고 있는 것들이다. 이러한 희귀 자료에 대한 접근성과 활용성을 높이는 것도 이 프로젝트가 지향하는 목표 가운데 하나이다. 이미지 자료 제공 기관: Arthur M. Sackler Gallery / Smithsonian Institution / Hiroshima Peace Memorial Museum / Honolulu Academy of Arts / Hood Museum of Art, Dartmouth College / Museum of Fine Arts, Boston / Peabody Essex Museum / Ryosenji Treasure Museum / Shiseido Corporation / Smith College Museum of Art [본문으로]
  3. Visualizing Asia in the Modern World: http://www.visualizingasia.com. 이 컨퍼런스는 2010년에 시작하여 해마다 열리고 있으며, Yale, Harvard, Princeton 세 대학이 각각의 연차 대회를 주관하였다. [본문으로]

스토리헬퍼는 한국콘텐츠진흥원과 엔씨소프트문화재단이 투자하고 이화여대 디지털스토리텔링 연수소와 엔씨소프트문화재단이 공동으로 2010년 5월부터 2013년 3월까지 개발한 한국형 스토리텔링 지원 소프트웨어이다. 



스토리헬퍼 : http://www.storyhelper.co.kr/



연구책임자인 이대여대 이인화 교수에 의하면 스토리헬퍼는‘사례 기반 추론(Case Based Reasoning)’을 기본 로직으로 삼아서 과거의 영화와 애니매이션의 1,406편의 플롯을 뽑아서 스토리 모티프 205개를 선정하고 이를 장면 데이터베이스 11만 6,796개로 구성했다. 이를 통해서 기존의 작품과 스스로의 작품간의 흐름을 비교분석할 수 있다. 


물론 이런 플롯비교나 도우미는 전체 작품집필에 절대적인 역할을 할 수는 없다. 결국 창작자의 "하고 싶은 말"을 대신 해줄수는 없다. 다만 창작자가 보다 "말을 잘할 수 있게"해준다는 점은 분명하다.


국토지리 정보원 : http://www.ngii.go.kr/  --> 왼쪽 중단부의 온맵



국토교통부 국토지리정보원이 전문지식이나 소프트웨어가 없어도 사무실이나 또는 가정에서 자신만의 지도를 만들 수 있도록 한다는 목표로 "온맵"을 출시하였다. "온맵"은 기존의 포털에서 제공하는 지도서비스와는 다르게 API 기술을 모르더라도 PDF로 관련 지역의 지도를 다운받아서 그 위에 마크를 할 수 있는 방식으로 기술적인 내용을 모르는 사람들도 자신만의 지도를 작성할 수 있도록 하였다.



발상자체는 본인도 관련 시스템을 개발하려고 생각하고 있었기에 놀라울 정도였다. 물론 본인의 시스템은 인문학 혹은 역사 영역이지만, 만약 괜찮은 시스템이라면 벤치마킹을 할 생각으로 한국국가싸이트 다운 온갖 설치프로그램의 난관을 뚫고 사용을 하였다. 그러나 기대가 컸던 만큼 실망이라고 하지 않을 수 없다.



기본적인 시스템의 개념은 그냥 과거의 지도관리시스템을 그대로 가지고 온 것 뿐이다. 컴퓨터에서는 컴퓨터의 기능을 이용하여 지금까지의 종이 기반의 지도관리와는 전혀 다른 디지털 기반의 지도관리를 보여줄 수 있다. 그러나 이건 그냥 과거의 종이기반 지도관리시스템일 뿐이다.



그리고 UI에서는 할말 도 없다. 차라리 구글어쓰의 UI을 벤치마킹하지 그랬냐? 아니면 구글어쓰와는 다르게 웹에서 작동하도록 만들었으면 차라리 좋은 박수를 보냈을 것이다. 그런데 이건 솔직히 다시는 사용하지 않을 것 같다. 여기서 제공하는 지도의 수준은 구글어쓰에 비해서 좋지도 않고, 초보자를 위한 UI는 기본적인 UI 설계에 대한 공부가 부족한 모습이다. 



그리고 기왕 민간에 공개를 하려면 그냥 무상으로 공개를 할 것이지. 굳이 회원가입을 무조건 해야만 접속을 할 수 있게 만드는 것인가? 솔직히 여기서 제공하는 정보 중에서 식생이나 수계와 같은 경우는 독특한 정보이지만, 대부분의 일반인이 사용할 정보가 아니지 않은가?!



기대가 컸던 만큼 아쉬운 면이 너무 많다. 그리고 몇몇 특별상황에서 식생과 수계에 대한 정보가 필요하지 않은 이상 이 곳을 이용할 경우는 없을 듯 하다.

Daum 3D지도 Lab : http://map.daum.net/3d/


개인적으로 지도 서비스는 당연히 구글이 전세계 탑이라고 생각한다. 발상이나 실행력 그리고 돈에서 한국기업과는 상대가 되지 않는다. 그래도 다음이나 네이버는 세부적인 한국정보 DB을 바탕으로 최소한 한국특화에서는 구글에 앞서도 있는 상황이다. 그리고 특화부분에서는 네이버보다 다음이 더 뛰어나다고 개인적으로 생각한다.


다음은 이번에 다음지도의 3D 버젼을 실험용으로 제시하였다. 비록 구글에서 제공하고 있는 3D맵을 생각하면 늦은 경향이 없지 않지만, 이런 지속적인 실험에는 박수를 보내고 싶다. 특히 한국에서 인문콘텐츠의 디지털화에서 가장 뛰어난 역량을 발휘하고 있다고 생각되는 문화재청과의 협력을 통한 3D 모델링은 박수를 받을만 하다.


var options = {
    fmUrl : 'http://dmaps.daum.net/apis/3DLab/20130718/DaumMap3DBeta.swf',
    rvUrl : 'http://dmaps.daum.net/apis/roadview2.0/RoadView.swf',
    fmVersion : 20130718,
    rvVersion : 20130709
};


비록 아직은 보여주기 기능만을 제공하고 있지만, 소스를 통해 보면 조만간 API도 제공할 것으로 보인다. 다만 어차피 다음 혼자 한국의 모든 건물의 3D 모델을 만들수는 없다. 결국 WIKI와 같은 개방형시스템을 통해서 사용자 참여를 통해서 3D모델링량을 늘려나가야 한다.(그래. 이미 구글이 그러고 있다.) 그러기 위해서 필요한 구글의 스케치업과 같은 제작도구의 출현을 기다려본다. 


또한 현재 다음이 시범적으로 하고 있는 다음문화유산(http://heritage.daum.net/)과의 유기적인 연결을 기대해본다. 현재 다음문화유산은 로드뷰 기술을 적용한 공간감을 주는 방식으로 실험을 하고 있는데 2차원의 공간감과 3차원의 공감감을 적당히 절충하는 방법에 대한 고민이 필요할 것으로 보인다.


+ Recent posts