본 내용은 한국학중앙연구원 인문정보학과 김바로 박사과정의 2014년도 1월 3번째주 세미나 발표 자료입니다. 내용은 간략한 네트워크 분석 개론의 설명을 위해서 네트워트 분석의 간단한 역사와 지형도프로젝트를 통해서 나온 결과물 및 고대인물 네트워크 분석 초안을 담고 있습니다. 


본 내용은 출처표기를 하시면 자유롭게 활용 가능합니다. 문의사항이나 수정요청 사항 등은 ddokbaro@gmail.com 으로 메일을 보내주시기 바랍니다.






본 내용은 한국학중앙연구원 인문정보학과 김현 교수님의 "문화유산 오픈 아카이브 구현을 위한 데이터 모델 - 유로피아나 데이터 모델과 응용 사례- 발표자료입니다. 문화유산 오픈 아키이브 구축의 필요성에 대해서 서술하기 위하여 공공데이터 정책에 대해서 논한 이후에 구체적인 아카이브 구축 방향을 유로피아나 데이터 모델을 활용해서 제시하고 있습니다. 

본 내용은 출처표기를 하시면 자유롭게 활용 가능합니다. 기타 문의사항은 ddokbaro@gmail.com 으로 메일을 보내주시기 바랍니다.



본 내용은 한국학중앙연구원 인문정보학과 김현 교수님의 2014년 1학기 "전자문서" 수업 중 "디지털 인문학 개론"에 대한 파워포인트입니다. 


본 내용은 출처표기를 하시면 자유롭게 활용 가능합니다. 문의사항이나 수정요청 사항 등은 ddokbaro@gmail.com 으로 메일을 보내주시기 바랍니다.







디지털 인문학이라는 신흥학문을 공부하다보면 재미있는 "의견"을 들을 때가 많이 있습니다. 디지털 인문학에 대한 반감만으로 나오는 이런 "의견"에 대답할 필요가 있는지 자체가 의심스럽지만 간단하게나마 이야기해보도록 하겠습니다[각주:1].



1. 디지털 인문학 없어도 지금까지 잘 해왔다?

이런 말은 마치 "지금까지 "한글"이나 "워드"없이 "원고지"에 "펜"으로 논문 잘 써왔다." 라고 말하는것과 다를바가 없다. 요즘 세상에 "한글"이나 "워드"를 사용하지 못해서 "원고지"에 글을 쓰는 사람을 어떻게 생각하는가? 


학문은 끊임없이 발전해왔고, 디지털 인문학은 분명히 인문학의 새로운 가능성을 보여주고 있다. 자신이 못한다는 이유만으로 유용한 도구를 무시하는 것은 바보짓으로밖에 보이지 않는다. 


디지털 인문학을 한다는 것은 기존의 방법론을 모두 버리는 것이 결코 아니다. 지금까지의 방법론을 컴퓨터와 융합하여 더욱 발전 시키자는 것이다. 이제 단순무식한 반복 작업은 컴퓨터에게 맡기고 수집된 자료를 분석하는 인문학자 본연의 임무에 충실하자는 것이다. 




2. 자료를 찾는 것이야말로 인문학의 정수다?

두꺼운 사료를 한글자 한글자 정독하다가 자신이 원하는 내용을 발견했을 때의 희열이야 말로 인문학의 희열이라고 말하는 사람들이 있다. 자료를 찾아낸 희열? 어떤 것에서 재미를 느끼는 것은 개인의 자유이다.


다만 10년동안 조선왕조실록과 관련 자료를 독파하면서 원하는 자료를 찾을 것인가? 아니면 단 한번의 검색으로 1초만에 모든 관련 자료를 찾아낼 것인가?




3. 디지털 자료는 부정확하다. 

디지털 자료는 부정확한 자료가 많기 때문에 믿을 수 없으며 사용하지 않는다라고 말하는 사람들이 생각보다 많다. 그런데 출판된 서적에 얼마나 많은 오탈자가 존재하는지 알고 있는가? 오탈자는 많은 사람들의 퇴고작업으로 줄어든다는 상식도 알고 있는가? 어려운가? 간단히 말해서 브리태니커 백과사전에 비교해서 인터넷 위키백과사전은 사실상 오탈자가 존재하지 않는다.


디지털 자료 자체의 정확도에 대해서도 문제시 하는 사람들이 많다. 인터넷에 올라온 정보들은 믿지 못할 내용이라는 것이다. 하지만 공신력이 있는 디지털 자료는 이미 넘쳐 흐른다. 한국의 역사통합검색시스템에서는 대부분 원문과 번역문 뿐만이 아니라 원문 이미지까지 공개해주고 있다. 무엇보다 많은 사람들이 오탈자뿐만이 아니라 번역상의 문제도 피드백을 해주고 있기에 끊임없이 정확도 100%을 향하고 있다[각주:2]


물론 아직도 많은 자료들이 디지털화되어 있지 못하다. 공신력이 있는 기관에서 지속적인 데이터 구축작업을 진행해야하는 것도 맞다. 그러나 이것은 디지털 자료의 축적량이 아직 부족한 것이지 디지털 자료의 시스템 자체가 부정확한 것은 아니다. 백번 양보해서 설령 지금 당장은 디지털 자료가 부정확하더라도 10년 이내에 기존의 그 어떤 자료보다 정확해질 것이다.


아직도 디지털 자료가 부정확하다고 생각한다면 DBPIA나 KISS 혹은 RISS같은 논문정보제공 싸이트에서 논문을 찾지 말고 직접 국회도서관이나 국립중앙도서관에 가서 하나하나 종이로 인쇄된 논문을 찾기를 바란다. 그게 정확하지 않은가? 




4. 디지털 인문학을 쓰레기라고 해라. 

디지털 인문학에 대한 반론을 제시하는 사람들의 대부분은 자신이 스스로 디지털 인문학을 할 역량이 없다고 생각하기 때문으로 판단될 때가 많다. 다시 말해서 디지털 인문학의 가치나 역할에 대해서 분명히 인지하고 있음에도 불구하고 자신의 밥그릇을 지키기 위하여 열심히 투쟁하고 있는 것으로 보인다. 


당신들이 어떻게 생각하고 어떻게 행동한다고 하더라도 디지털 인문학이 인문학의 가능성이며 대세라는 것은 변하지 않을 것이라 생각하기에 디지털 인문학을 쓰레기라고 하든 말든 필자는 솔직히 관심이 없다. 다만 스스로도 디지털 인문학의 필요성과 중요성을 인지했음에도 스스로 못한다는 이유로 후학들의 길까지 막아버리는 것이 과연 학자의 태도인지 묻고 싶을 뿐이다.



  1. 이럼 "품위"가 없지만...분명히 비꼬는 투로 쓰겠지.....-_- [본문으로]
  2. 영인본이 완벽하다고 말하는 바보는 없으리라 생각한다. 영인본도 사료비판을 통해서 오탈자가 수정되어야하는 부분들이 많이 있다. 디지털 자료는 이런 부분들을 빠르게 받아들여서 수정할 수 있다. [본문으로]

미래창조과학부는 1일 서울 테헤란로 르네상스 서울호텔에서 산·학·연 전문가로 구성된 '디지털 헤리티지 포럼' 출범식을 개최했다.


미래부는 올해부터 문화유산과 3차원(3D).가상현실 등 디지털 기술을 결합한 '디지털 헤리티지 프로젝트'를 본격적으로 추진한다.


이를 통해 새로운 콘텐츠 시장을 창출하고, 문화유산의 홀로그램 관광자원 개발 등을 지원한다.


문화유산은 국가브랜드를 높이는 문화 자원의 보고(寶庫)임에도 불구하고, 지금까지는 문화원형 복원 및 데이터베이스(DB)화 수준에 그치고 있어 산업적 활용은 미흡한 실정이다.


이를 개선하기 위해 미래부는 올해 시범사업으로 약 20억원을 지원해 2~3개 콘텐츠를 개발하고, 중장기적으로 관련 기술의 연구개발은 물론, 대규모 예산을 투입해 '가상현실 석굴암(예시)' 등과 같은 랜드마크형 헤리티지 콘텐츠도 개발할 예정이다.


이 프로젝트는 산업 파급효과나 관광 활용도가 높은 유형 문화재의 디지털화를 중점 지원하되 전통예술. 인문사회 등 무형문화재의 디지털화도 지원한다.


이날 출범한 '디지털 헤리티지 포럼'은 미래부와 문화재 전문가, 디지털 콘텐츠기업 등 20여명으로 구성됐다. 


이들은 향후 사안별로 관련 전문가가 참여하는 개방형으로 운영된다.


hwyang@fnnews.com 양형욱 기자


출처 : 파이낸셜뉴스



바로 : 디지털 문화유산은 구축난이도와 효과 모두가 효율적인 좋은 주제이다 다만 문화재 담당부서인 문화재청은 어디에 있는가? 이미 문화재청에 구축되어 있는 문화유산 데이터(3D포함)은 무시하고 미래부만으로 디지털 문화유산을 만들려고 하는가? 


뉴스가 잘못된 것이기를 바란다. 그렇지 않다면 미래부의 관련 부처와의 협력 부재와 중복예산처리가 비판받을 것이다. 문화재청....발끈했겠는걸-_-;; 문화재청이 배제된 디지털 문화유산이라...허허....


디지털 인문학에서 사용되는 중요 ICT 기술과 적용사례를 소개해본다. 해당 기술은 디지털 인문학에서 현재 가장 활발하게 사용되고 있는 기술일 뿐이며, 어떠한 ICT 기술도 디지털 인문학에서 활용될 가능성이 있다. 


XML 

XML(Extensible Markup Language)은 W3C에서 다른 특수 목적의 마크업 언어를 만드는 용도에서 권장되는 문서를 사람과 기계 모두가 읽을 수 있는 형식으로 부호화하는 규칙의 집합을 정의한 다목적 마크업 언어이다. XML은 텍스트 데이터 형식으로 유니코드를 통한 전 세계 언어를 지원할 뿐만이 아니라, 임의 자료구조에도 대응할 수 있도록 설계되어 있다. 이는 인문-사회학에서 진행되는 대부분의 연구가 다양한 언어와 형식의 자료를  바탕으로 진행되는 현실과 부합하기에 인문학 연구의 기초적인 데이터베이스 구축에 가장 적합한 ICT 기술로 생각되고 있다. 



[XML예시] 


해외의 디지털 인문학 연구에서 XML은 기본 언어로 다루어지고 있다. 다만 언어학 영역에서는 XML과 같이 SGML에서 파생된 TEI(Text Encoding Initiative)을 바탕으로 한 코퍼스 연구가 진행되고 있다. XML이나 TEI 모두 같은 SGML에서 파생되었기에 상호간의 호환이 가능하다. 


한국에서는 1995년 서울시스템주식회사(현 (주)솔트웍스)에서 CD-ROM <국역 조선왕조실록>과 <디지털 한국민족문화대백과사전>에 XML을 도입하기 시작한 이후로 한국고전종합DB을 비롯한 다양한 인문학 프로젝트에서 채용되고 있다. 그러나 한국 인문학 프로젝트의 ICT 기술편차로 인하여 다양한 인문학 프로젝트에서 XML 기술을 활용하지 못하고, 단순한 Text 데이터만을 제출하였다. 그 결과 재활용이 가능한 인문학 데이터베이스가 축적되지 못하였다. 




말뭉치(코퍼스, corpus)

말뭉치는 디지털 인문학의 주요 근원이 된 말뭉치 언어학(코퍼스 언어학)의 기초 기술이다. 말뭉치는 언어학에서 크고 구조를 이루고 있는 텍스트의 집합을 의미한다.  국제적으로 통용되는 말뭉치 언어는 SGML 기술의 일종인 TEI이다. 연구자들은 말뭉치를 통해서  빈도 정보를 획득한 이후에 연어 연구, 변이 연구, 비교 언어학 연구, 언어 교육, 사전 편찬등의 영역에서 신빙성 있는 증거자료로서 활용하고 있다.  


해외에서는 1963년 브라운 말뭉치 구축을 기점으로 1억 어절의 말뭉치를 구축한 BNC(British National Corpus)와 유럽 다국어 말뭉치(European Corpus Initiative Multilingual Corpus) 및 4억 어절을 구축한 COCA(Corpus of Contemporary American English) 등이 지속적으로 구축되고 있다. 코퍼스는 다양하게 활용되고 있지만, 언어학 내부의 활용이 아닌 인문학 전체에 대한 활용으로는 타이완역사 디지털도서관(台灣歷史數位圖書館, THDL)이 있다. 타이완역사 디지털 도서관에서는 1621년부터 1911년 사이의 250종류의 자료소스를 바탕으로 언어학의 분석 이론을 통하여 타이완의 근현대 사회상을 규명하고 있다. 예를 들어서 언어학의 접사분석모델을 이용하여 “主義”의 전방접사의 시대별 빈도를 추출해주고 있다. 특히 개념사 영역의 역사 연구자들은 특정 단어의 전방접사 빈도를 통하여 당시의 시대상과 용어의 변천에 대해서 규명하고 있다. 



[타이완역사 디지털도서관 - 主義 검색결과]


한국에서는 1987년 연세대학교의 연세 한국어 말뭉치가 구축된 이후에 1998년부터 “21세기 세종 계획 : 국어정보화 추진 중장기 사업”의 일환으로 국가차원에서 말뭉치가 구축되고 있다.  또한 서울대학교 꼬꼬마 프로젝트나 연세대의 깜짝새 프로그램 등 다양한 한글 자료 처리 프로그램들의 구축되어서 연구자들의 연구를 도와주고 있다. 그러나 한국의 말뭉치는 아직 언어학 내부의 방법론으로서만 활용되고 있으며, 다른 인문학 연구 영역에서는 활용도가 떨어진다고 할 수 있다. 




지리 정보 시스템(GIS, Geographic information system)

지리 정보 시스템은 지리공간적으로 참조가능한 모든 형태의 정보를 효과적으로 수집, 저장, 갱신, 조정, 분석, 표현 할 수 있도록 설계된 컴퓨터의 하드웨어와 소프트웨어 및 지리적 자료, 인적 자원의 통합체이다. 지리 정보 시스템은 1960년대부터 토지이용, 기상관측, 동식물연구 등의 다양한 영역에서 활용되어 왔다. 현재는 컴퓨터 기술의 발달과 더불어 구글 지도, 다음 지도, 네이버 지도와 같이 일반대중에게도 널리 활용되고 있다. 그러나 인문학 영역에서는 기술에 대한 능력 부족으로 시각화 영역에 한정되어서 사용되고 있으며, 지리 정보 시스템을 활용한 자료의 수집과 분석의 영역은 실험적인 단계이다. 


중국역사GIS(China Historical GIS, CHGIS, 中国历史地理信息系统)는 2001년부터 하버드 엔칭연구소와 복단대 역사지리연구소가 연합하여 하상주부터 민국시대까지 중국역사에 등장하는 모든 지명을 좌표점과 좌표면으로 시간축상에 표기하는 역사지리토대DB 구축 프로젝트이다. 중국의 고지명과 해당 고지명의 시간과 공간을 명시함으로써 인문학 연구에서의 지리적 토대를 마련했다. 



[China Historical GIS]


한국에서도 중국역사GIS와 유사한 개념으로 고려대학교 민족문화연구소가 중심이 되어서 조선시대 전자문화지도 시스템을 구축하였다. 조선시대 문화를 대상으로 하여 전자문화지도를 개발하고, 전자문화지도 개념을 응용하여 조선시대를 문화를 연구한다. 2년간 조선시대 문화를 주제별로 분류하고, 조선시대의 군현별 행정 구역을 초ㆍ중ㆍ후기로 나누어 복원하였으며 총 25개 주제에 대한 데이터베이스를 구축하였다. 그리고 그 연장선에서 현재 동북아역사재단의 주관으로 동북아시아 전자역사지도 개발을 진행중에 있다. 그러나 조선시대 전자문화지도 시스템은 유지보수가 이루어지지 않고, 데이터도 비공개로 되어 있어서 한계를 보이고 있으며, 동북아시아 역사지도는 아직 개발 단계에 있다. 


문화재청에서 주관한 문화재공간정보서비스는 문화재정보와 지도정보가 결합한 공간정보 활용체계이다. 문화재 위치정보, 속성정보에 대한 공간데이타베이스와 활용시스템을 구축하여 문화재 보존관리를 위한 의사결정을 지원하고, 위치정보를 기반으로 문화유산 콘텐츠 활용이 가능하도록 구축된 정보시스템이다. 문화재의 사진 및 도면, 영상, 설명등의 속성정보가 위성기반의 위치정보와 함께 결합되어 HGIS 지도 서비스 제공하고 있어서 연구적 가치 뿐만이 아니라 실용적 경제 가치도 뛰어나다.



[문화재공간정보서비스]




LOD(Linked open data, 링크드 데이터)

링크드 데이터는 웹 상에 존재하는 데이터를 개별 URI(Uniform Resource Identifier)로 식별하고, 각 URI에 링크 정보를 부여함으로써 상호 연결된 웹을 지향하는 모형이다. 디지털 인문학에서는 현재 산발적으로 진행되는 디지털 인문학 성과들을 통합하기 위한 방법으로서 각광 받고 있다. 



[LOD 다이어그램]


유로피아나(Europeana)는 유럽 연합의 전자 도서관 프로젝트이다. 선사시대부터 현대까지 유럽의 문화와 과학 유산을 종합하여 모든 사람들이 접근 가능한 데이터베이스를 만든다는 목적으로 유럽 문화에 관한 디지털화된 서적, 회화, 영화, 음악, 유물 등 모든 형태의 콘텐츠를 서비스하고 있다. 콘텐츠는 단순한 데이터모음이 아닌 EDM(the Europeana Data Model)으로 불리는 표준방식을 이용하여 대영박물관, 루브르 박물관 등 2000여 소의 관련 기관들에서 제공하는 정보를 통합데이터로 만들어 제공하고 있다. 



[유로피아나]


한국에서는 국사편찬위원회의 한국역사정보통합시스템을 통해서 한국고전번역원, 한국금석문 종합영상정보시스템, 조선왕조실록, 규장각 한국학연구원 등의 연계싸이트들로부터 데이터를 통합하여 한국 역사자료를 체계적이고 종합적으로 제공하고 있다. 연구자들은 개별 싸이트에 방문할 필요 없이 한국역사정보통합시스템을 통해서 통합적인 한국역사정보를 제공 받을 수 있다. 




[한국역사정보통합시스템]




사회 연결망(Social Network)

사회 연결망은 사회학에서 개인, 집단, 사회의 관계를 네트워크로 파악하는 개념이다. 즉 개인 또는 집단이 네트워크의 노드(node)이며, 개인과 집단 간의 연결 관계는 링크(link)로 표현한다. 연구자는 네트워크에서 노드와 링크의 관계를 파악하고, 그 의미를 연구하여 사회의 구조를 파악하는데 활용하고 있다. 


해외에서는 CBDB(China Biographical Database Project, 中國歷代人物傳記資料庫)가 대표적인 인문학적 사회 연결망 프로젝트라고 할 수 있다. CBDB는 중국역대인물들의 정보를 검색하고 활용할 수 있도록 하버드 옌칭연구소가 시스템을 지원하고, 중국 북경대학교에서 데이터베이스를 마련한 데이터베이스이다. 본 데이터 베이스는 인물의 생몰년뿐만이 아니라 지역, 관직, 저작 및 인물관계를 제공하고 있으며, 중국 역대 인물들의 모든 데이터 베이스를 제공하는데 목적을 두고 있다.  



[China Biographical Database Project(中國歷代人物傳記資料庫)]


한국에서는 성균관대의 한국족보자료시스템에서 족보에 수록된 혈연관계를 바탕으로 관계망을 구축하고 있다. 그러나 족보 정보에 한정되어 있으며 타 가문과의 연계정보도 극히 제한적으로만 제공하고 있기에 실험적인 단계에 멈추고 있다. 현재 성균관대 동아시아학술원은 고대 동아시아의 간찰(편지) 정보를 바탕으로 동아시아 교류 네트워크를 구성하는 사업을 추진중에 있다. 



[한국족보자료시스템]

세계 각 국에서 디지털 인문학이 어떻게 연구되고 있는지 간단하게 정리해보도록 하겠습니다. 아직은 중요한 사항에 대해서만 간략하게 정리하였기에 부족한 부분이 많이 있습니다. 많은 의견 부탁합니다.



한국의 디지털 인문학

한국은 2000년 전후를 기점으로 IMF 경제위기의 탈출구로서 제시된 문화콘텐츠를 바탕으로 “인문콘텐츠”의 개념으로 디지털 인문학에 대한 연구가 진행되었다. 2002년에 인문콘텐츠 학회가 출범하였고, 학회지 <인문콘텐츠> 을 창간하였다. 정부에서도 2001년 한국문화콘텐츠진흥원을 설립하고 문화콘텐츠에 대한 정책적 지원을 강도높게 추진한다. 또한 2005년에는 전국대학문화콘텐츠학과협의회가 발족되면서 점차 제도화되기 시작한다. 이에 따라 2003년에 7개 불과하던 대학교 콘텐츠 학과들이 2008년 말에는 28개 대학에 설립되게 되고, 2013년에는 57개의 대학이 교과과정을 운영하는 양적인 팽창과정을 걷게 된다. 그러나 기술적인 기반이나 산업과의 연계가 미약하며, 교과과정을 위한 교수 인력도 부족하며 교재조차 자체적으로 조달하고 있는 형편이다. 디지털 인문학의 방법론에 집중한 인문정보학계열의 학과로는 한국학중앙연구원의 인문정보학 석사과정이 2007년에, 박사과정이 2011년에 개설되어서 디지털화를 중심으로 교과과정을 진행하고 있다. 2009년 서울대학교 융합과학기술대학교는 개원과 동시에 디지털정보융합학과를 개설하고 HCI(Human Computer Interaction)와 음악정보처리를 중심으로 교과과정을 진행하고 있다.

 

1995년의 국역 조선왕조실록(朝鲜王朝实录)의 전산화사업의 결과물로서 조선왕조실록(朝鲜王朝实录) CD-ROM이 간행되었다. 국역 조선왕조실록 CD-ROM은 학계뿐만이 아니라 역사애호가들의 큰 관심을 받으며 고적의 DB화 작업에 대한 관심이 크게 올라갔다. 1998년 고종ㆍ순종실록이 추가적으로 CD-ROM으로 제작되었고, 2003년에 조선왕조실록 원본을 CD-ROM으로 제작하게 된다.

 

고적의 DB화에 대한 관심이 떠오르게 되면서 1999년부터 한국학중앙연구원과 서울대학교는 각각 소장 중인 고전TEXT에 대한 전산화 작업을 선도해간다. 서울대학교 규장각 한국학연구원은 1999년도부터 대규모의 정보화사업을 시작한 이래, 1차에서 현 7차에 이르기까지 22,342책의 자료를 DB로 구축 서비스하고 있으며 규장각에서 소장하고 있는 다수의 국보(7종, 7,078책)와 보물(8종, 28책)을 비롯하여 약 26만여 점에 달하는 고도서와 고문서, 책판 등을 디지털화 시키고 있다. 현재까지 완성된 사업 결과는 규장각 웹에서 목록, 해제, 고지도, 일성록, 등의 디렉토리로 서비스하고 있으며 시기별 횡적검색 또한 가능하다.

 

1999년부터 지금까지 한국학중앙연구원은 왕실 도서관 장서각에 소장된 자료와 한국학중앙연구원이 편찬 간행한 한국학 관련 연구 성과를 기반으로 한국학데이터베이스를 구축하여 왔다. 한국학데이터베이스의 자료가 인터넷으로 무료 서비스 되고 있기 때문에 누구나, 언제나, 어디에서나 한국학데이터베이스의 자료를 활용할 수 있다. 1999년부터 2004년까지 5차에 걸친 1단계 사업을 통해 한국학데이터베이스는 한국학 지식정보의 생태환경을 조성하는 데에 주력해 왔다. 한국학중앙연구원을 방문하지 않고서도 장서각에 소장된 자료를 열람할 수 있게 함으로써 한국학데이터베이스는 한국학 연구에서 자료를 수집하는 시간과 비용을 비약적으로 절감하는 데에 큰 기여를 하고 있다. 한국학데이베이스에서 <한국구비문학대계> 편찬의 저본이 된 녹취자료가 서비스되는 것은 매우 주목할 만한 것이다. <한국구비문학대계> 관련 한국학 연구가 보다 심화될 것으로 기대된다.

 

학계는 이러한 움직임에 따라, 정부에서도 지식정보자원의 디지털화 현황을 조사를 진행하였고, 2001년 1월 국가 또는 지방자치단체 등에 산재되어 있는 지식정보자원을 체계적으로 관리, 보존하고 공공 및 민간 부분에서 이를 적극 활용할 수 있도록 국가지식산업의 기반을 확충하기 위해 <지식정보자원관리법>이 공포된다. 지식정보자원관리법의 시행에 따라 인문 분야에서는 한국역사정보통합시스템의 구축에 들어갔고, 한국정보문화진흥원이 전담하여 운영하는 지식정보자원관리사업 가운데 하나로 시작되어 14개 기관의 역사자료 데이터베이스를 통합메타데이터 방식으로 검색서비스하고 있다.

 

국립문화재연구소에서는 2002년부터 전국에 산재한 금석문을 모아 선사시대부터 조선시대(1910년)까지 종합적으로 웹상에 구축하여 서비스를 제공하는 금석문종합영상DB구축 사업을 실시하고 있다. 금석문은 세월의 흐름과 환경적인 요인으로 마모되어 가는 실정이기에, 금석문의 탁본, 실물 등의 영상이미지와 판독과 번역의 텍스트를 수집하여 기록을 보존하는 것을 일차적인 목적으로 시작한 것이다. 또한 전문 연구가에게는 원문 자료의 활용을 가능하게 하고, 일반인에게는 선조들의 기록문화에 대한 이해를 증진하기 위한 것으로, 2004년 5월부터 국립문화재연구소 홈페이지를 통해 웹 서비스를 실시하고 있다.

 

한국향토문화전자대전 편찬사업은 본래 1980년부터 1991년 편찬 완료한 <한국민족문화대백과사전> 편찬 작업의 후속 사업으로 기획되었는데, 2003년부터 10개년 계획으로 전국 시군구의 향토문화 자료를 발굴, 디지털화여 정보 제공하기 위한 사업이다. 시범 사업의 일환으로 2005년 3월 ‘디지털성남대전’이 개통하였고, 청주ㆍ강릉ㆍ진주 등 후속 사업이 진행되고 있다. 초기 고적 DB화의 열풍을 일으킨 조선왕조실록도 2005년 국사편찬위원회에서 전산화작업을 실시하여 국역문과 표점본의 통합서비스 시스템을 개발하여서 인터넷에서 서비스를 실시하고 있다. 2005년부터 행정안전부와 한국정보화진흥원의 주간아래 이루어진 한국역대인물종합정보시스템은 고조선부터 현대에 이르기까지 약 3만 명의 인물정보와 조선시대 과거 합격자와 고려시대 과거 합격자 및 음관정보 등의 약 16만여 명의 인물정보를 서비스하고 있다. 특히 한국역대인물종합정보시스템은 이용자들에게 OpenAPI을 제공하여 2차가공의 가능성을 열어놓고 있다.

 


 

미국의 디지털 인문학

미국과 유럽 등 서구 사회에서는 이탈리아의 예수회 신부 로베르토 부사(Roberto Busa, 1913-2011)가 토마스 아퀴나스(Thomas Aquinas)의 저작을 위시한 중세 라틴어 텍스트의 전문 색인을 전자적인 방법으로 편찬한 것을 디지털 인문학의 효시로 보고 있다. 이를 계기로 인문학 연구의 새로운 방법에 눈을 뜨게 된 미국과 유럽의 인문학자들은 컴퓨터의 활용을 여러 방면으로 모색하기 시작했다. 초기에는 인문학 전산화(Humanities Computing), 또는 전산 인문학(Computational Humanities)이라는 이름으로, 텍스트 및 언어 자원의 색인․통계 처리를 위주로 하였으나, 정보 기술 환경의 급속한 진화와 더불어 그 활용 범위를 데이터베이스와 멀티미디어, 그리고 대규모 원시 데이터에서부터 전자적인 방법으로 의미있는 사실을 찾아내는 데이터 마이닝(Data Mining), 그 결과를 그래픽으로 보여주는 시각화(Visualization)로 넓혀 갔다.

 

유럽과 미국의 여러 대학에서 창의적인 인문학 연구자들에 의해 자발적으로 시작된 디지털 인문학은 정부 및 민간단체의 재정적인 지원에 힘입어 보다 광범위하게, 적극적으로 추진되기 시작했다. 미국의 경우, 인문학재단(NEH, National Endowment for the Humanities)이 2008년에 설립한 디지털 인문학 지원단(ODH, Office of the Digital Humanities)의 연구비 지원을 비롯하여, 맥아더 재단(MacArthur Foundation)의 HASTAC Digital Media and Learning Grants, 구글(Google)의 Digital Humanities Research Awards, 앤드류 맬론 재단(Andrew Mellon Foundation)의 디지털화 프로젝트 지원 사업 등이 미국의 대학 사회에서 디지털 인문학 연구가 급진적으로 확산되는 계기를 마련하였다.5) 영국의 경우, 학술연구 지원 기구인 예술인문연구회(AHRC, Arts and Humanities Research Council)와 경제사회연구회(ESRC, Economic and Social Research Council)의 지원에 힘입어, 옥스퍼드, 케임브릿지, 런던, 셰필드 대학 등이 유럽 디지털 인문학의 선도적인 모델이 되는 연구결과물을 산출하고 있다.

 

미국의 주요 디지털인문학 성과물로는 문서 인코딩의 표준을 제시한 TEI(Text Encoding Initiative)와 동적인 문서편집시스템을 구현한 XTF(eXtensible Text Framework)이 있다. 텍스트 입력을 통한 DB 구축에서는 미국국회의 American Memory나 Online Catalog와 CADAL(China-America Digital Academic Library), Project Gutenberg등이 존재한다. 국제적인 협력사업으로는 International Dunhuang Project가 있다. 현재 각 분과별로 GIS, CAD모델링, 멀티미디어 등의 활용방안에 대한 연구가 활발히 이루어지고 있다.

 

미국의 디지털인문학 학회는 기존의 ALLC(The Association for Literary and Linguistic Computing), ACH(the Association for Computers and the Humanities), SDH/SEMI(the Society for Digital Humanities/Société pour l'étude des médias interactifs)가 합쳐져 ADHO(The Alliance of Digital Humanities Organizations)가 만들어졌고, ADHO에서는 정기적으로 Digital Humanities conference을 개최하고 있다.

 

 


타이완의 디지털 인문학

타이완의 디지털 인문학은 종교단체를 중심으로 한 민간에서도 종교연구와 대중화의 목적 아래 불교규범자료데이터베이스(佛學規範資料庫, Buddhist Authority Database Project)가 구축으로부터 시작되었다. 불교규범자료 데이터베이스는 비록 불교에 집중되어 있지만, 한중일의 시간정보데이터와 인명데이터 및 지명 데이터를 통합적으로 구축하고 사용자들에게 공개함으로써 디지털 인문학 방법론을 통한 연구의 기폭제가 되었다.

 

1998년부터는 정부의 강력한 디지털 인문학 지원 정책 아래 중앙연구원(中央研究院)과 국립타이완대학교(國立台灣大學)가 중심이 되어서 연구활동을 진행하고 있다. 타이완의 디지털 인문학은 국가의 주도 아래 디지털 주요문헌 관리 시스템 참고 플랫폼, 작명시스템과 분석식 검색, 디지털 물체와 당안 형식, 멀티미디어와 디지털화 참고 프로세스, 디지털 주요문헌 서비스 시스템 및 다국어 서비스등의 6개 부문의 표준안을 제시되고, 중앙연구원에 의하여 타이완의 모든 디지털 인문학의 기술적인 부분을 지원하는 강력한 통합관리 시스템을 구축하게 된다. 주제범위 또한 동물, 식물, 지질, 인류학, 당안, 측량학, 금석탁편, 선본고적, 고고학, 기물, 서화, 신문, 영상음악, 고전적 및 건축물등 다양한 방면으로 확장되어 연구가 진행되었다. 또한 서양학계와의 다양한 학술적 교류를 통하여 아시아 디지털 인문학 연구의 중심으로 인식되고 있다.


타이완의 디지털 인문학 정책은 1998년 5월의 “디지털 박물관 전문안건 계획(數位博物館專案計畫)”으로 시작되어서 지속적으로 국가의 강력한 지원을 받고 있다. “디지털 박물관 전문안건 계획”은 타이완 특색의 디지털 박물관을 구축한다는 목표로 교육 기능을 함양한다는 실험적인 속성을 가지고 있었다. 또한 2000년 7월  행정원은 “국가 주요문헌 디지털화 계획(國家典藏數位化計畫)”을 수립하고, 2001년 1월 1일부터 국가고궁박물원, 국가도서관, 국립역사박물관, 국사관타이완문헌관, 국립자연과학박물관, 국립타이완대학교 및 중앙연구원 등의 7개 기관의 참여 아래 “국가 주요문헌 디지털화 전문안건 계획”을 시행한다. 1998년부터 2002년의 단계는 타이완의 디지털 인문학에 대한 실험적인 정책 단계이다. 


2002년 5월 천수이볜(陈水扁) 총통의 강력한 지원 아래 타이완 행정원은 “도전2008: 국가발전중점계획(2002 - 2007)(挑戰2008:國家發展重點計畫(2002-2007))”을 의결하게 된다. “도전2008: 국가발전중점계획”에 따라서 기존의 “디지털 박물관 전문안건 계획”과 “국가 주요문헌 디지털화 계획”은 통합한 “디지털 주요문헌 국가형 과학 계획(數位典藏國家型科技計畫)”(http://wiki.teldap.tw/index.php/數位典藏國家型科技計畫)을 집행하게 된다.  “디지털 주요문헌 국가형 과학 계획”은 타이완의 과학기술 발전의 최고책임기관인 행정원 국가과학위원회에서 주관을 하며 교육부, 경제부, 문화부의 차장급 및 중앙연구원, 국립자연과학박물관, 국립고궁박물원, 국립타이완대학, 국립역사박물관, 국사관, 국사관타이완문헌관, 국가도서관 및 타이완성자문위원회 등 9개 관련 기관장들의 이사회(指导小组)을 구성하여 계획에 힘을 실어주었다. 


디지털 주요문헌 국가형 과학 계획은 주제범위로는 동물, 식물, 지질, 인류학, 당안, 측량학, 금석탁편, 선본고적, 고고학, 기물, 서화, 신문, 영상음악, 고전적 및 건축물등 다양한 방면으로 확장되어 연구가 진행되었다. 또한 기술적으로는 디지털 주요문헌 관리 시스템 참고 플랫폼, 작명시스템과 분석식 검색, 디지털 물체와 당안 형식, 멀티미디어와 디지털화 참고 프로세스, 디지털 주요문헌 서비스 시스템 및 다국어 서비스등의 6개 부문의 표준안을 제시하였다. 이로서 타이완 디지털 인문학 발전을 위한 토대가 마련되었고, 디지털 인문학에 대한 관심이 대폭적으로 상승하게 되었다. 


1기 디지털 주요문헌 국가형 과학계획의 성공과 국제적으로 유네스코의 세계기록유산 프로젝트(UNESCO Memory of the World)(http://www.unescomow.org.nz/) 이나 미국 기억 프로젝트(American Memory)(http://memory.loc.gov/) 및 유럽의 유로피아나(Europeana) 계획(www.europeana.eu)의 자극을 받아서 디지털 주요문헌 국가형 과학계획은 2기로 연장되었다. 2007년부터 시작된 2기 디지털 주요문헌 국가형 과학계획은  이는 ”타이완 디지털 주요문헌 확대 계획(拓展臺灣數位典藏計畫)”, “디지털 주요문헌 인문사회경제산업 발전 촉진 계획(推動數位典藏人文社會經濟產業發展分項計畫)” 및 “디지털 주요문헌 세계화 및 국제협력네트워크 촉진 계획(數位典藏海外推展暨國際合作網路推動分項計畫”을 통하여 1기의 성과를 종합하여 기존 주요 문헌에 대한 대대적인 디지털화 작업을 진행하는 한편, 디지털화 된 자료에 대한 응용방안에 대해서 연구 및 국제적인 협력을 강화하여 세계 각 국의 기관들과의 교류 확대을 모색하였다. 또한 “디지털 주요문헌 기술연구 개발 계획(數位典藏技術研發分項計畫)”과 “디지털 주요문헌 인터넷 핵심 플랫폼 계획(數位典藏網路核心平台分項計畫)”을 통하여 디지털 인문학의 실제적인 운영기술에 대한 연구를 진행하였다.


한편 2003년부터 행정원 국회를 통해서 국가경쟁력을 향상시키기 위한 디지털 도구를 이용한 교육이라는 목표 아래 “디지털 학습 국가형 과학 계획(數位學習國家型科技計畫)”을 실행하였다. 디지털 학습 국가형 과학 계획의 목적은 유무선 네트워크를 통하여 디지털 교재를 활용한 디지털 교육을 확대 하여 지식경제시대에 국가 경쟁력을 향상시키고 국민에 대한 평생교육을 실현이다. 이를 위하여 “전국민디지털학습”, “디지털격차해소”, “행동학습교재개발”, “디지털학습 인터넷과학기지”, “디지털학습기술연구발전전망”, “디지털학습기초연구”, “정책과제 및 인재육성”의 하위 과제를 행정원과 경제부, 국방부, 교육부, 국립고궁박물관, 타이난현정부 등의 주요 정부기관들의 주도 아래 진행하게 된다. 


2008년 타이완 총통이 민주당의 천수이볜(陈水扁) 에서  국민당의 마잉주(马英九)로 정권교체가 된다. 그러나 이전 정권의 핵심 사업 중에 하나이던 타이완의 디지털 인문학에 대한 정책은 기존의 “디지털 주요문헌 국가형 과학계획”과 “디지털 학습 국가형 과학계획”을 통합한 “디지털 주요문헌과 디지털 학습 국가형 과학계획((數位典藏與數位學習國家型科技計畫)”으로 더욱 강력한 국가적 지원을 받게 된다. 정책 자체는 기존의 정책과 큰 차이는 없으나, 기존에 행정원에서 직할로서 계획을 관리하던 것을 중앙연구원이 주관이 되어서 연구적인 성격을 강화하고,  더욱 심도 깊고 다양한 하위 프로젝트을 설계함으로써 디지털 인문학의 심화를 목표로 하고 있다. 



 

중국의 디지털 인문학

중국에서는 디지털 인문학의 기초적인 단계인 디지털화에 대한 연구가 집중적으로 진행되고 있다.  특히 고전적에 대한 디지털화를 “고적DB화(古籍数字化)”의 이름으로 고적의 이용과 보호를 목적으로 출발하여 컴퓨터 기술을 통하여 언어문자와 도형부호를 컴퓨터가 인지할 수 있는 데이터부호로 전환하여, 고적의 검색, 고적서적목록DB화 및 고적전문DB화를 실현하여 고적문헌 정보데이타를 나타내기 위한 시스템구축작업으로 정의하고 연구를 하고 있다.


현재까지 중국의 인문정보학은 고적DB화을 중심으로 빠른 속도로 발달해 왔기에 도서관학회에서 주도적으로 디지털 인문학적인 성과를 보여주고 있다. 그러나 디지털화의 수준이 단순히 종이매체를 컴퓨터로 옮겨 놓는 수준으로서, XML 기술등을 활용한 인명이나 지명등의 고유명사에 대한 태킹 작업조차 이루어지지 않고 있다. 또한 GIS나 e-R&D등을 활용한 심도 있는 디지털 인문학 프로젝트가 초보적인 수준에 머물고 있다. 실제로 디지털 인문학을 위한 학회는 존재하지 않는 상태이며, 2011년에 무한대학교(武漢大學)에 디지털 인문학 연구센터(数字人文研究中心)가 생긴 것이 유일하다. 


중국의 디지털 인문학은 민간을 중심으로 발달해왔다. 민간에서 두 가지 큰 줄기에서 성과를 보이고 있다. 우선 해외기관과의 협력을 통한 디지털 인문학 연구 시도이다. 특히 하버드 옌칭 연구소와의 협력을 통한  복단대학교의 중국역사GIS(China Historical GIS, CHGIS, 中国历史地理信息系统)(http://www.fas.harvard.edu/~chgis/)와 북경대학교의 중국인물 데이터베이스 프로젝트(Supporting Documents § China Biographical Database Project (CBDB), 中國歷代人物傳記資料庫(CBDB))(http://isites.harvard.edu/icb/icb.do?keyword=k35201) 등은 세계적인 디지털 인문학 모델로서 주목 받고 있다. 그러나 두 프로젝트 모두 디지털 인문학적인 기획과 자금 및 기술이 하버드 옌칭 연구소에서 나왔으며, 복단대학교와 북경대학교는 단순히 데이터를 입력하는 단순작업과 활용하는 실험대상으로 사용되었을 뿐이다. 다시 말해서 중국역사GIS나 CBDB 모두 중국의 디지털 인문학 성과라기 보다는 미국의 디지털 인문학 성과라고 보는 편이 합당하다.


중국 디지털 인문학의 다른 큰 줄기는 도서관학(문헌정보학)에서 추구하는 디지털화 작업이다. 상해도서관은 고전선본전문CD화 프로젝트를 실시하여, 1996년 말 중국고적선본열람ㆍ검색시스템(中国古籍善本查阅系统)을 통하여 모든 전문영상과 일부분의 전문검색을 지원하였다. 요령성도서관은 IBM의 TDI 디지털카메라를 이용하여 고적에 대한 DB화를 진행하였다. 1998년에 국가도서관에서는 중국디지털도서관 프로젝트(中国数字图书馆工程를 시작하여 지방지DB, 석비탁본DB, 갑골문헌DB, 각종문헌서적목록DB, 영락대전DB등의 6개 프로젝트를 진행하였다. 그 외에도 20여개의 고적전문DB화 프로젝트가 진행되었는데, 그 중에 비교적 대표적이라고 할 수 있는 것은 상무인서관(商务印书馆)의 백납본24사 디지털 CD(百衲本《二十四史》电子版光盘)와 중국지방지송대인물자료관리시스템(中国地方志宋代人物资料管理系统), 속자치통감장편전문검색시스템(续资治通鉴长编全文检索系统), 전당시전자검색시스템(全唐诗电子检索系统) 및 2종류의 고금도서집성(古今图书集成) 등을 들 수 있다.


특히 상징적인 성과로는 문연각사고전서 디지털버전(文渊阁四库全书电子版)(http://www.sikuquanshu.com/)이 있다. 1998년 말, 상해인민출판사(上海人民出版社)와 홍콩적지문화출판사(香港迪志文化出版社)는 <문연각사고전서 디지털버전(文渊阁四库全书电子版)>에 출판되어 부단한 업그레이드를 거쳐서 2007년 3.0버전까지 발표된 상태이다. <문연각사고전서 디지털버전(文渊阁四库全书电子版)>는 unicode과 OCR기술 및 전문적인 교감소스프웨어를 사용하여 다양한 OS에서 구동 가능한 제작기술, 전문검색기술을 선보였다.


또한 중국기본고적고(中国基本古籍库)(http://www.er07.com/product.do?method=findproById&productId=30)는 북경대학교를 중심으로 전국의 각 대학교들이 참가해서 만들어낸 중국정부에 의한 대규모 고적DB화 프로젝트이다. 선진시대부터 중화민국시대까지(BC11세기부터 20세기 초)까지의 역대 서적 1만 여종, 16만여 권을 전산화시켰다. 사실상 현재 나온 대부분의 고적의 전문과 1∼2개의 영인을 제공합니다. 총합 17억 자, 판본 1만 2천여 개, 영인 1천여만항목에 이르며 용량만 320G을 넘었다. 이는 <문연각사고전서(文渊阁四库全书)>의 3배에 해당한다. 그러나 사고전사나 기본고적도 모두가 XML을 이용한 디지털화가 아닌 단순히 전자 Text을 만들어서 검색기능을 지원하는 수준이며, 상업적인 판매을 위하여 데이터베이스를 공개하지 않고 있기에 디지털 인문학 연구를 위한 토대로서는 부적절하다.


중국 정부도 1998년부터 디지털 도서관 프로젝트(电子图书馆工程)을 통하여 주요문헌의 디지털화 작업을 전개하고 있다. 2002년부터는 중국과학데이타연구소(中国科学信息研究所), 중국과학원문헌정보센타(中国科学院文献情报中心) 및 중국국가도서관(中国国家图书馆)은 국가차원에서 국가데이타도서관표준규범(国家诸子图书馆标准规范)을 제정하려 시도하였고, 2004년에 <디지털도서관표준규범-전문데이타대상에 대한 메타데이타묘사규범数字图书馆标准规范-专门数字对象描述元数据规范>을 통하여 국가표준안을 발표하였다. 또한 2000년대 중반부터는 사고전서와 기본고적고에 대한 인문학자들의 지대한 관심과 타이완의 디지털 인문학의 발전에 자극을 받아 중국의 디지털 인문학 발전을 위해서는 우선적으로 기존 보유 자료들에 대한 명확한 현황 파악 및 목록 데이터베이스 구축을 필요하다는 요구에 따라, 2007년부터 문화부 산하 중국국가도서관 주관으로 전국고적일제조사(全国古籍普查)(http://pcab.nlc.gov.cn/initialIndex.action)를 진행하고 있다. 현실적으로도 타이완이 80년대에 이미 보유한 고적들에 대한 정리작업을 완료한 것에 비하여, 중국은 아직도 보유한 문헌에 대해서도 파악하지 못하고 있다. 기초적인 토대 작업 조차 이루어지지 않은 상황에서 새로운 방법론인 디지털 인문학을 도입하는 것은 아직 시기상조라고 할 수 있다. 


중국은 초보적인 디지털 인문학 발전단계를 밟고 있다. 전체적으로 디지털 인문학에 대한 관심이 다른 나라에 비하여 부족한 상태이며, 차세대 디지털 인문학 연구를 위한 발전 계획도 전무한 상태이기에 향후 10년 동안은 국제적인 협력을 통한 자료 제공 수준의 성과 이외에는 디지털 인문학 영역에서 두각을 나타내기 어려울 것이고 보인다. 




일본의 디지털 인문학

일본의 디지털 인문학 연구는 영미권의 영향 속에 연구기관을 중심으로 진행되고 있고, 정부의 주도적인 정책은 아직 보이지 않고 있다. 민간에서 주요문헌에 대한 개별적인 디지털화 작업이 진행되고 있지만, 소규모 프로젝트성으로 큰 영향력을 미치지 않고 있다. 다만 <대학구조개혁의 방향>을 기초로 추진되고 있는 2002년 문무과학성의 21세기 COE 프로그램(21世紀COEプログラム, The 21st Century Center Of Excellence Program)(http://www.jsps.go.jp/j-21coe/)에서 디지털인문학 거점으로 선정된 리츠메이칸 대학(立命館大学, Ritsumeikan University)(http://www.ritsumei.jp)은 디지털인문학 센터 수립을 통하여 연구를 지원하고, 디지털 인문학적 방법론을 교육을 통해서 차세대 디지털 인문학 연구인력을 양성하고 있어 주목할 만하다.


리츠메이칸 대학교는 일본문화 디지털 인문학 거점(日本文化デジタル・ヒューマニティーズ拠)(http://www.arc.ritsumei.ac.jp/lib/GCOE/)을 통하여 일본문화데이터베이스 구축, 디지털 아카이브 기술 연구, 지리정보시스템 융합연구등의 일련의 디지털 인문학 연구를 진행하고 있으며, 소방방재청이나 지역정부와 연계하여 조망곤강 보전구역 검색(眺望景観規制検索WebGIS)(http://www.geo.lt.ritsumei.ac.jp/webgis/keikan/)이나 역사도시 교토의 안심안전 3D맵(歴史都市京都の安心安全3Dマップ)(http://www3.rits-dmuch.jp/anshinanzen/)의 실용기술 연구에도 투자하고 있다. 한편 학부과정부터 디지털 인문학 방법론에 대한 교육을 통하여 차세대 인재 양성에 힘 쓰고 있다. 


도쿄대학교도 디지털인문학 융합교육프로그램(http://dh.iii.u-tokyo.ac.jp)을 마련하고 대학원 학생들이 자유롭게 참가하여 이수함으로써 대학원생들의 디지털 인문학 소양을 함양시키고 있다. 교육 과정에는 디지털 인문학 개론부터 시작하여 아카이브 구축, 데이터 마이닝, 멀티미디어, 저작권법 등 디지털 인문학에 대한 다방면의 심도 있는 교육과정을 제공하여 대학원생들의 다양한 디지털 인문학에 대한 관심을 만족시켜주려 하고 있다. 






「문화기본법」은 형행의 문화 또는 문화예술과 관련된 법률은「문화예술진흥법」, 「문화예술교육 지원법」, 「문화산업진흥 기본법」 등 주로 문화예술 창작자나 사업에 대한 지원과 청소년 교육 및 관련 산업 진흥에 치우쳐 있어, 국민이 마땅히 누려야 할 문화적 권리에 대해서는 소홀한 측면이 있었는바, 국민의 문화향유를 장려하고 문화의 가치를 사회영역 전반에 확산시켜 국민의 삶의 질을 높이며, 문화격차 해소를 통해 국민 모두가 문화로 행복한 사회적 분위기를 조성하기 위하여 국민의 문화적 권리와 국가의 책무 등을 명시하는 법률을 제정의 필요성이 있었기 때문이다.


문화기본법(전문링크)


아직 포괄적인 내용을 설정해놓았을 뿐 구체적인 내용은 지켜보아야 할 것이다. 다만 개인적으로 주목하는 대목은 「문화기본법」의  제11조(문화 진흥을 위한 조사·연구와 개발)부분이다. 


 제11조(문화 진흥을 위한 조사·연구와 개발) ① 국가와 지방자치단체는 국민의 삶의 질 향상과 지역 간 문화 격차의 해소를 통한 국민의 문화 향유권의 확대를 위하여 문화 향유와 관련한 실태조사와 관련 조사·연구를 시행하여야 한다.

② 국가와 지방자치단체는 문화 진흥을 위하여 문화정책의 조사·연구와 개발을 장려하고 그 지원 시책을 강구하여야 한다.

국가와 지방자치단체는 대통령령으로 정하는 바에 따라 문화정책을 전문적으로 조사·연구·개발하는 전담기관과 이를 지원하는 문화정보화 전담기관을 지정하여 운영할 수 있다.



과연 지정 문화정책 전담기관, 문화정보화 전담기관은 누가 될 것인가? 

장담하는데...지정 기관은 향후 어마어마한 힘을 가지게 될 것이다. 

문화의 시대. 그 방향키를 누가 쥐게 될 것인가?!

블로그에 자유롭게 쓴 글인데 생각보다 논문에 인용이 되서 당황스러운 심정이다. 개인적으로 블로그글도 학술적으로 사용할 수 있다고 생각하지만, 실제 학계의 분위기를 모르는 것도 아니다. 이에 만약 본 글을 인용하시려거든 다음과 같이 인용하시면 될 것으로 보인다.(내용이 100% 일치하지는 않지만, 기본 개념은 동일하다)


김바로, 『시맨틱 데이터 아카이브의 구축과 활용』, 파주:보고사, 2018.12.10, pp.17~20


김바로, 『시맨틱 데이터 아카이브의 구축과 활용 - 제도와 인사의 관계에 대한 근대(1895~1910) 학교 자료를 중심으로』, 파주:보고사, 2018.12.10, pp.17~20


알라딘 링크


디지털인문학이 요즘 인문학계의 화두로 떠오르고 있다. 그러나 디지털인문학에 대한 정의조차 제대로 모르면서 "디지털인문학"을 악용하려는 사람들도 급증하고 있다[각주:1].  디지털인문학 관련 내용을 올리는 블로거로서 최소한의 정의는 소개해야된다는 쓸데 없는 의무감이 생겨버렸다. 




1. 디지털인문학이란 무엇인가?







디지털인문학은 인문학과 정보기술(ICT: Information and Communication Technologies)이 합쳐진 융합학문이다. 전통적인 인문학의 연구과정에 정보기술의 설계, 구축, 분석, 해석 및 시각화의 과정이 융합되어 탄생된 인문학의 새로운 방법론이며, 학문분과이다. 



2. 디지털인문학의 설계와 구축


우선 전통적인 인문학에서의 수집을 생각해보자. 우리는 역사 연구를 위해서 해당 시대의 사료를 수집하여 정리하였다. 고고학 연구를 위해서 직접 발굴을 해서 연구자료를 획득하고 정리했다. 물론 1차적인 자료 뿐만을 수집하고 정리한 것이 아니다. 해당 분야에서 과거의 연구 성과를 모아서 연구사 혹은 선행연구를 정리한다. 


1) 1차 자료 정리

2) 연구사(선행연구) 자료 정리


그런데 현재 인문학계는 과거에 비해서 거대해졌다. 과거에는 사서삼경과 관련 도서 몇 백권이 유일한 1차 자료였고, 연구사 자료였다. 그러나 현재는 조선전기 정치사를 전공했다면, 같은 조선전기시대임에도 불구하고 민속사 영역으로 가면 연구사조차 제대로 파악하지 못하는 경우가 비일비재하다. 역사학계 자체 내에서 이런 상황이니 다른 학문(정치학, 예술학)으로 가면 일자무식이라고 해도 빈말이 아닌 상황이다. 


현재 학계는 방대해진 연구 성과에 짖눌려 있다. 현재 인문학의 가장 큰 숙제는 과거와는 상대도 되지 않는 방대한 자료의 처리 방법이라고 할 수 있다. 이제 일개 개인의 힘으로 단일 학문의 모든 연구자료와 연구사를 검토하는 것조차 불가능한 상황을 어떻게 타개할 것인가?! 정보기술이 현재로서는 유일무이한 해답이다. 

1) 정보기술을 활용하여 1차자료와 연구사를 수집-정리

2) 정보기술을 활용하여 개인에게 필요한 1차자료와 연구사를 제공

 

실제로 유럽의 모든 문화유물의 데이터를 총망라한 "유로피아나"나 미국 관련 모든 자료를 디지털화한 "아메리카메모리"와 같은 서양의 디지털 인문학 프로젝트를 통해서 정보기술을 활용하여 인문학을 어떻게 수집-정리 할 수 있는지 알 수 있다. 사실 멀리 볼 것도 없이 "조선왕조실록"이나 "한국역사정보통합시스템"만 하더라도 세계에 내놓아도 부끄럽지 않은 성과이다. 그리고 이렇게 "잘" 정리된 자료는 자연히 개인에게 방대한 정보에서 자신이 필요한 정보에 빠르게 접근할 수 있는 정보기술을 활용한 방법론도 제공하고 있다. 


쉽게 생각해보자. 디지털화된 논문정보를 제공하는 DBPIA나 KISS 혹은 RISS을 통해서 우리는 얼마나 빠르고 정확하게 원하는 논문을 검색하게 되었는가?! 이제 논문 뿐만이 아니라 인문학 자체를 디지털 자료로 이식하면 어떤 효과가 있겠는가?! 


그런데 아날로그의 지식을 컴퓨터가 이해 가능한 데이터로 변환하기 위해서는 아날로그의 지식 체계를 컴퓨터에게 알려주는 작업이 필요하다. 이를 데이터 설계 혹은 온톨로지 구축 작업이라고 할 수 있다. 그런데 인문학 영역 아날로그의 지식 체계는 디지털 영역의 전문가들에게 접근이 힘들거나 사실상 불가능한 영역이다. 그렇기에 대상 지식 체계를 파악하고 있는 인문학자의 힘이 필요하다. 






3. 디지털인문학의 분석(디지털 추론)

역시 전통적인 인문학에서의 분석을 생각해보자. 우리는 수집된 자료를 이용해서 분석하고 기존의 자료 이상의 내용을 추론해낸다. 조선시대의 복식을 재현해내고, 조선시대의 음식을 재현해낸다. 사회의 구조를 파악하고, 인류에게 최선인 사회 구조가 무엇인지를 예측한다. 


그런데 과거에 비하여 기가급수적으로 늘어난 연구성과들을 모두 파악하는 것조차 쉽지 않은 일이 되었다. 아무리 디지털화된 자료를 이용해서 최대한 빠르게 자료를 수집-정리할 수 있다고 하여도 개인의 힘으로는 방대해진 데이터를 파악하고 분석작업을 수행하는 것이 쉽지 않다. 어떻게 하면 개인의 분석능력을 향상시킬 수 있을까? 인간의 수명을 늘려야 하나? 게놈인간을 만들어서 지능을 올려야 하는가? 현재 가장 타당한 해법은 정보기술을 활용한 "디지털 추론"이다.


사실 "디지털 추론"은 이미 상업 영역에서 활발하게 사용되고 있다. 방대한 고객 데이터를 일정한 알로리즘(논리)을 통해서 맞춤형 마케팅을 하고 있다. 인터넷 서점으로 유명한 아마존 닷컴은 수 많은 고객데이터를 컴퓨터를 활용하여 실시간으로 분석하고, 해당 고객이 구매한 물품을 토대로 구매 가능성이 높은 물품을 추천하고 있다. 우리가 요즘 자주 말하는 "빅데이터"의 동반자인 "데이터 마이닝"이다. 




혹자는 정보기술이 모든 분석을 수행하면 더 이상 학자가 할 일이 없어지는 것은 아닐까 걱정할지도 모른다. 그러나 정보기술은 수백만의 데이터를 빠른 속도로 알고리즘(논리)에 의해서 처리하는 기술을 제공할 뿐이다. 분석방법인 알고리즘(논리)는 인간의 판단을 기다릴 뿐이다. 


실제로 인문학의 영역중에서 언어학과 사회학에서 "디지털 추론"방법을 많이 사용하고 있다. 말뭉치(코퍼스) 분석은 방대한 언어데이터를 분석하여 유의미한 결론을 유추하고 있다. 물론 정보기술 없이 개인이 언어데이터을 통해서 유의미한 결론을 유추할 수도 있다. 인간의 수명이 백만년정도 된다면 말이다. 사회학에서는 "네트워크 분석"을 통해서 다양한 관계망 분석을 시도하였고, 사회의 구조를 밝히는데 상당한 효과를 발휘하고 있다. 물론 최근에는 SNS 분석이나 의미망 분석과 같은 응용도 활발하게 이루어지고 있다. 


사실 디지털화는 어디까지나 디지털 추론을 위한 자료수집에 불과하다. 

어떤 인문학자가 자료 수집-정리만을 하고 분석이 필요 없다고 할 것인가?! 



4. 디지털인문학의 해석

분석은 연구 대상을 자르고 나누는 행위를 말한다. 다시 말해서 연구 대상에 대한 모든 자료를 다양한 방법을 통하여 수치화하는 방법론을 말한다. 그 동안 기존 인문학에서 분석과 해석을 구분하지 않고는 하였다. 실제로 대부분의 경우 한 명이 자료를 수집하고, 분석하여 해석하고 있었기에 구분이 무의미하였다. 그러나 전문화된 현대의 학문에서 "수치화"의 분석과 "의미부여"의 해석은 분명히 구분되어야 할 것이라고 생각된다. 


그런데 디지털인문학의 해석 영역은 대부분 기존 인문학에서 몇 천년동안 정립해 온 해석 방법론을 승계하고 있다. 디지털인문학은 어디까지나 디지털에서 수행하는 인문학 연구 방법론이며, 그 동안 기존 인문학이 해석에 "매몰"되었던 것을 탈피하고, 일정 이상의 자료와 분석결과를 통한 근거를 마련하기 위해서 강조되고 있다고 말할 수도 있을 것이다. 다시 말해서 디지털인문학은 범용 방법론으로서 가치를 가지고 있지만, 그렇다고 기존 인문학 방법론의 다양한 해석 방법론들을 폐기하는 것은 결코 아니다. 


반대로 디지털인문학은 새로운 해석 방법론에 그다지 큰 관심을 보이지 않는다. 그 동안 축적되어 온 기존 인문학의 해석 방법론을 재활용하는 것으로도 충분하기 때문이다. 그렇기에 디지털인문학에서는 해석의 영역을 그다지 크게 강조하지는 않는다. 그러나 그렇다고 해석이 중요하지 않다는 것은 아니다. 


(기존 글에서는 해석 영역에 대해서 서술하지 않고, 오프라인의 강의에서만 부과적으로 설명을 했더니 오해하시는 분들이 있어서 추가했습니다.)




5. 디지털인문학의 시각화

역시 전통적인 인문학에서의 출력을 생각해보자. 우리는 정리된 글을 논문발표, 서적출판 등의 형식으로 출력하였다. 심지어 최근에는 논문과 서적 모두가 이미 디지털화되어서 프린트를 통해서 출력되고 있다. 그런데 어차피 이미 디지털화된 것을 굳이 다시 종이 매체로 만들 필요가 있는가? 연구성과를 실시간으로 공유하여 인간의 지식영역을 빠르게 확장할 수는 없을까?


그래서 특히 인문학의 고유 관심자인 교육의 영역에서 상당히 많은 방법론의 모색이 있다. 정보기술을 통해서 우리는 시간과 공간의 장애를 벗어나서 교육자료를 제공해줄 수 있기 때문이다. 한국에서 인기를 끈 "정의란 무엇인가?"는 하버드 대학교의 강좌가 온라인을 통해서 언제 어디서나 볼 수 있었기에 한국에도 알려졌고 큰 인기를 끌게 되었다는 사실은 이미 유명하다. 한국에서 중고등학생의 기본 옵션이 되어버린 인터넷강의(인강)도 강사가 한 번의 촬영을 통해서 수 많은 학생에게 정보를 전달할 수 있게 해준다. 



물론 디지털 인문학의 출력에서 교육이라는 목적이 강조되고 있으며, 현재로서 가장 성공적인 수단이 인터넷 동영상 강의인 것은 맞다. 그러나 강의는 하나의 지식체계에 대한 전달 방식으로서 유용하다면, 단일 지식 혹은 특수한 지식의 전달 방법에 대한 다양한 시각화의 방법도 끊임 없이 모색되고 있다. 


예를 들어서 모든 의복에 대한 데이터를 모아놓고 분석을 하였더라도 관련 연구자나 사극 작가가 해당 데이터에 손쉽게 접근할 수 없다면 어떻게 쓸모가 있을 수 있겠는가? 데이터를 모으고 분석하는 방법 뿐만이 아니라, 성과를 어떻게 효율적으로 다양한 계층에게 전달하느냐도 인문학의 중요한 목적 중에 하나이다. 




6. 디지털인문학에 대한 오해

본인이 가장 걱정되는 것은 디지털 인문학을 어느 특정 인문학 분야가 선점을 해서 마치 특정 인문학 분야의 방법만이 디지털 인문학의 전부라고 착각하는 것이다. 디지털 인문학의 수집은 현재 문헌정보학이나 기록학에서 선도하고 있고, 디지털 인문학의 분석은 언어학과 사회학에서 선도해가고 있다. 그리고 디지털 인문학의 출력은 교육학의 영역에서 선도해가고 있다. 그리고 각각은 모두가 "디지털 인문학"이라는 이름을 붙이고 있다. 


문헌정보학, 기록학, 언어학, 사회학, 교육학에서 다루고 있는 새로운 방법론은 분명히 디지털 인문학이다. 그러나 착각하지 말아야 될 것은  단순히 디지털화만 잘한다고 디지털 인문학이 아니다. 디지털 인문학의 일부일 뿐이다. 디지털 분석만을 잘한다고 디지털 인문학이 아니다. 디지털 인문학의 일부일 뿐이다. 단순히 시각화를 잘한다고 디지털 인문학이 아니다. 디지털 인문학의 일부일 뿐이다.


디지털인문학은 데이터설계-데이터구축-분석-해석-출력의 모든 것을 아우르는 종합학문분과이다.







  1. 디지털만 붙이면 사람들이 무조건 좋게 봐줄 것이라고 생각했나?!....허허허.... [본문으로]



보다 구체적인 내용은 : http://www.dbguide.net/da.db


한국 최초의 국가공인 데이터 분석 전문가 시험이다. 분석 전문가의 경우는 경력/학력 기준이 있기에 반드시 참고하시기 바란다. 준전문가는 요구 조건이 없다. 한국에서 그 동안 개인의 노력으로 데이터 분석을 공부하고 인정 받았던 것을 이제는 국가에서 표준화된 방식으로 인정을 해주겠다는 의도는 추후 데이터 분석쪽의 발전에 분명히 도움이 되리라 생각한다.


그런데 몇 문항 되지도 않는 시험을 진행하면서 전문가는 8만원, 준전문가는 5만원이나되는 응시료는 너무 비싼 것이 아닌가 싶다. 물론 전문가 시험의 경우 실기가 있으니 이해할만하지만, 땅랑 50문제 필기 시험만 보는 준전문가가 왜 5만원이나 받는지 모르겠다. 참고로 공식수험서인 2014 데이터 분석 전문가 가이드도 5만원으로 비싸다.


무엇보다...아직 해당 자격증이 얼마나 업계에서 인정받을지는 미지수이다. 원래 IT계열이 자격증을 그다지 인정하지 않는 분위기인데 이제 1회인 시험을 봐야할 가치가 있을 것인가?! 그냥 심심풀이로 볼까?!


+ Recent posts