모든 학문은 선현들의 수 많은 성과를 바탕으로 발전한다. 그렇기에 기본적으로 어떤 논문에도 선행연구에 대해서 서술하도록 되어 있다. 다시 말해서 학문성과의 축적은 모든 학문의 기본 중에 기본이다. 


그러나 한국의 학문성과축적은 상당히 방대하며 빈약하다. 방대하다고 하는 이유는 한국연구재단 등의 국가기관이나 각 대학들이나 연구소등의 사립기관들이 예산을 투여해가면서 수 많은 학문성과를 축적해왔다. 빈약하다는 이유는 축적된 데이터는 데이터허깅으로 인하여 어디까지나 해당 기관이나 개인이 소장하고 있을 뿐 다른 이와 공유되지 못한다. 또한 길어봐야 10년에 불과하고 대부분이 3년도 되지 않는 프로젝트 수행기간은 지엽적인 주제의 데이터의 축적을 할 수 밖에 없게 한다.


디지털인문학은 축적된 학문성과의 공유문제와 짦은 수행기간으로 인한 지엽적인 주제의 데이터생산문제의 탈출구로 온톨로지를 제안한다. 


데이터 공유 문제에서는 이미 정부 3.0으로 인하여 데이터 보유 기관들이 현실적인 압박을 받고 있기에 5년내로는 공유되는 데이터의 양 자체에서는 상당한 성과를 보일 수 있다고 생각한다. 그러나 정리되지 않고, 타인이 알아볼 수 없는 데이터는 자원낭비이자 쓰레기일 뿐이다. 온톨로지를 통하여 초기 프로젝트 단계부터 데이터를 정비하여야 한다. 인문학자 자신이 데이터를 만들면서 데이터를 정비해야 한다는 말이다. 어떤 컴퓨터 공학자가가 해줄 수 있으리라는 것은 착각이며, 오해이다. 컴퓨터 공학자는 어디까지나 컴퓨터 공학쪽으로 잘 알 뿐이고, 인문학자들이 생산하는 인문학 데이터에 대해서는 일자무식에 가깝다. 못한다. 해도 엉터리다[각주:1]


짦은 수행기간으로 인한 지엽적인 주제의 데이터 생산 문제 역시 온톨로지을 통해서 해결할 수 있다. 단일 프로젝트는 짦은 수행기간과 적은 인력으로 인하여 지엽적인 주제에 한정될 수 밖에 없다고 하더라도, 온톨로지를 통해서 다른 프로젝트의 성과와 연결될 수 있다면 별 문제가 없다. 오히려 단일 프로젝트의 전문성을 확장하고, 전체적인 맥락에서는 인문학 빅데이터를 구축하는 방법이 될 것이다. 물론 짦은 수행기간 자체와 적은 예산으로 인한 인력문제에 대한 근본적인 수정이 있으면 좋겠지만......


이미 2012년부터 한국연구재단에서도 토대 사업을 대상으로 적합한 XML이나 RDB 형식의 데이터를 제출하도록 하고 있다. XML이나 RDB 설계 모두가 넓은 범위에서 온톨로지의 일부분이라도 할 수 있다. 이제 인문학 프로젝트를 하려고 해도 온톨로지를 해야되는 세상인 것이다. 그런데 온톨로지는 인문학에서 태어난 개념이기에 인문학자들이 오히려 컴퓨터 공학자들보다 손쉽게 배우고 자유롭게 활용하는 모습을 자주 본다. 다시 말해서 온톨로지라는 기술에 밑도 끝도 없는 두려움만 가지지 않는다면 인문학자들이 온톨로지를 다루는데 어떠한 문제도 발생하지 않는다. 








바로 : .....생각나는대로 쓰윽쓰윽~~ 카테고리가 잡담잡상~~ 우훗~ 머....몰라몰라~~ ^^::: (요즘 살짝 미쳐가고 있는듯 함.)


  1. 조금 다른 예이지만, "고구려왕조실록"으로 인물네트워크 분석을 한다면 어떻게 생각되는가?! [본문으로]

+ Recent posts