오늘 조원희 선생님과 저녁 식사를 하면서 우연히 예일대학교 졸업장 이야기가 나왔다.

예일대학교에서는 현대 영어로 된 졸업장도 있지만, "라틴어"로 쓰인 고풍스러운 졸업장도 존재한다.

 

그런데 문득 이런 생각이 들었다. 한국학중앙연구원 졸업장도 비슷하게 할 수 없을까? 물론 한국의 오래된 "대학"이라고 볼 수 있는 성균관도 딱히 "졸업장"의 개념이 없긴 하지만, 그래도 비슷하게 흉내 낼 수 있지는 않을까? 재미있는 기념물로 말이다.

 

과거 급제자에게 주었던 홍패 같은 형식으로 졸업장을 주는건 어떤가?

너무 한자 중심이라면, 홍패 형식에 언어는 옛한글로 해 보는 건 어떨까?

 

나름 평생 기억에 남는 "기념물"이 되지 않을까? 

 

 

(너무 블로그에 글을 안 올려서. 누가 봐도 잡담을 올려 본다~)

 

인터넷바둑에서 세계최정상 바둑고수들을 격파했던 의문의 존재는 결국 예상대로 진화한 "알파고" 였다. ("커제ㆍ박정환 꺾은 인터넷 '복면기왕' 정체는 알파고"(종합)) 알파고는 작년 이세돌 기사와의 대국 이후로 완전히 진화하여 최정상 프로기사를 상대로 60전 60승을 했고, 세간에서는 컴퓨터의 인류 점령 시나리오가 퍼져나오고 있다.


그러나 소위 "강한 인공지능"은 아직은 꿈과 같은 이야기이다. 현재 알파고에는 수 많은 최신 기술이 들어가 있지만, 본질적으로는 뛰어난 "계산기"이다. 비록 인류조차 "이성"이나 "자존"을 명확하게 규명하지 못하지만, 단순히 "계산이 빠른 것을 이성"이라고 정의하지는 않는다. 큰 틀에서 봤을 때 디지털의 영역에서 하드웨어적인 성장이 눈 부실 뿐, 알파고의 이론적인 배경, 다시 말해서 인공지능을 구축하는 이론적 배경은 사실 20년전과 그다지 큰 발전이나 변화는 없다. 


다만 "바둑"과 같이 비교적 단순한?! 프로세스의 일들은 분명히 인공지능이 인간을 대체하게 될 것이다. 그리고 인류는 이제부터 그에 대한 대비를 해야 한다. 어떻게 해야 할까?






알파고에게 쓴 맛을 본 중국 세계 1위 커제 9단은 자신의 웨이보에 위와 같은 글을 올렸다. 


"나는 3월부터 지금까지 반년 동안 바둑프로그램을 연구하였다. 수 많은 이론 구축과 실험은 컴퓨터의 강함이 어디에 있는지 알고 싶었기 때문이었다. 어제 밤새 계속 뒤척이며 한 숨도 자지 못하였다. 


인류의 수천년간의 실전을 통하여 바둑을 진화시켰다. 그러나 컴퓨터는 우리에게 인류가 틀렸다고 말한다. 나는 심지어 어떤 이도 바둑의 진리의 모퉁이에 조차 가지 못했다고 생각된다. 


그럼에도 나는 지금부터 시작이라고 생각한다. 우리 기사들은 컴퓨터와 힘을 합쳐서 완전히 새로운 영역으로 나아갈 것이다. 새로운 폭풍이 곧 불어 올 것이다. 나는 나의 모든 지혜를 다하여 이 싸움에 임하겠다."



일단 알파고는 어디까지나 수 천년간의 인류의 바둑 경험을 기보 데이터를 흡수하였다. 결코 인류의 수 천년간의 실전은 헛되지 않았다. 또한 컴퓨터 역시 인류가 수 천년간 축적한 지식의 결과물 중에 하나이다. 다만 이제는 인간이 연산능력의 영역에서 컴퓨터에 당할 수 없음을 인정해야 할 시대가 왔을 뿐이다.


무엇보다 중요한 것은 체스에서 그랬듯이 바둑도 이제 인간이 컴퓨터를 이길 수 없는 영역이 되었고, 체스와 같이 인류는 컴퓨터와 "같이" 가야 한다. 그리고 바둑 외의 모든 영역에서 컴퓨터와 같이 가지 않으면 바보가 되는 시대다. 어차피 영어조차도 컴퓨터가 자동번역을 하시는 시대로 돌입하기 시작했다. 이제 우리에게 필요한 것은 컴퓨터와 소통하기 위한 디지털언어이다. 다만 한국에서 시작하는 SW교육(코딩교육)에서 가르치는 "알고리즘"도 중요하지만, 그것만큼이나 "데이터"에 대해서도 깊이 고민해야 될 것이다. 




...오랜만에 글 쓰니 무슨 말을 하는지 모르겠다...어차피 낙서인걸...

.......박사논문 쓰다가 잘 안 풀려서....기분 전환으로 적어봄;;;;


시각적 인문학(Visual Humanities)은 인문학적 연구에서 구축한 인문학 데이터를 바탕으로 다양한 시각화 기술을 활용하여 인문 지식을 인지할 수 형태로 만들어 내는 행위의 총칭이다. 


문제는 시각화에 대해서 수 많은 사람들이 착각을 한다는 것이다. 시각화는 분석과 해석 과정을 거친 최종적인 연구 결과물을 인지할 수 있는 형태로 구현하는 행위만을 말하는 것이 아니다. 무슨 말이냐고? 전통적인 인문학 연구로 돌아가보자. 학술지와 저술을 출판하는 것은 지식의 시각화 과정이라는데는 이론의 여지가 없을 것이다. 


그런데 고대의 문헌자료를 영인하여 출판하는 것은 시각화인가? 


시각화이다. 문헌자료라는 지식을 인지할 수 있는 형태로 제공하고 있다. 그 뿐만이 아니라, 기존의 자료보다 접근성과 명확도를 높여서 보다 쉽게 인지할 수 있도록 하고 있다. 실제로 대부분의 인문학 연구는 영인본을 토대로 하여 진행되고 있지 않은가?! 영인 작업도 시각화가 정의하는 범위에서 벗어나지 않는 것이다.


디지털에서의 시각화도 아날로그에서의 시각화와 그 본질은 결코 다르지 않다. 디지털에서는 아날로그에서는 불가능한 효율성과 가능성을 보여주지만, 지식을 인지할 수 있는 형태로 제공하는 본질은 결코 변하지 않는다. 


그렇다면 디지털에서 분석과 해석의 과정을 모두 거친 최종 연구 결과물을 시각화하는 행위도 시각화이지만, 디지털에서 구축된 데이터를 보다 쉽게 인지할 수 있도록 하는 행위도 충분히 시각화라고 할 수 있다. 




그러니까...제발....ㅠㅠ


* 본 내용은 한국학중앙연구원 서소리 선생님의 의견을 참고하였습니다.


본 글은 모 에세이 공모전에 낼려고 마구잡이로 타자치다가 결국 그냥 폐기한 내용입니다. 아직 정리도 안되어 있지만, 블로그에 보존용으로 올려놓습니다. 뭐. 언젠가 몇몇 내용을 다시 쓸 일이 있겠죠. 

 

인류는 디지털을 통하여 새로운 도전을 하고 있다. 인류는 바퀴를 통해서 다리의 기능을 확장하였다. 이제 인류는 자동차를 이용하며 인류의 육신으로는 불가능한 속도로 이동할 수 있게 되었다. 인류는 다양한 에너지원을 통하여 소화기관의 기능을 확장하였다. 이제 인류는 기름을 통하여 인류의 육신으로는 불가능한 에너지를 생산하고 소비할 수 있게 되었다. 인류는 지금까지 자신의 육신을 다양한 방식으로 확장하였다. 그 과정에서 다양한 반발과 혐오 그리고 저주가 있었지만, 인류는 “발전”을 결코 포기하지 않았다.

 

그리고 현재 인류는 디지털에서 인류의 정신을 확장하고 있다. 컴퓨터가 발전하면서 인류는 최초로 인간의 정신을 확장하였다. 기존에 인류 고유의 것으로 자만하고 있던 지식을 저장하고 처리하는 능력에서 컴퓨터에게 패배와 좌절을 거듭하고 있다. 그렇다고 컴퓨터라는 새로운 지성의 존재를 무시하고 폐기하는 것은 인류의 발전 가능성을 포기하는 행위이다. 바퀴를 통해서 인류가 외적으로 변혁을 이룬 것처럼, 컴퓨터를 통해서 인류는 내적인 혁명을 이룰 수 있다. 이제는 컴퓨터와 어떻게 같이 살아갈 것이냐를 고민해야 될 시점이 온 것이다.

 

새 술은 새 부대에 넣어야 한다. 디지털 시대에는 디지털 시대에 적합한 인문학 연구와 교육이 필요한 것은 당연한 이치이다. 디지털의 강점은 따로 말할 필요도 없을 것이다. 마모나 질의 저하 없이 무제한 복사가 가능한 항상성, 비용의 추가 없이 자유롭게 정보를 추가-삭제-형태 변경 등의 가능한 변형가능성, 압축 기술로 축소-분산 저장을 저렴하게 이룩한 저장 보관의 편리성, 원형의 변화없이 재생 복원이 가능한 재생가능성이 대표적인 디지털의 강점이다.

 

그런데 정작 대부분의 사람들은 아직 아날로그에 첨착해 있다. 특히 인문학자들은 디지털 세계에서 단순히 아날로그의 문화를 강요하고 있는 디지털 이민 1세대의 역할을 충실히 하고 있다. 그리고 이민 1세대들은 디지털 세계에 더욱 익숙한 디지털 이민 2세대 혹은 디지털 현지인들과의 충돌은 피할 수 없는 현실이 되었다. 그리고 충돌의 본질적인 문제는 인문학자 스스로에게 있다.

 

인문학자들은 겁 먹고 있는 것이다. 디지털은 분명히 "새로운 것"이다. 이민자의 입장에서 비록 먹고 살기 위하여 어쩔 수 없이 디지털 세계로 이민을 하였지만, 오랜 시간 동안 몸에 베어 있는 습관을 바꾸는 것은 쉽지 않다. 새로운 것에 대한 본질적인 두려움은 이해할 수 있다. 그러나 그렇다고 이미 디지털 현지인이 된 새로운 세대에게까지 기존 아날로그 문화를 강요하는 것은 시대를 역행하는 행위에 불과하다.

 

인문학자들은 나태할 뿐이다. 디지털이 새로운 것이라고 하지만, 언제나 인류 지식의 한계를 돌파하려는 학자들에게 있어서 오히려 그 누구보다 먼저 도전해야 될 과제이다. 비록 정보공학에서 주도적으로 디지털 시대를 이끌었지만, 그 바탕은 결국 인간일 수 밖에 없고, 인간을 연구하는 인문학의 성과가 토대일 수 밖에 없다. 그런데 인문학자들은 자신들이 잘 알고 있는 것과 거리가 있다는 이유만으로 맹목적으로 디지털을 폄훼하거나 애써 무시하고 있다.

 

인문학의 연구 대상은 언제나 인간이다. 디지털 시대에도 인문학의 인간에 대한 끊임없는 탐구는 결코 멈추지 않는다. 다만 돌에 글을 쓰는 방법과 종이에 글을 쓰는 방법이 다르듯이, 디지털에서는 디지털 매체에 합당한 연구가 필요하다.

 

물론 아날로그의 중요성을 무시해서는 안 된다. 인간은 그 존재 자체가 디지털이 아닌 아날로그에 종속되어 있다. 또한 지금까지 이룩한 대부분의 인류 지식의 축적물은 아날로그를 기반하고 있다. 그러나 인간은 이미 디지털로 자신의 몸과 마음을 이식하고 있다. 아니. 인간은 아직은 육신은 아날로그에 귀속되어 있을 수 밖에 없지만, 정신은 언제나 아날로그를 벗어나 꿈을 꾸었다. 그것이 인간이 인간일 수 있었던 이유이다. 그리고 이제는 디지털에서 꿈을 꾸고 있는 것이다.

 

 

 

 

아날로그는 모호할 수 있지만, 디지털은 명확성을 기본적으로 요구한다.

 

학문을 모호성을 배제하고, 논리를 근거로 명징성을 부여하는 행위의 총칭이라고 한다면, 현재의 학문, 특히 인문학 영역은 시간에 대해서 매우 모호한 처리를 하고 있다.

 

아날로그는 본질적으로 모호성을 내재하고 있다. 해가 뜨면 낮이 되고, 해가 지면 밤이 된다. 설령 시계조차 아날로그에서는 대충 몇 분 몇 초라고 적당히 인지할 뿐이다. 물론 인간의 모든 삶이 정확할 필요는 없다. 개인의 선택에 따라서 정확성을 배제하고 시간에서 자유롭게 노닐 수 도 있다. 그러나 학문은 엄정성을 기반으로 한다. 조금이라도 정확하게 조금이라도 분명하게 하는 것은 학문의 필연적인 숙명이다. 그런데 현대 인문학은 과연 얼마나 정확한가?

 

아날로그는 디지털에 비하여 모호할 수 밖에 없다. 현대의 디지털도 100%의 정합성의 수준에까지 이르지는 못하였지만, 아날로그에 비하면 상대가 되지 못할 정도로 엄밀하다.

 

 

 

 

디지털이라고 하면 오류가 더 많을 것이라고 하는 착각이 아직도 존재한다. 디지털에는 분명히 수 많은 잘못된 정보가 존재한다. 그런데 아날로그 시대에는 부정확한 정보가 존재하지 않았던가? 실제로 독일어 위키와 독일어 브리테니커 백과사전을 비교 검증한 결과 위키가 압도적으로 낮은 오류율을 보였다. 디지털의 정보는 엄밀한 고증 작업이 생략되어 손쉽게 잘못된 정보가 올라오지만, 잘못된 정보에 대해서 손 쉽게 검색이 되기에 빠르게 고쳐진다. 그러나 아날로그의 정보는 최초 공개까지의 다양한 검증 장치가 마련되어서 비교적 안정적인 정보의 형태로 출현을 한다. 그러나 결코 "완전한 정보"로 출현할 수 없다는 것은 주지의 사실이다. 무엇보다 아날로그에서 한 번 공개된 정보에서 오류가 발생하였을 때, 손쉽게 수정하지 못한다. 그렇기에 오히려 비록 처음은 오류가 많을 수 있지만, 빠르게 정보가 공유되고 수정되는 디지털의 오류율이 현저히 낮은 것이다.

 

그런데 사실 아날로그나 디지털이나 인류의 지식을 담는 그릇에 불과하다. 인류는 지금까지 자신들의 지식을 축적하여 다음 세대로 계승을 하였다. 지식의 축적과 계승의 도구가 아날로그에서 디지털로 넘어간 것에 불과한 것이다.

 

 

아날로그는 다양성을 훼손하지만, 디지털은 다양성을 토대로 꽃을 피운다.

 

아날로그가 디지털에 비해서 다양성을 보장되고 있다는 말은 큰 착각에 불과하다. 고전 연구의 예를 들어보자. 과거 종이로 출력할 수 없었던 시절에는 특정 사료에 대해서 영인 등의 방식을 통하여 지식을 보존하고, 표점이나 주석과 같은 방식을 통하여 다양한 지식을 투영하였다. 그런데 아무리 영인을 한다고 하더라도 현대 초고화질 스캔에 비하면 지식을 온전히 보전하고 있다고 할 수 없다. 표점과 주석을 통하여 당대의 지식을 아무리 투영한다고 하더라도,

 

그 동안 인문학은 시간에 대한 탐구를 방기하다싶이 했다. 인문학에서 가장 시간에 대한 강박관념을 가지고 있는 역사학만 하더라도 시간에 대한 엄정한 연구를 하고 있지 않다. 과연 역사학에서 역사에 등장하는 사건이 발생한 시간에 대해서 명확하게 정의하는가? 아니다. 혹자는 조선중기, 근대기 등의 모호한 시간값을 당연하게 사용한다. 혹자는 문헌에 등장하는 연호와 같은 당대 시간값를 당연하게 사용한다. 

 

인문학에서의 시간은 지금까지 개별 연구자의 몫으로 남아 있었던 것이다. 어디까지나 개별 연구자가 스스로 다양한 참고자원 및 대상 연구를 통하여 머리 속에 정리를 해야된다. 그리고 새로운 연구자들은 기존 연구자들이 축적하여 각자의 방식으로 표현한 시간 표현을 스스로 정리해서 체계화 시켜야 된다. 신진 인문학도가 공부해야될 절대량은 시간이 갈 수록 기하급수적으로 증가하고 있다.

 

그런데 왜 굳이 시간에 대한 탐구를 개별 연구자의 몫으로만 책임을 전가하는가? 디지털의 세계에서 "데이터"로서 표준화하여 체계화 시킴으로써 불필요한 신진학자의 부담을 줄일 수 있다.

 

표준화 이야기가 나오면 인문학에서는 거부 반응부터 보인다. 인문학은 대상에 대한 다양한 사유를 보장해야되는데 표준화는 다양성을 무시한다는 것이다. 이는 종이매체 시대의 표준화에 매몰되어서 디지털 시대의 표준화를 이해하지 못하기 때문에 벌어지는 일이다. 종이매체에서는 지면상의 제약으로 인하여 표준화가 곧 단일화가 되는 경우가 비일비재하였다. 여러 학자들의 다양한 생각들을 모두 기재할 수 없었기에 "대표적인" 생각들만을 기재하였기 때문이다. 그런데 디지털에서는 종이매체에 존재하는 제약이 사실상 존재하지 않는다. 여러 학자들의 다양한 생각을 모두 합치고 표현하는 것이 가능하다. 다만 모든 생각을 포괄하는 최소한의 틀이 고정되어 있을 뿐이다.

 

 

디지털 인문학의 시간은 새로운가?

 

컴퓨터와 인간의 차이점. 컴퓨터에게 필요한 정보를 알려주고, 지식을 처리한다. 인간은 컴퓨터의 지성에 목적성을 부여하고, 인간을 위한 인간이 해석을 추가한다.

 

그런데 디지털 인문학의 시간이라는 것이 과연 새로운 것인가? 인문학이 그 동안 연구하지 않았던 신영역인가? 아니다. 인문학은 그 동안 인문학은 인문학의 토대를 문사철이라고 부르고 있었고, 언어와 사유 그리고 시공간에 대한 끊임 없는 탐구를 지속해 오고 있었다. 문제는 그 동안 인문학은 개인에게 온전히 모든 책임을 전가해왔다. 그러나 인류 개인의 능력은 한계가 명확하다. 개인이 모든 지식을 영위하는 것도 불가능하고, 개인이 단 하나의 오류도 범하지 않는 것도 불가능하다.

 

재미있는 것은 인류가 발전한 것은 단순히 몇몇 천재에 의한 고도의 지적 능력이 아닌, 수 많은 사람들의 지적 능력을 축적되고 소통되는 과정에서 발생했다는 점이다.

 

인류의 역사는 반복과 누적적인 행위의 결합체이다.

 

 

 

기존의 데이터는 단일 클래스로만 이루어져 있다. 


현실에서는 단일 기관에서는 인력과 자금 등의 한계로 인하여 단일 클래스로만 된 데이터를 생산한다. 그리고 사용자 서비스 개발에서도 타 기관 데이터 사용은 데이터 구조 상이성과 협조 문제로 인하여 단일 클래스 데이터만을 바탕으로 사용자 서비스를 개발하기에 사용자들은 한정된 정보만을 제공 받게 된다. 


만약 여러 기관이 각자의 단일 클래스로 만든 데이터를 "통합적인 설계"를 통하여 엮을 수 있다면 특정 객체에 대한 다원적인 데이터를 구축할 수 있으며, 이를 바탕으로 한 사용자 서비스를 제공한다면, 튼튼한 데이터와 다양한 사용자 서비스가 구현 가능하다.


그런데 현실적으로 여러 기관이 통합된 형식의 데이터 설계를 할 수 있도록 하는 것은 다양한 문제가 뒤 따른다. 기관별, 전공별, 학파별로 이미 기구축된 데이터 구조가 있으며, 가장 최적의 데이터 구조는 모두 다르기 때문이다. 그러나 최초의 개별 설계부터 참고 가능한 통합 설계가 있는 것과 없는 것의 차이는 크다. 



바로 : 김현 교수님의 화두에서 몇 가지 생각해본 점이다. 잡상-0-




인문학 데이터의 시각화는 쉽지 않다. 아무리 구글지도, 파노라마, VR, AR 혹은 위키백과라고 할지라도 인문학 지식이 가지는 복잡성과 개인성을 만족시키기는 어렵다. 


예를 들어서, 파노라마나 VR 혹은 AR에서는 핫스팟을 이용하여 특정 정보에 대한 추가 정보를 제공할 수 있다. 그러나 추가정보는 어디까지나 제작자의 의도가 투영된 인문학의 일부 지식에 대한 단편적인 내용이다. 구글지도에서는 가장 단순한 점, 선, 면을 이용하여 다양한 인문학 데이터를 지도에 투영할 수 있다. 그러나 어디까지나 해당 정보제작자에 의한 인문학의 일부 지식에 대한 단편적인 조합을 표현할 뿐이다. 


그나마 위키백과의 경우, 다양한 사용자의 참여를 통하여 최대한의 범용성이 높은 인문학 데이터를 생산하는 시스템이다. 특히 위키백과는 아직 만들어지 않은 항목에 대한 "느슨한 연결" 개념을 통해서 인문학 지식의 복잡성에 대한 생산성을 높일 수 있는 방안이 제시되었다. 그러나 결국 멀티미디어보다는 텍스트에 의지하고 있는 한계가 있다. 


무엇보다 위의 사례들 모두가 결국은 단일 항목에 대한 정보와 연관정보까지는 보여주지만, 연관정보 자체는 해당 정보 페이지로 이동하여야 한다. 나무만 보고 숲을 보기는 힘든 것이다.


이는 인문학 데이터가 내재하고 있는 개인성의 문제라고 볼 수 있다. 동일한 사안에 대해서 서로 다른 개념과 정의로 접근을 한다. 동일한 "이순신"에 대하여, 전쟁영웅적인 면을 살펴보기도 하고, 공학자적인 면으로 살펴보기도 하며, 심지어는 섹스어필의 대상으로도 본다. 동일한 한산도에 대해서 누군가는 "한산도대첩"을 생각하기도 하고, 누구는 "조운로"을 생각하기도 하며, 누구는 "추봉교"을 생각한다. 이 모든 개인화도 인문학이요. 통합된 "이순신"도 인문학이다. 


그렇다면 데이터의 기본원칙에 맞추어 모든 것을 최소한의 단위로 나누어 보는 것은 어떨까? 각각의 최소단위 지식을 레고블럭처럼 만드는 것이다. 그 다음 각각의 지식블럭들을 사용자의 의도에 따라서 "인물", "기관", "장소", "사건" 등의 바구니에 담고, 사용자의 의도에 따라서 각각의 지식블록을 연결하거나 각각의 바구니들을 연결하는 것이다. 개인성이 문제라면 위키백과처럼 사용자에게 맡겨버리자는 의미이다. 물론 그 과정에서 이용가능한 현대 시각화 기술을 활용하여, 멀티미디어, 지도, 연표 등의 다양한 내용을 추가해줄 수 있게 한다면 더 좋을 것이다. 


사실 이 개념은 그다지 새로운 것은 아니다. 이미 온톨로지의 클래스, 인디비듀얼, 릴레이션 개념을 바구니, 지식블럭, 연결선으로 전환했을 뿐이라고도 할 수도 있다. 다만 기존의 개념적이고 이론적인 설계에서 벗어나서, 실제 인문학 지식을 대상으로 사용자들이 직접 손쉽게 조작을 하고, 창조를 할 수 있다는 점에서 분명한 차이가 있다. 오히려 아동교재에서 자주 사용되는 "스티커 붙이기 놀이"와 본질적으로 같다.


지식블럭의 개념은 코딩교육(SW교육)에도 응용 가능하다. 코딩 교육은 결국 논리를 배우는 것이다. 알고리즘. 그 중에서도 조건문과 반복문을 중심으로 한 기본 논리개념을 잡는데 핵심이 있다. 그런데 기존 코딩교육을 주장하는 사람들 대다수가 이공계출신이다보니 인문학에 대한 이해가 떨어질 수 밖에 없고, 그 결과 인문예술계에 대한 이렇다할 코딩 교육 방안이 마련되지 않고 있다. 그 결과 인문예술계에도 "컴퓨터 알고리즘"을 가르치려고만 하고 있다. 지식블럭을 조립하는 개념으로 접근한 인문예술계에 최적화된 코딩 교육은 어떨까?


초등학교 단계에서는 단순히 지정된 지식블럭과 지식블럭은 지정된 연결선으로 연결하거나 지정된 지식블럭들을 하나의 지정된 바구니에 담도록 유도한다. 예를 들어서 이순신 블럭, 권율 블럭, 한산도 블럭, 인물 바구니, 장소 바구니, 사건 바구니, 발생장소 연결선, 참여 연결선 등등을 제시하고, 이를 레고블럭 놀이하듯이 맞추도록 하는 것이다. 


중고등학교 단계에서는 지정된 지식블록이나 바구니 혹은 연결선이 아니라, 중고등학생들 스스로 자유롭게 바구니를 지정하고, 연결선을 지정하도록 한다. 이순신 블럭이나 권율 블럭 혹은 한산도 블럭만 주고, 이에 대해서 장소 바구니를 만들거나, 공간 바구니를 만들거나 혹은 전쟁참가 연결선, 적대관계 연결선 등등 다양한 바구니와 연결선을 만들도록 하는 것이다. 


사실 지식블럭의 개념은 단순히 인문예술계의 논리구조를 디지털에서 표현할 수 있는 방법만이 아니다. 조건문과 반복문을 중심으로 한 알고리즘 수업의 코딩 교육에 온톨로지의 개념으로 데이터를 구축 교육을 추가할 수 있는 방안이 될 것으로 보인다. 알고리즘도 중요하지만, 그것만큼이나 중요한 것이 토대 데이터 구축이 아닐까?! 그리고 지식블럭개념은 데이터 구축의 기본이 되는 소양을 배우기에 최적화되어 있다고 판단된다. 




* KISDI 측의 인문학 시각화 관련 원고를 청탁 받아서 생각을 정리하는 차원에서 관련 내용을 두서 없이 써봤습니다. 나중에 원고 넘길 때까지....정리하고 수정하고 보충해야겠죠^^::


[앵커]

하지만 일각에서는 소프트웨어 교육에 필요한 교사가 부족하다는 의견이 있는데요, 이 부분에 대해서는 어떻게 보시나요?


[성균관대학교 컴퓨터 교육과 안성진 교수]

사실 훌륭한 교육은 훌륭한 스승에게서 나온다고 생각합니다. 그래서 소프트웨어 교육이 성공하기 위해서는 전문성을 갖춘 선생님들이 학교 현장에서 학생들을 지도할 수 있어야 하는데요. 현재 부족한 것이 사실이고요. 


올해도 중등 컴퓨터 교사 선발 인원을 보면 전국에서 31명 정도밖에 충원을 안 하는 현실이라서 좀 걱정되고 있습니다. 그래서 제 생각에는 내년부터라도 한 해 한 200여 명씩 10여 년은 선발해야 하지 않느냐고 보고 있고요. 


기존 교사들도 연수를 통해서 소프트웨어 교육 방법 등을 향상할 필요가 있다고 봅니다.



[앵커]

초중고교뿐만 아니라 대학에서도 신입생을 대상으로 컴퓨터 프로그래밍인 '코딩' 교육을 의무적으로 진행하는 곳이 있는데요.


올해 처음 도입됐는데, 공과 대학 학생이 아니어도 이 수업을 듣는데 어려움이 없는 걸까요? 


[성균관대학교 컴퓨터 교육과 안성진 교수]

원래 소프트웨어라고 하는 것은 컴퓨터 전공자가 배우는 특별한 언어가 있는데요. 그래서 그 언어를 배운다고 생각하는데, 요즘에는 교육용 프로그래밍 언어가 많이 나와 있습니다. 


이런 언어들은 초등학생도 쉽게 따라 하고 실제 교육현장에서도 사용되고 있거든요. 간단히 말씀드리면 키보드에 입력하는 것 없이 마우스만 사용해서 코딩이 가능한 언어들도 있습니다. 


그런데 사실은 언어 자체의 문제가 아니라 사고력에 대한 교육이 따라가지 못해서 사고력이 뒷받침되지 않아 어렵다고 느끼는 경우가 많습니다. 


그리고 어렵다고 느끼는 현상 중의 하나가 대부분 인문 사회나 예술 등의 학생들을 가르칠 때, 컴퓨터 전공자만 가르친 교수님들이 자기 분야의 학생들을 가르치듯이 교육하는 것이 문제라고 봅니다. 즉, 차별화된 교수법이 있어야 하는데 이런 것이 문제라고 보고요. 이런 것들만 개선하면 얼마든지 할 수 있다고 생각합니다. 


출처 : 2018년부터 초중고 'SW교육' 대폭 강화



바로 : 

기본적으로 안성진 교수의 말씀에 동의한다. 개인적으로 해당 인터뷰기사 전문을 찾아보기를 권장한다. 코딩 교육은 인적 자원밖에 없는 한국의 미래 전략인 것은 분명하다. 다만 아쉬운 부분이 있다. 지금 현재 단계에서 힘들지만 가장 먼저 이루어져야 할 것은 재교육이다. 


1. 중등 컴퓨터 교사 추가 선발은 불필요하다. 현직 교사들의 코딩에 대한 재교육이 필요하다.

2. 인문예술계에 대한 컴공 전공 교수들의 수업은 한계가 있다. 현직 인문예술계 교수들에 대한 코딩에 대한 재교육이 필요하다.


코딩 교육은 사실 소프트웨어를 만드는 것이 아니다. 안성진 교수가 밝혔듯이 "언어 자체의 문제가 아니라 사고력에 대한 교육"이다. 그런데 안성진 교수가 간과한 점은 이공계와 인문예술계의 기본적인 사고모델 자체가 다르다는 점이다. 완전히 다른 사고모델을 한 쪽에 맞추는 것은 소위 말하는 "융합"에도 그다지 도움이 되지 않고, 흔히 말하는 "획일화"를 조장할 뿐이다. 


중등교육에서는 기존 인문계열의 교사들이 코딩을 공부하고, 이를 기존 교과목 내용에 융합하여 수업을 진행하여햐 한다. 고등교육에서는 각각의 전공영역의 교수들이 직접 코딩을 공부하고, 각각의 전공영역에 합당한 내용으로 코딩 교육을 진행하여야 할 것이다. 단순히 "차별화된 교수법"으로는 제대로 된 코딩교육이 이루어질 수 없다. 중등 교육에서는 기본적인 내용을 위주로 진행한다면 어떻게든?! 될 수 있을지 몰라도, 고등교육인 대학에서는 컴공 교수가 아무리 노력을 해도 연구 대상과 연구 방법 자체가 완전히 다른 영역에 대해서 분명한 한계가 존재한다.


예를 들어서 비유하면, 영어와 같이 무조건 모두가 현지인과 비슷한 수준을 목표로 하고 있다. 낭비다. 심지어 현재는 누구는 영어를 배워야하지만, 다른 이는 스페인어를 배워야하는 상황이다. 영어강사보고 스페인어까지 가르치라는 것은 처음부터 말이 되지 않는다. 물론 비슷한 계열의 언어이기에 어떻게든 어느 정도 가르칠 수 있을지는 모르지만, 한계는 누가봐도 명확하다. 


...하지만 어찌 보면 교사와 교수들을 재교육시키는 것이 더 실현 가능성이 낮아보인다. 그러나 그것이 맞는 길이라고 보인다. 



디지털인문학. 최근 디지털인문학에 대한 관심이 높아지고 있는 것을 몸으로 느끼고 있다. 해외 학술 동향의 영향이든, 한국 대학교 인문학의 붕괴로 인한 탈출구 모색이든, 디지털인문학을 새로운 키워드로 잡고 다양한 시도들이 이루어지려고 하고 있다. 그리고 디지털인문학에 대한 열기의 상승과 동시에 해외 디지털인문학에서의 화두 중에 하나가 한국에서도 출현하고 있다. 



"누가 들어와야 되고, 누가 나가야 하는가?(참고 "The Digital Humanities Moment")" 



디지털인문학은 "디지털 방법론에 입각한 새로운 인문학 연구"을 말하는가?! 맞다. 본인이 관심을 가지고 있는 영역이며, 디지털인문학의 핵심이라고 생각한다. 


디지털인문학은 "디지털 시대에 인간이 살아가는 철학에 대한 연구"을 말하는가?! 맞다. 본인으로서는 별로 관심이 가지 않는 영역이지만, 인문학의 연구주제로써 "디지털"을 상정하는 것도 넓은 범위에서의 디지털인문학이라고 할 수 있다.


디지털인문학은 "디지털 시대의 새로운 교육방법론"을 말하는가?! 맞다. 후속세대를 위한 교육은 언제나 인문학의 핵심 중에 하나였고, 현재는 디지털인문학의 핵심연구분야는 아니지만, 근시일내에 핵심주제로 부상하리라 생각하는 영역이다.


그 외에도 다양한 디지털인문학의 정의가 가능하리라 생각한다. 다만 한가지 조건이 필요하다고 생각한다. 디지털 기술이나 디지털 방법론에 대해서 일자무식이고, 이를 배울 의지조차 없는 이들이 말하는 디지털인문학은 거부한다. 더 쉽게 말해서, 논어 한 번 읽어보지 않고 공자의 사상을 논할 수 없는 것처럼, 페이스북이나 트위터조차 한 번 해보지 않고, 기존의 아날로그 시절의 경험에 의거한 디지털 시대의 인간의 삶에 관한 연구는 어떻게 생각해도 인정할 수 없다. 본인은 스마트폰조차 제대로 다루지 못하면서, 아이들에게 휴대폰 APP을 만들라는 행위는 교육자로서의 소양마저 의심스럽다.


물론 인문학자에게 정보학자 수준의 디지털 기술이나 디지털 방법론을 요구하는 것은 아니다. 다만 최소한 정보학자와 "말이 통하는 수준"의 디지털 기술에 대한 개념적 이해와 실제 융합 프로젝트 수행 경험은 반드시 필요하다고 생각한다. 더 구체적으로 본인으로서는 최우선적으로 DATA가 무엇이고, DATA을 어떻게 구조화하고 관리해야되는지에 대한 기본적인 지식과 경험을 가져야 한다고 생각한다. 물론 사람마다 분석 혹은 시각화 혹은 그 외의 디지털 기술이 중요하다고 생각할 수도 있다. 그러나 그 분야는 그 분야에 특화된 정보학자나 디자이너들에게 맡겨도 된다. 그러나 인문학 DATA의 구축과 운영은 정보학자들이 결코 따라올 수 없는 분야이며, 동시에 분석과 시각화의 토대가 된다는 면에서 최소한의!! 정말!!! 이것만이라도 하자라는 의미에서 DATA을 외치고 싶다. 




-----

타이완에서 돌아와서 그 동안 밀린 일을 처리하느라 정신이 없습니다. ~.~

무엇보다....타이완보다 너무 춥습니다....추워요...ㅠㅠ


타이완 와서 천천히 자료나 수집하면서 쉴려고 했는데, 생각보다 책 수집이 빠르게 진행된 반면, 면담은 타이완 신년황금연휴(1월 1일부터 1월 4일까지 연휴임)로 인하여 대기하는 시간에...쉬지 않고.......삽질?! 작업을 실시하였습니다.


주변 지인들로부터 대체 바로바로의 중얼중얼과 뭐가 다르냐고 욕 먹었던 디자인...왜!!! 왜!!!! 내 수준이 여기까지인걸!!! 이게 제일 예쁘다고!!! 싫으면 직접 만들엇!!!!


디지털인문학 관련 뉴스와 자료를 한 곳에 모으는 한국 디지털인문학 허브를 워드프레스 기반으로 구축하고 있습니다. 내용이나 구조는 별 문제가 없는데...그놈의 고질적인 디자인 문제로 삽질중입니다[각주:1]. 그런 이유로 주소는 아직까지는 비공개입니다. 누구나 참가가 가능하며!!! 관심이 있으신 분은 ddokbaro닷gmail.com 로 연락 부탁드립니다. 특히! 디자인!!! 설치형 워드프레스 디자인!!!!



그리고 디지털인문학 목록 프로젝트를 진행했습니다. 사실 예전부터 만든다고 해놓고, 귀찮음에 차일피일 미루던 일이었는데......맘 잡고 삽질 해봤습니다[각주:2]. 일단 초안은 다음과 같습니다[각주:3]


DH저서목록

DH논문목록

DH프로젝트목록

주요DH싸이트


구글 드라이브로 만들어졌으며, 누구나 자유롭게 열람-추가-수정-삭제 할 수 있습니다.




..............일이 없어도 일을 만드는 바로의 간략 타이완 생활기였습니다......

...내일 부터는 면담 및 부탁 받은 일 후딱 처리하고!! 쉴겁니다...진짜로...진짜로;;;[각주:4]


  1. ....하아....왜! 어떻게 만들어도!! 안 예쁘냐고!!!!! 아놔.....몰라! 나중에 귀찮으면 누군가 하겠지의 마음가짐으로 내용만으로 승부할지도-_-;;; [본문으로]
  2. 훨씬 편히 작업이 가능한 한국에서 안하고...조그마한 노트북 모니터와 느린 인터넷 속도에서 일을 진행하는 저는 변태?! [본문으로]
  3. 아직 부족한 부분도 많고...기본적으로 현재 제가 타이완으로 온 목적도 있어서 타이완 위주로 업데이트 하고 있습니다. 나머지는....관련자 분들이 채워주시리라 믿어 의심하지 않습니다. ^^ [본문으로]
  4. 지금 머리속으로 처리해야될 일이 하나 더 떠올랐지만 애써 외면할겁니다.-_-!! [본문으로]

I moved from recommending setting aside laptops and phones to requiring it, adding this to the class rules: “Stay focused. (No devices in class, unless the assignment requires it.)” Here’s why I finally switched from ‘allowed unless by request’ to ‘banned unless required’.


-- 출처 : Why I Just Asked My Students To Put Their Laptops Away


"수업시간의 노트북이나 스마트폰의 활용은 집중력을 저하하고, 학습 효율을 저하시킨다. 그렇기에 특별한 이유가 없는 이상 디지털 디바이스는 교실에서 금지되어야 한다."


상당히 많은 수의 사람들이 이런 의견에 찬성을 한다. 그러나 본인의 대답은 간단하다. 


"당신의 수업이 얼마나 재미 없었으면 딴짓을 할까요?!"


어차피 인터넷에서 한 번 검색하면 나올 수 있는 지식 주입은 학생들에게 어떠한 흥미도 불러오지 못한다. 그냥 대략적인 내용만 파악해두면 언제든지 인터넷에서 찾아볼 수 있다. 대체 왜 "쓸데 없고, 재미도 없는 지식"에 자신의 시간을 투자해야되는가?


예를 들어보자. 어떤 수업에서 본인은 같은 수업을 듣는 학생들과 구글 문서를 통해서 공동 수업필기노트를 작성한다. 단순히 교사이 말하는 내용 이상의 내용을 온라인을 통해서 손쉽게 정리한다. 대부분의 경우 교사가 말하는 내용 이상의 내용이 필기노트에 정리된다.(관련 멀티미디어 자료는 물론이고, 관련 논문과 해당 내용까지...) 그러고도 공동작업으로 덕분에 시간은 여유롭게 넘쳐 흐르게 된다. 남는 시간에 딴짓이나 하면서 놀아야지 뭘 하겠는가?! 집중력 저하라고?! 아니. 이미 과거의 노트필기보다 훨씬 더 방대한 작업을 더 빠른 시간에 처리했을 뿐이다. 


다른 예를 들어보자. 어떤 수업에서는 교사가 어떤 창작물을 만들라고 주문한다. 그럼 새로운 창작물을 위해서 온라인을 통해서 방법론과 데이터를 수집하여야 하고, 모든 창작물이 그렇듯이 만들고 마음에 들지 않아서 재창조하는 과정을 수 없이 거치게 된다. 그렇게 되면 남는 시간이 없는 것은 당연한 일이다. 물론 자신의 것을 창조하는 작업이니만큼 집중력은 처음부터 끝까지 자연스럽게 높은 강도로 유지된다.


노트북 때문에 수업에 집중하지 못한다는 것은 핑계에 불과하다. 노트북은 어디까지나 효율성을 높여주는 도구일 뿐이다. 문제는 당신의 수업이다. 단순한 지식 주입을 하니 당신에게 남은 선택지가 노트북 금지가 될 뿐이다. 






모든 학문은 선현들의 수 많은 성과를 바탕으로 발전한다. 그렇기에 기본적으로 어떤 논문에도 선행연구에 대해서 서술하도록 되어 있다. 다시 말해서 학문성과의 축적은 모든 학문의 기본 중에 기본이다. 


그러나 한국의 학문성과축적은 상당히 방대하며 빈약하다. 방대하다고 하는 이유는 한국연구재단 등의 국가기관이나 각 대학들이나 연구소등의 사립기관들이 예산을 투여해가면서 수 많은 학문성과를 축적해왔다. 빈약하다는 이유는 축적된 데이터는 데이터허깅으로 인하여 어디까지나 해당 기관이나 개인이 소장하고 있을 뿐 다른 이와 공유되지 못한다. 또한 길어봐야 10년에 불과하고 대부분이 3년도 되지 않는 프로젝트 수행기간은 지엽적인 주제의 데이터의 축적을 할 수 밖에 없게 한다.


디지털인문학은 축적된 학문성과의 공유문제와 짦은 수행기간으로 인한 지엽적인 주제의 데이터생산문제의 탈출구로 온톨로지를 제안한다. 


데이터 공유 문제에서는 이미 정부 3.0으로 인하여 데이터 보유 기관들이 현실적인 압박을 받고 있기에 5년내로는 공유되는 데이터의 양 자체에서는 상당한 성과를 보일 수 있다고 생각한다. 그러나 정리되지 않고, 타인이 알아볼 수 없는 데이터는 자원낭비이자 쓰레기일 뿐이다. 온톨로지를 통하여 초기 프로젝트 단계부터 데이터를 정비하여야 한다. 인문학자 자신이 데이터를 만들면서 데이터를 정비해야 한다는 말이다. 어떤 컴퓨터 공학자가가 해줄 수 있으리라는 것은 착각이며, 오해이다. 컴퓨터 공학자는 어디까지나 컴퓨터 공학쪽으로 잘 알 뿐이고, 인문학자들이 생산하는 인문학 데이터에 대해서는 일자무식에 가깝다. 못한다. 해도 엉터리다[각주:1]


짦은 수행기간으로 인한 지엽적인 주제의 데이터 생산 문제 역시 온톨로지을 통해서 해결할 수 있다. 단일 프로젝트는 짦은 수행기간과 적은 인력으로 인하여 지엽적인 주제에 한정될 수 밖에 없다고 하더라도, 온톨로지를 통해서 다른 프로젝트의 성과와 연결될 수 있다면 별 문제가 없다. 오히려 단일 프로젝트의 전문성을 확장하고, 전체적인 맥락에서는 인문학 빅데이터를 구축하는 방법이 될 것이다. 물론 짦은 수행기간 자체와 적은 예산으로 인한 인력문제에 대한 근본적인 수정이 있으면 좋겠지만......


이미 2012년부터 한국연구재단에서도 토대 사업을 대상으로 적합한 XML이나 RDB 형식의 데이터를 제출하도록 하고 있다. XML이나 RDB 설계 모두가 넓은 범위에서 온톨로지의 일부분이라도 할 수 있다. 이제 인문학 프로젝트를 하려고 해도 온톨로지를 해야되는 세상인 것이다. 그런데 온톨로지는 인문학에서 태어난 개념이기에 인문학자들이 오히려 컴퓨터 공학자들보다 손쉽게 배우고 자유롭게 활용하는 모습을 자주 본다. 다시 말해서 온톨로지라는 기술에 밑도 끝도 없는 두려움만 가지지 않는다면 인문학자들이 온톨로지를 다루는데 어떠한 문제도 발생하지 않는다. 








바로 : .....생각나는대로 쓰윽쓰윽~~ 카테고리가 잡담잡상~~ 우훗~ 머....몰라몰라~~ ^^::: (요즘 살짝 미쳐가고 있는듯 함.)


  1. 조금 다른 예이지만, "고구려왕조실록"으로 인물네트워크 분석을 한다면 어떻게 생각되는가?! [본문으로]

한국의 대학교육은 패망했다. 서울대학교 출신은 서울대학교에 입학할 수 있는 수학능력이 있었기에 인정받는다. 결코 서울대학교의 교육과정을 졸업하였기에 얻어지는 칭호가 아니다. 모두가 창의적이고 적극적으로 변화를 추구한다고 말을 하지만, 실제적으로는 대학교수가 학생들에게 일방적으로 지식을 주입하고 있을 뿐이다. 


이제는 물고기를 잡아서 주는 것이 아니라, 물고기를 잡는 법을 가르쳐야 될 때가 아닐까?


디지털인문학의 교육방법론은 지식을 주입하려고 하지 않는다. 어디까지나 지식을 만드는 방법을 알려준다. 교수의 역할은 해당 전문 분야의 기본적인 방법론에 대해서 알려줄 뿐이며, 자신이 알고 있는 지식을 주입하려고 하지 않는다. 학생들이 요청하는 지식의 탐색 방법을 자문해 줄 뿐이다.


예를 들어서 온톨로지를 활용한 교육에서는 해당 분야의 기본적인 틀(연구방법)을 제시하고, 그 외의 세부적인 정보들은 학생들 스스로가 구축할 수 있도록 한다. 네트워크 분석이나 지리정보시스템 분석도 방법론을 알려주는 지식의 전달이 있을 뿐이며, 분석대상은 학생들 스스로가 선정해서 스스로 데이터를 구축하고, 스스로 시각화를 진행한다. 물론 이 과정에서 교수에게 자문을 구할 수 있지만, 기본적으로는 학생들 스스로가 무엇인가를 창조하게 된다.


더 구체적으로 예를 들어보겠다. 서원에 대한 온톨로지 수업을 한다고 하자. 최초에는 교수에 의해 서원에 대한 기본적인 정보와 온톨로지에 대한 사용방법을 주입하여야 한다. 그러나 그 다음부터는 학생들 스스로가 자신의 흥미와 관심에 맞추어서 서원에 대한 정보들을 수집-분류-분석-시각화를 하게 된다. 어떤 학생은 서원의 역사에 대해서 흥미가 있을 것이고, 어떤 학생은 서원 주변의 관광자원에 대해서 관심이 있을 것이고, 어떤 학생은 서원을 찍은 사진에 관심이 있을 것이다. 이 전과정에서 교수는 학생들의 관심사에 따라 들어오는 정보 획득 방법이나 정보 구조에 대한 의문만을 해결할 뿐이다. 


학생들은 스스로 무엇인가를 만들면서 암기가 아닌 창조를 하게 된다. 그리고 창조에서 열정을 얻어서 보다 많은 지식을 자연스럽게 추구하게 된다. 학생들이 못할 것이라고?! 당신은 누가 강요해서 역사책을 읽었던가? 당신은 누가 강요해서 문학작품을 읽었는가? 스스로가 즐겁고 재미있었기 때문이 아니던가? 아는 자는 좋아하는 자만 못하고, 좋아하는 자는 즐기는 자만 못하다. 


물론 기존의 학문 교육 방법론으로도 지식창조 방법을 전달할 수 없는 것은 아니다. 하지만 디지털인문학은 다양한 디지털 툴들과 온라인에 산재된 지식을 즉각적으로 활용하여 효율적으로 지식창조 방법을 가르칠 수 있기에 강조되고 있는 것이다.


진정한 교육은 지식이 전달이 아니라, 지식을 만드는 법의 전달에 있음을 다시 한번 생각하자. 이제부터라도 지식이 아닌 지식창조 방법을 가르쳐야 한다. 그것이 원래 대학이 마땅히 해야될 역할인 것이다. 학문의 위기는 교수들이 지식만을 전달하는 이상 끊임없이 계속될 것이다. 




바로 : 음......구체적인 디지털인문학 교육방법론에 대해서........언젠가~ 논문으로 써야겠다. 실제 예시를 몇 개 언급해서 "지식"이 아닌 "지식창조방법"이라고 했는지 확연하게 알 수 있도록.....흐음....




인문학과 디지털인문학의 관계는 이기론(理氣論)의 이기(理氣)간의 관계와 유사하다. 디지털인문학은 기(氣)로서 사물을 담는 그릇이고, 인문학은 이(理)로서 사물의 이치 자체를 말한다. 물론 디지털인문학은 어디까지나 인문학 연구를 위한 그릇일 뿐이며, 더 뛰어난 연구방법론이 발견된다면 언제든지 없어질 수 있다. 그러나 최소한 100년내로는 디지털인문학의 방법론을 뛰어넘는 인문학 연구 방법론이 나올 수 없다고 생각된다.


이기론 때처럼 극단으로 서로 나누어지려는가?! 결국 이기론도 이와 기 모두가 중요하다로 회귀하였다. 인문학과 디지털인문학과 다르지 않으리라 생각한다. 다만 서로 나누어지는 기간은 과거의 경험을 통해서 최대한 단축될 수 있기를 소망할 뿐이다.


인문학자를 위한 디지털인문학 교육


 추진 배경

 디지털 시대에 인문학을 융성할 수 있는 디지털인문학 교육의 필요성

- 디지털인문학은 세계적으로 인문학 위기의 타개책으로 주목 받고 있으며, 창조경제의 토대가 되는 인프라 구축 가능

 “초중등SW교육활성화 정책”에 필수불가한 인문학 소질을 갖춘 초중등SW 교육자 양성을 위한 전문 교육자 양성의 필요성


 사업 목적

 디지털 시대의 인문학 도약을 위한 디지털인문학 방법론 교육

 인문학 대중화를 통한 창조경제 인프라를 구축할 능력을 갖춘 디지털인문학자 양성


 사업 방향

 인문학자를 대상으로 한 디지털인문학 방법론 교육

 방학기간을 이용한 1~2주간의 집중 교육

 디지털인문학 방법론 교육 및 실습

- 디지털인문학 DB 구축 영역(XML, TEI, RDB 등)

- 디지털인문학 분석 영역(말뭉치(Copus), 지리정보시스템(GIS), 사회 네트워크(Social Network 등)

- 디지털인문학 시각화 영역(멀티미디어, 파노라마, 3D 모델링 등)

- 디지털인문학 교육방법 영역

 사업 결과물은 정부 3.0에 따라 모든 이들의 접근이 가능해야 함

- 접근성과 확산성을 위하여 필히 온라인으로 공개되어야 함



디지털인문학교육_초안_김바로.pptx





바로 : 심심풀이?! 겸 프로젝트를 위해서 구상한 내용입니다. 기본적으로는 미국 NEH의 디지털인문학자 양성교육 프로그램들을 참고하였습니다. 아직 다듬어야되고 보충해야될 내용이 많지만...그냥 너무 오래동안 글을 안 올려서...~.~;;;


개인적인 생각일수도 있지만, 객관적으로 아무리 생각해보아도 석박사이상을 대상으로 하는 교육은 현재 한국학중앙연구원 인문정보학 전공의 교육과정이 최고라고 생각된다. 실제로 미국이나 다른 국가의 디지털인문학 교육 과정을 보아도 한중연의 과정과 크게 다른 점이 없다. 대표적인 미국의 2주간의 집중과정이 한중연 한학기 프로그램과 비슷하다. 




다만 대학생을 대상으로 한 교육에서는 고민이 남는다. 사실 기술 자체는 오히려 대학생들이 더 쉽게 받아들일 수 있다.(물론 대상이 되는 인문학 데이터 자체의 수준은 떨어지며, 떨어져야 한다.) 그러나 디지털인문학을 할 수 밖에 없는 절박함이 없이 기술만을 배우는 것은 문제가 될 수 있다. 


예를 들어서 디지털 조선왕조실록은 인문학자에게 훌륭한 디지털인문학의 기본을 보여준다. 그러나 조선왕조실록을 완독하거나...완독까지는 아니더라도 일정이상의 전체 문장을 보지 않고, 검색을 통한 단편적인 자료 취득은 인문학의 쇄락으로까지 이어질 수 있는 중대한 문제이다. 물론 이건 디지털인문학의 문제라기 보다는 인문학에서 어떻게 전통 인문학 교육과 디지털인문학 교육을 병행하느냐의 문제에 가까우며, 디지털인문학에 집중하는 본인으로서는 살짝 거리가 있기는 하다. 


코트 교수는 "이론 컴퓨터과학과 수학은 사실상 차이가 크지 않다"며 "연구 동기가 컴퓨터과학에서 올 뿐이고, 효율성과 시간 등의 측면에 연구가 집중돼 있다는 것은 컴퓨터과학의 특징이지만, 답을 내는 방법은 결국 수학"이라고 강조했다.


출처 : 코트 교수 "자신있게 관심분야 전공 선택하길


디지털인문학과 인문학은 사실상 차이가 크지 않다. 연구 동기가 디지털인문학에서 올 뿐이고, 효율성과 시간 등의 측면에 연구가 집중돼 있다는 것은 디지털인문학의 특징이지만, 답을 내는 방법은 결국 인문학이다. 



디지털인문학을 외치는 본인에게 '기술"을 너무 강조하는 것이 아니냐는 소리를 자주 한다. 그런데 디지털인문학이 강조하는 것은 결코 "기술"이 아니라 "인문학"이며, 본인도 인문학 지상주의에 가까울 정도의 인문학 본위적인 생각을 가지고 있다. 


우리가 수 천년간 이어내려온 종이와 펜을 버리고, 컴퓨터에서 워드(한글)로 글을 쓴다고 인문학을 버리는 것인가?! 단지 디지털과 워드라는 툴을 사용하고 있을 뿐이다. 디지털인문학은 단지 워드보다 더 효율적으로 컴퓨터를 활용할 수 있는 방법론을 제시하고 있는 것이다. 그리고 이런 컴퓨터쪽의 방법론은 결국 철학에서 파생된 개념에서 발전하였기에 인문학자가 두려움만 버리면 훨씬 쉽게 접근이 가능하다.


인문학의 목표가 사서삼경의 토씨하나 빠지지 않고 외우는 것과 같이 방대한 지식을 암기하는 것인가?! 아니다. 인문학은 지식을 바탕으로 지혜를 축적하는데 목표를 두고 있다. 이제 지식의 축적은 컴퓨터에게 맡겨두고 인문학 본연의 목표인 지혜에 접근해야하지 않는가? 아니면 자료를 찾기 위해서 사방팔방 돌아다니는 것이 인문학의 목표라고 하고 싶은가? 모든 인문학 자료를 암기하는 것이 인문학의 목표라고 할 것인가?


지난 10년동안 한국은 문화콘텐츠의 "산업화" 화두에 매몰되었다. 인문학의 문화콘텐츠를 통한 산업화는 시장경제체계의 우리 사회 속의 인문학의 역할로서 나름 의미가 있다. 그러나 인문학이 언제부터 짤랑짤랑 돈을 쫒았는가?! 인문학은 바보처럼 미련하게 상아탑 소리를 들으며 앞으로의 100년을 미리 준비하지 않는가?! 


디지털인문학은 디지털기술을 도입한 인문학의 인문학에 의한 인문학을 위한 인문학 연구 방법론이다. 이제 검색과 같은 기초적인 "분석"에서 벗어나서 말뭉치(코퍼스), 네트워크, 지리정보시스템(GIS) 혹은 그 이상의 인문학의 인문학에 의한 인문학을 위한 디지털기술을 활용한 분석에 돌입해야하지 않겠는가?! 물론 어떠한 분석방법을 사용하더라도 최종적인 "해석"은 아직 인문학의 영역이며, 인문학의 영역이여야만 한다.   




아놔! 다 떠나서....일단 해보고 이야기하자. 솔직히 안 어렵다고!!! 30대면 왠만한 디지털인문학 방법론은 1시간내로 이해 가능하고 하루면 직접 간단하게나마 실험해볼 수 있다고!!! 진짜라고!!! 쉽다고!!!



박근혜 대통령이 참가한 가운데 대통령 소속 자문위원회인 문화융성위원회 산하 인문정신문화특별위원회의 제안을 토대로 교육부와 문화체육관광부는 "인문정신문화 진흥 7대과제"을 발표하였다.


▲ 초·중등 인성교육 실현을 위한 인문정신 함양 교육 강화 

▲ 인문정신 기반 대학 교양교육 개선 

▲ 인문 분야 학문 육성 

▲ 전국 문화 인프라를 활용한 문화체험 확대 

▲ 인문자산과 디지털 연계 프로젝트 지원 

▲ 은퇴자의 청소년 교육 참여 등 문화 향유 프로그램 다양화 

▲ 국제교류 활성화


또한 인문정신문화특별위원회는 미국의 NEH(국가인문학재단)과 같은 국가차원의 진흥기구 설치도 제안하였다. 


본인의 관심영역인 디지털인문학의 입장에서 이번 "인문정신문화 진흥 7대과제"을 살펴보았다. 직접적으로 관계가 있는 것은 "인문자산과 디지털 연계 프로젝트 지원"일 것이다. 


 "인문자산과 디지털 연계 프로젝트 지원"은 디지털인문학에서는 기본 중에 기본으로 다루어지는 영역이다. "인문자산과 디짙러 연계 프로젝트 지원"은 "디지털인문학 지원"과 같다고 생각된다. 다만 지난 10년동안의 디지털연계가 실패라고 생각되는 핵심인 인문학자가 배제된 디지털 연계를 답습하지 않아야 할 것이다. 


인문학자의 인문학자에 의한 인문자산의 디지털 연계가 되어야 한다. 다시 말해서 인문학자가 스스로 디지털 연계를 할 수 있어야 한다. 업체에 디지털 연계를 시키는 것은 돈을 날리는 것 밖에 되지 않는다. 인문학자는 자신의 인문학 지식이 제대로 디지털 연계되기를 원한다면 직접 할 줄 알아야 한다. 직접 하지 않고 업체가 알아서 다 할 것이라고 생각하는 것은 마치 업체가 인문학자만큼의 인문지식을 가지고 있다고 생각하는 것과 하등 다를바가 없다. 


대부분의 인문학자들은 디지털 연계를 못한다고?! 그럼 배워라. 대체 인문학자들은 무슨 용가리 통뼈라고 새로운 것을 피하려고만 하는가?! 개인적으로 그런 사람들을 볼 때마다 그렇게 디지털이 그리도 싫으면 워드(한글)을 쓰지 말고 원고지에 논문을 쓰라고 말해주고 싶다. 무엇보다 워드를 배울 수 있으면 디지털인문학 방법론을 배우는데 그다지 어려움이 없다. 본인 주변에는 70에 가까운 나이에 디지털인문학을 공부하시는 분도 있으시다. 그러니 온갖 핑계를 대며 두려움을 포장하지 마라. 디지털인문학은 쉽다!


물론 국가차원에서는 인문학자를 대상으로 한 디지털 연계를 위한 교육을 마련해야할 것이다. 교육이라는 것은 어디까지나 씨앗을 뿌리는 작업이다. 그렇기에 효과가 비교적 즉각적으로 나타나지는 않는다. 하지만 씨앗이 자라서 꽃이 되고, 다시 또 다른 씨앗을 낳으며 인문학이 꽃 피울 것이다. 무슨 말이 필요 있는가?! 교육은 백년대계이다.


그 외에 "인문 분야 학문 육성"은 너무나 추상적인 내용이라서 무엇이라고 말하기가 애매한 사항으로 보인다. 인문 분야에 돈을 더 지원해줄 모양인가 보다?! 국제교류 활성화 부분에서는 두가지만 말하고 싶다. 해외의 소위 선진국의 학계의 대세는 "디지털인문학"이다. 아니! 국제교류에 디지털이 어떻게 빠지겠는가?! 요즘 누가 사전이나 강좌를 찾아다니는가?! 인터넷으로 모든 자료가 공개되는 세상이다.(...곁다리로 게임팬으로서 게임문화의 국제교류 활성화도 쫌......대체 음악, 드라마를 싹다 합친 것보다 2배 이상의 돈을 벌고, 전세계 게이머들에게 한국짱! 이라는 소리를 당연히 듣는 게임문화 영역이 어째서 이렇게나 천대를 받아야되는 것인지...)


"은퇴자의 청소년 교육 참여 등 문화 향유 프로그램 다양화"의 경우 개인적으로 전통적인 방법에서 탈피해서 온라인으로 옮겨왔으면 한다. 어차피 대부분의 청소년들은 그런 강의가 있으면 그냥 잔다. 어떤 청소년이 노인네가 주저리주저리 하는 것을 열심히 듣고 있겠는가?! 그냥 TED와 같은 모델을 활용해서 온라인을 통해서 강의를 완전히 오픈해버려라. 그럼 학생들은 원하는 시간에 원하는 강의를 들을 수 있고, 강사들은 자신의 실력을 적나라하게 평가받게 될 것이다. 실제로 소요 예산자체도 훨씬 더 저렴하게 든다. 또한 명강의는 네티즌들이 자발적으로 자막까지 입혀서 해외에 전파할 것이다. 이것이 창조경제이고, 정부 3.0인것이다. 



다만 개인적으로 이상한 것은 "미국 NEH와 같은 국가 차원의 진흥기구 설치를 제안"했다는 것이다. 문제는 한국에는 미국 NEH와 같은 인문학진흥기관은 이미 존재한다. 한국연구재단이다. 그런데 뭔 미국 NEH와 같은 인문학진흥기관을 또 만든다는 말인지 모르겠다. 한국연구재단에 대한 견제인가? 아니면 또 다른 밥그릇 만들기인가? 도통 뭔지 모르겠다. 뭐지?? 굳이 미국 NEH을 따라할려면 현재 NEH의 핵심 사업인 디지털인문학 정책이나 따라해줬으면 좋겠다. 괜히 Post-HK라고 해서 눈먼 돈 뿌리는 일이 될 가능성이 농후한 소규모 인문랩에 1억~1억5천만원씩 지원하는 사업 대신에 말이다.

 

Digital Humanities은 현재 한국에 막 도입된 상태이다. Digital Humanities의 한국어 용어를 "디지털인문학"이라고 할 것인가? "디지털 인문학"이라고 할 것인가? 사소해보일 수도 있지만, 한국어 띄어쓰기 규칙의 융통성으로 인하여 생각보다 복잡해 진다. 



국립국어원의 띄어쓰기 규정에 의하면, "제50항전문 용어는 단어별로 띄어 씀을 원칙으로 하되, 붙여 쓸 수 있다.(ㄱ을 원칙으로 하고, ㄴ을 허용함.)"로 "디지털 인문학"이 원칙이고, "디지털인문학"도 허용한다고 하고 있다. 세부 내용을 확인하면 "전문 용어란, 특정의 학술 용어나 기술 용어를 말하는데, 대개 둘 이상의 단어가 결합하여 하나의 의미 단위에 대응하는 말, 곧 합성어의 성격으로 되어 있다. 따라서 붙여 쓸 만한 것이지만, 그 의미 파악이 쉽도록 하기 위하여 띄어 쓰는 것을 원칙으로 하고, 편의상 붙여 쓸 수 있도록 하였다."라고 하고 있다. 사실 "디지털 인문학"이나 "디지털인문학"이나 의미파악에는 큰 문제가 없기 때문에 원칙인 "디지털 인문학"이 더 합당하다고 할 수 있다.


하지만  띄어쓰기 규정 "제49항성명 이외의 고유 명사는 단어별로 띄어 씀을 원칙으로 하되, 단위별로 띄어 쓸 수 있다.(ㄱ을 원칙으로 하고, ㄴ을 허용함.)"의 세부설명에 따르면, "둘 이상의 단어가 결합하여 이루어진 고유 명사는 단어별로 띄어 쓰는 것을 원칙으로 하되, 단위별로 붙여 쓸 수 있도록 한 것이다." 다시 말해서 학과이름과 같은 고유명사의 경우 "디지털인문학과"이라고 쓰는 것을 현실적인 요구를 반영해서 허가하고 있다. 



한국어의 띄어쓰기 규정은 원칙을 정하지만, 그에 상응하는 허용조건을 두고 있다. 보통 단어의 연결 방식을 어떻게 보느냐에 따라서 띄어쓰기를 판단하게 된다. 가장 많이 사용되는 예시가 "산교육"이다. "산교육"을 하나의 굳어진 단어, 즉 합성어로 볼 것인지? 아니면 "관형어+명사"의 두 개의 단어로 된 구인지 하는 판단의 문제이다. 합성어는 그 구성 성분이 본래의 성질을 잊어 버리기에 띄어쓰기를 하지 않아도 된다. "산교육"의 경우 "산"이 본래 동사의 관형형으로서 동사가 가지는 성질을 보유해야 한다. 다시 말해서 하나의 부사나 부사구의 수식을 받을 수 있어야 한다. 예를 들어서 "산 사람"에서 "산"은 "오래", "잘"과 같은 수식을 받을 수 있다. 그러나 "산교육"에서의 "산"은 이런 부사나 부사구의 수식을 받게 되면 "오래 산교육", "잘 산교육"으로서 문법적인 한국어의 표현이라고 할 수 없다[각주:1]


그렇다면 "디지털+인문학"은 두 개의 단어로 된 명사구인가? 아니면 하나로 굳어진 합성어인가?  표준국어대사전에서 '디지털'과 '인문학'의 품사는 모두 '명사'이다. 그런데 "디지털"의 경우, 표준국어대사전에서 '디지털^계기, 디지털^녹음, 디지털^시스템'등 합성어가 아니라 여러 개의 명사로 구성된 명사구로 취급하고 있습니다. 하지만 그럼에도 불구하고 "^"을 통해서 띄어 쓰는 것이 원칙이나 붙여 쓸 수 있는 전문용어나 고유 명사 표시를 하고 있다.  (아..슬슬 짜증나기 시작한다........)



사실 언어의 문제에서는 다수가 갑(甲)이다. 다시 말해서 많이 쓰는 것이 장땡이다. 그렇다면 현재 아직 보급단계이기에 많이 쓰이지는 않지만 "Digital Humanities"을 어떻게 사용하고 있는지 살펴보아야 할 것이다. 현재까지 발표된 논문[각주:2]에서는 4편이 "디지털 인문학"으로 사용중이고, 2편이 "디지털인문학"으로 사용중에 있다. 학과이름이나 교육과정 이름으로는 관습에 따라서 "디지털인문학"으로 사용중에 있다. 아직 표본자체가 너무나 소수이기에 갑(甲)이 존재한다고 말하기가 힘들다. (...나 한국어 싫어해도 되는거죠? 크어어엉!!!!!! )




생각을 전환해보겠다. 아직 절대적 다수가 사용하는 갑(甲)이 존재하지 않는다면, 열심히 Digital Humanities 관련 내용을 올리고 있는 나부터 어느 하나로 통일을 해서 지속적으로 홍보?!을 하면 그것이 갑이 될 수도 있다는 것이다! 그래서 위의 모든 원칙과 허용을 뒤로 하고 관습적인 면에서 생각해보았다.


"디지털인문학"이라고 하면 하나의 학문분과이자 고유단어로 생각된다. 그런데 "디지털 인문학"이라고 하면 하나의 방법론으로 느껴진다. 예를 들어서 "문화콘텐츠"는 고유명사로 대우받고 있으며, "문화콘텐츠"의 이름으로 수 많은 학과들이 생겨났다. 이에 반하여 "네트워크 분석"과 같은 경우는 하나의 분석도구로서 생각될 뿐이고, 독립적인 학문으로서 생각되지는 않는다.


그렇다면 "디지털인문학"이 "문헌학"과 같이 미래 인문학 연구의 필수 방법론이 될 것이며, 역시 "문헌학"과 같이 그 자체로도 하나의 독립적인 학문영역이라고 생각하기에 "디지털인문학"으로 표기하는 것이 보다 합당하다고 생각한다. 물론 시간이 지나면서 생각이 변화할 수도 있겠지만, 일단 당분간은 "디지털인문학"으로 표기하도록 하겠다!!




어떻게 보면 정말 쓸데 없는 사소한 것으로 고민에 고민을 거듭했다. 하지만 언어의 힘을 믿기에 신중할 수 밖에 없었다. 또한 그렇기에 고민은 계속된다. 하아...ㅠㅠ


  1. 이희승, 안병희, 한재영, <증보 한글 맞춤법 강의>, 신구문화사, 2012.03.02, p151~p152 [본문으로]
  2. 2014년 6월 15일 RISS을 통한 간략검색결과 [본문으로]

김현교수님이 수업시간에 보여주신 건대 문화콘텐츠학과에서 만든 UCC 영상입니다. 

김현교수님 건대 가실때 같이.....음.....머...그렇다고요. 하하하 -0-;;;



디지털 인문학이라는 신흥학문을 공부하다보면 재미있는 "의견"을 들을 때가 많이 있습니다. 디지털 인문학에 대한 반감만으로 나오는 이런 "의견"에 대답할 필요가 있는지 자체가 의심스럽지만 간단하게나마 이야기해보도록 하겠습니다[각주:1].



1. 디지털 인문학 없어도 지금까지 잘 해왔다?

이런 말은 마치 "지금까지 "한글"이나 "워드"없이 "원고지"에 "펜"으로 논문 잘 써왔다." 라고 말하는것과 다를바가 없다. 요즘 세상에 "한글"이나 "워드"를 사용하지 못해서 "원고지"에 글을 쓰는 사람을 어떻게 생각하는가? 


학문은 끊임없이 발전해왔고, 디지털 인문학은 분명히 인문학의 새로운 가능성을 보여주고 있다. 자신이 못한다는 이유만으로 유용한 도구를 무시하는 것은 바보짓으로밖에 보이지 않는다. 


디지털 인문학을 한다는 것은 기존의 방법론을 모두 버리는 것이 결코 아니다. 지금까지의 방법론을 컴퓨터와 융합하여 더욱 발전 시키자는 것이다. 이제 단순무식한 반복 작업은 컴퓨터에게 맡기고 수집된 자료를 분석하는 인문학자 본연의 임무에 충실하자는 것이다. 




2. 자료를 찾는 것이야말로 인문학의 정수다?

두꺼운 사료를 한글자 한글자 정독하다가 자신이 원하는 내용을 발견했을 때의 희열이야 말로 인문학의 희열이라고 말하는 사람들이 있다. 자료를 찾아낸 희열? 어떤 것에서 재미를 느끼는 것은 개인의 자유이다.


다만 10년동안 조선왕조실록과 관련 자료를 독파하면서 원하는 자료를 찾을 것인가? 아니면 단 한번의 검색으로 1초만에 모든 관련 자료를 찾아낼 것인가?




3. 디지털 자료는 부정확하다. 

디지털 자료는 부정확한 자료가 많기 때문에 믿을 수 없으며 사용하지 않는다라고 말하는 사람들이 생각보다 많다. 그런데 출판된 서적에 얼마나 많은 오탈자가 존재하는지 알고 있는가? 오탈자는 많은 사람들의 퇴고작업으로 줄어든다는 상식도 알고 있는가? 어려운가? 간단히 말해서 브리태니커 백과사전에 비교해서 인터넷 위키백과사전은 사실상 오탈자가 존재하지 않는다.


디지털 자료 자체의 정확도에 대해서도 문제시 하는 사람들이 많다. 인터넷에 올라온 정보들은 믿지 못할 내용이라는 것이다. 하지만 공신력이 있는 디지털 자료는 이미 넘쳐 흐른다. 한국의 역사통합검색시스템에서는 대부분 원문과 번역문 뿐만이 아니라 원문 이미지까지 공개해주고 있다. 무엇보다 많은 사람들이 오탈자뿐만이 아니라 번역상의 문제도 피드백을 해주고 있기에 끊임없이 정확도 100%을 향하고 있다[각주:2]


물론 아직도 많은 자료들이 디지털화되어 있지 못하다. 공신력이 있는 기관에서 지속적인 데이터 구축작업을 진행해야하는 것도 맞다. 그러나 이것은 디지털 자료의 축적량이 아직 부족한 것이지 디지털 자료의 시스템 자체가 부정확한 것은 아니다. 백번 양보해서 설령 지금 당장은 디지털 자료가 부정확하더라도 10년 이내에 기존의 그 어떤 자료보다 정확해질 것이다.


아직도 디지털 자료가 부정확하다고 생각한다면 DBPIA나 KISS 혹은 RISS같은 논문정보제공 싸이트에서 논문을 찾지 말고 직접 국회도서관이나 국립중앙도서관에 가서 하나하나 종이로 인쇄된 논문을 찾기를 바란다. 그게 정확하지 않은가? 




4. 디지털 인문학을 쓰레기라고 해라. 

디지털 인문학에 대한 반론을 제시하는 사람들의 대부분은 자신이 스스로 디지털 인문학을 할 역량이 없다고 생각하기 때문으로 판단될 때가 많다. 다시 말해서 디지털 인문학의 가치나 역할에 대해서 분명히 인지하고 있음에도 불구하고 자신의 밥그릇을 지키기 위하여 열심히 투쟁하고 있는 것으로 보인다. 


당신들이 어떻게 생각하고 어떻게 행동한다고 하더라도 디지털 인문학이 인문학의 가능성이며 대세라는 것은 변하지 않을 것이라 생각하기에 디지털 인문학을 쓰레기라고 하든 말든 필자는 솔직히 관심이 없다. 다만 스스로도 디지털 인문학의 필요성과 중요성을 인지했음에도 스스로 못한다는 이유로 후학들의 길까지 막아버리는 것이 과연 학자의 태도인지 묻고 싶을 뿐이다.



  1. 이럼 "품위"가 없지만...분명히 비꼬는 투로 쓰겠지.....-_- [본문으로]
  2. 영인본이 완벽하다고 말하는 바보는 없으리라 생각한다. 영인본도 사료비판을 통해서 오탈자가 수정되어야하는 부분들이 많이 있다. 디지털 자료는 이런 부분들을 빠르게 받아들여서 수정할 수 있다. [본문으로]


오랜 시간 동안 인류는 "펜"이라는 UI을 사용하였다. 손을 이용하여 종이에 생각을 옮기는 행동을 수행하였다. 컴퓨터가 나타나면서 인간은 "키보드"를 이용하여 자신의 생각을 디지털화하였다. 그러나 키보드는 펜과는 다르게 직관적으로 흥미가 가는 부분를 선택할 수가 없었다. 그래서 펜의 유사품인 "마우스"을 이용하기 시작하였다. 그리고 이제는 다른 부속장비를 쓰지 않고 "손가락"을 통해서 자신의 생각을 나타내기에 이른다.

그런데 사실 무엇인가를 조절하는 것은 결국 "뇌"에서 내리는 지시에 따른 결과일 뿐이다. 우리는 생각을 하고 그 생각이 전류로 변하여 손가락에 움직이도록 명령을 내리고, 손가락은 펜이나 키보드 혹은 마우스 등을 이용하여 생각을 표현한다. 결국 모든 것의 시작은 생각이고, 뇌 속에서 일어나는 전기 작용이다.

그렇기에 인간에게 있어서 가장 최선의 UI는 "뇌"의 생각을 직접적으로 전달하는 UI이다. 그리고 그것은 꿈이 아니다. 위의 영상은 원숭이를 대상으로 한 기초적인 조작에 관한 실험이고, 그 지향점을 장애인들을 위한 UI 제작에 두고 있지만! 현재까지의 내용만으로도 일반인들의 마우스나 터치패드의 역할은 충분히 수행할 수 있을 정도이다.

그리고 뇌UI는 단순히 인간이 뇌를 통해서 컴퓨터를 조작하기만 하는 것이 아니다. 컴퓨터의 정보를 직접적으로 뇌로 전달할 수 있다는 의미이기도 하다. 이제 어떤 정보를 암기하는 것은 의미가 없어진다. 필요할 때 뇌로 전달받으면 된다. 인간에게 가장 중요한 것은 컴퓨터가 행하기 힘든 추론이나 직관 등으로 압축될 것이다. 또한 집단지성도 지금의 클라우딩 기술처럼 사용될 수 있는 것이다. 서로의 뇌를 연결하여 어떤 문제에 대해서 다수의 사람들이 사고를 하여 문제를 해결하게 되는 것이다.

SF 소설이냐고? 아니. 현실이다. 그것도 10년내로 우리가 마주하게 될 현실이다. 50년전을 떠올려보라. 인류가 달에 가는 것은 망상이었다. 40년전을 떠올려보라. 개인용컴퓨터는 어처구니 없는 발상이었다. 30년전을 생각해보라. 인터넷은 극소수 해커들의 이상이었을 뿐이다. 20년전을 생각해보라. 노트북은 첩보영화에서나 나오는 특수장비였다. 10년전을 생각해보라. 지금의 스마트폰은 웃기는 소리였다. 지금 생각해보라. 앞으로 10년 뒤는 어떤 모습 일지.

물론 이런 미래상에는 빛 뿐만이 아니라, 악의적인 기억변형을 비롯한 다양한 어둠이 존재할 것이다. 그러나 기술의 진보는 막을 수 없고, 우리가 할 수 있는 일은 어떻게 최대한 기술의 빛나는 면을 활용하고, 어두운 면을 배제하느냐일 뿐이다.

한국은 출판대국이다. 정확히는 참고서 출판대국이다. 한국에서 출판되고 유통되는 대다수의 서적은 사실 중고등학교 참고서이다. 씁쓸한 현실에 대한 비판은 뒤로 하고, 참고서의 미래를 생각해보자.


맞춤형 교육은 한국 교육의 미래이다. 보편적인 지식의 전달을 넘어서 개개인이 더욱 알고 싶어하는 사항에 대한 내용을 제공하는 것이야 말로 맞춤형 교육의 미래이다. 역사 시간에 난중일기가 언급이 되었는데, 만약 난중일기에 대해서 관심이 있다면, 지금으로서는 난중일기를 찾아서 읽는 방법밖에 없다. 그러나 디지털 교육에서는 그 자리에서 곧장 난중일기의 해석된 전문을 읽을 수 있다. 더 관심을 가진다면 한자로 된 원문과 주석을 볼 수도 있다. 반대로 수학시간에 함수에 대해서 이해가 되지 않았다면, 함수에 대한 추가적인 교육내용을 제공하여 이해가 되지 않는 부분을 보충하게 할 수 있다.


무엇보다 디지털 교육은 단순히 암기력만을 강조하고 있는 현재의 시스템을 완전히 변화시킬 수 있다. 단순한 검색으로 알 수 있는 "년도"나 "고유명사"보다 사건에 대한 이해를 중점으로 하는 교육으로 이행을 할 수 있다. 그래서 수능시험에서도 단순한 계산이나 암기문제보다는 이해를 바탕으로 하는 실전적이고 실천적인 문제를 제시할 수 있다.


그런데 현재의 책으로 출판된 교과서와 참고서는 그 매체의 특성상 보편적인 지식을 밀어넣는 것도 힘들어하고 있다. 맞춤형 교육은 망상이며, 무조건적인 암기만을 강요할 수 밖에 없다. 결국 한국교육의 미래를 위해서는 디지털 교과서와 참고서의 등장은 반드시 필요하다.



사실 디지털 교육을 위한 한국의 환경은 상당히 뛰어나다. 한국의 어느 곳에서도 초고속인터넷 접속이 가능하며, 청소년들도 디지털 매체의 조작을 호흡처럼 생각하고 있다. 다만 제대로 된 디지털 교육 콘텐츠가 부재할 뿐이다. 이러한 디지털 교육 콘텐츠의 부재는 기존 학교선생들의 나태나 출판계 거대권력 참고서 출판사들의 방해 등 다양한 요인을 거론할 수 있다.


그러나 디지털 교육을 위한 콘텐츠 부재의 본질적인 핵심은 정부의 무관심이라고 할 수 있다. 참고서는 어디까지나 교과서의 부산물일 뿐이다. 만약 정부가 앞장서서 "디지털 교과서 표준안"을 마련하고 디지털 교과서로의 이행을 준비한다면, 디지털 교육으로의 이행에 충분한 추진력을 얻을 수 있을 것이다.


물론 디지털 교과서 표준안은 단순히 과거의 교과서 표준안을 복사하는 것으로는 부족하다. 내용의 무한확장이 가능하다는 점을 충분히 인지하고, 그에 합당한 다양한 내용을 포함하기 위한 방안이 마련되어야 한다. 그러나 설령 합리적인 디지털 교과서 표준안이 만들어지지 않더라도, 이를 보충하는 다양한 디지털 참고서가 탄생할 것이다. 정부가 해야되는 일의 핵심은 "디지털 교과서 표준안"을 시작하는 것 뿐이다. 잘하면 좋겠지만, 굳이 뛰어나지 않아도 된다. 시작 자체가 중요하다.



-------------------------------------------------


잡상이라서 아직 정리가 안된 글 ~.~

그냥 아이디어를 배출해서 나열할 뿐~~~

언젠가~ 먼 훗날에...


넓기만 하고 제약이 없으면 저속한 학문이오.

제약만 있고 넓지 못하면 이단이다.


“博而不約俗學也約而不博異端也”(明 劉宗周《論語學案》卷三上論)


디지털 인문학은 현재 넓기만 하고 제약은 없다. 물론 신흥학문으로서 제약이 없다는 것은 학문발전에 원동력이 되기는 하지만, 이제는 제약을 가져야 한다. 하다못해서 지금보다는 명확한 정의와 범위를 가져야 한다. 그렇지 않으면 "저속한 학문"일 수 밖에 없다.


디지털 인문학의 정의와 범위를 지정하는 것은 생각보다 어렵다. 넓게 잡아서 발전을 보장하려고 하면 너무 허황될 수도 있고, 좁게 잡아서 학문으로서 자리를 굳건히 하려고 하면 미래를 망칠수 있다. 하아...쉽지 않다.


논문 표절의 문제는 많은 사람들이 알고 있다. 타인의 논문을 적당한 절차를 거치지 않고 자신의 논문에 쓰는 행위는 연구자로서의 기본적인 도덕문제로 받아들여지고 있다. 그런데 논문 표절의 또 다른 일면에 대해서는 사람들이 잘 모르고 있다.


세상은 넓고 사람은 많다. 그러다 보니 어떤 한 가지 사실에 대한 서로 다른 판단 수 많은 판단이 존재하게 된다. 학계도 예외는 아니어서 어떤 사실에 대한 수 많은 다른 판단이 존재한다. 예를 들어서 "박정희에게 "전 대통령"이라는 칭호를 붙일 수 있는가?" 문제에 가장 간단하게 "쿠데타를 통해서 권력을 잡았기에 전 대통령이라는 칭호는 적합하지 않다."와 "결국 선거라는 적합한 민주적인 절차를 통해서 권력을 잡았기에 전 대통령이라는 칭고가 적합하다" 혹은 "유신개헌 및 그 이후의 행태는 민주주의에 바탕을 둔 행동이라고 할 수 없기에 유신개헌 이후는 '대통령"으로 인정할 수 없다" 등등의 다양한 의견이 가능하다.


이렇게 기존 연구가 충돌을 할 때, 연구자들은 최대한 관련 의견을 모두 열거한 이후에 "본 논문에서는 XXX의 의견에 따른다."라고 하거나 아예 다른 의견을 열거하지 않고 "XXX의 의견에 따르면......"이라고 문장에 명시를 한다. 연구자는 해당 내용에 대한 책임을 "XXX"에게 넘겨 버리는 것이다. 물론 최종적인 책임은 "XXX"을 선택한 연구자 자신에게 있다. 그러나 기본적인 해당 내용 자체에 대한 책임은 "XXX"에게 귀속한다.


실제적인 예시를 살펴보자. 대부분의 거대 "디지털 인문학" 싸이트는 현실적으로 다양한 연구자들에게 프로젝트를 분산해서 처리하도록 한다. 예를 들어서 고전번역원의 고문번역의 경우 다양한 연구자들이 참여해서 번역프로젝트를 수행하고 있다. 그리고 고전번역원은 해당 고문을 서비스할 때 해당 고문 번역 프로젝트의 책임자를 명시한다. 이를 통하여 어떤 고문의 번역에 대한 문제가 있거나 의견이 있을 경우 고전번역원은 1차적인 책임을 면할 수 있다. "이런 번역은 말이 안돼요! 틀렸어요. 수정하세요."라고 한다면 고전번역원은 "책임 번역자에게 문의하겠습니다." 라고 대답한다. 이런 방식은 다양한 의견이 공존하는 분야에서 특히 효과적이다. 번역에는 정답이 없고 다양한 번역 방식이 존재하기 때문이다.


그런데 사실 이런 책임 회피 방식은 과거의 시스템을 디지털 시스템에 억지로 적합시켜서 발생한 일이다. 과거에는 책이나 논문등의 글을 다양한 사람들에게 빠르게 보급하는 것은 꿈과 같은 일이었다. 문제가 있는 내용을 수정하고 재배포하는 것은 더더욱 그러하였다. 그런데 디지털에서는 빠른 보급과 수정이 가능하다. 무엇보다 한 문장에 대한 다른 의견이 있을 경우 모든 의견을 보여줄 수 있다.


과거의 인쇄물에서는 여러가지 제한사항으로 인하여 박정의에게 "전 대통령"이라는 칭호를 붙여주는 문제에 대해서 단 한가지만을 선택할 수 밖에 없는 경우가 있다. 그러나 디지털에서는 모든 의견을 열거해줄 수 있다. 해당 디지털을 보는 사람들은 어느 한 곳으로 편중된 의견이 아닌 소수의견을 포함한 다양한 의견을 보면서 시야를 넓힐 수 있다. 물론 기계적인 중립성의 문제를 벗어나기 위하여 열거된 의견 중에서 가중치를 부여하여 학술의 주류와 비주류를 보여줄 수 있다.


누군가가 고전번역원의 어떤 문장에 대해서 "이 해석은 다르게 해야됩니다. 수정해주세요"라고 한다면, 고전번역원은 이제 "님의 번역문도 등록하도록 하겠습니다" 혹은 "직접 님의 번역문을 등록하시면 됩니다"라고 해버리면 된다. 그럼 기존의 번역문과 추가된 다른 생각의 번역문이 공존하게 된다.


이러한 디지털의 특성을 가장 잘 표현하고 있는 디지털 인문학 싸이트는 한국금석문 종합영상정보시스템이다. 이곳에서는  금석문을 대상으로 다양한 탁본들과 각 탁본의 판독문들 및 각 판독문에 대한 해석문을 체계적으로 보여준다. 비록 각각의 탁본과 판독문 및 해석문간의 상호비교기능은 지원하지 못하고 있지만, 이미 다양한 의견을 한 곳에서 처리하는 개념적 전환과 모습을 보여주고 있다.


네트는 넓다. 디지털 자료는 다양한 의견을 수용할 수 있다. 다양한 의견의 수용은 과거 인쇄매체가 상상은 했지만 실현이 불가능했던 방법이다. 디지털 자료는 한 장소에서 다양한 의견들을 동시에 보여주면서 지식의 생태계를 풍부하게 할 수 있다. 또한 현실적으로 이러한 다양한 의견의 수용은 당신의 책임을 최대한 낮추어줄 수 있다.


"의견이 다르시다고요? 그럼 당신의 의견을 등록하세요."






....평소에도 그렇지만...오늘 쓴 글을 정말 뭔지 모르겠다.-_-;;.....머...일기장이니까......큼큼;;;;


한국 디지털 인문학의 선두주자 한국학중앙연구원 김현 교수님은 현재 인터넷으로 서비스가 되고 있는 "조선왕조실록"을 만든 이후 "조선왕조실록"을 소개하며 거의 반드시라고 해도 좋을 만큼 사용한 "코끼리"예시가 있다.

태종 11년(1411년) 일본 국왕으로 부터 진상되어 조선에 최초로 들어온 코끼리에 대한 이야기는 조선왕조실록에 1411년부터 1421년까지 6편의 단편적인 이야기만을 전하고 있다. 어떤 조선시대 전문가도 우선 코끼리의 존재에 대한 기록들이 나온다는 사실을 눈치채기 어렵고, 설령 코끼리의 존재에 대한 기록들을 알더라도 방대한 조선왕조실록 곳곳에 흩어져 있는 이상 어마어마한 노력을 기울여야 코끼리의 조선 생활을 추적할 수 있다.


디지털 인문학은 기존의 인문학자들에게 방대한 자료에 대한 검색능력은 분명히 인정받고 있다. 인문학 연구를 진행해본 사람들이라면 모두가 이해하겠지만, 필요한 자료를 이용하여 분석하는 시간보다, 필요한 자료를 찾으러 노력하는 시간이 더 오래 걸리고는 하기 때문이다. 디지털 인문학의 성과는 자료를 찾는 시간낭비[각주:1]를 대폭적으로 감소해주었다.



그러나 디지털 인문학의 강점과 능력이 검색능력일 뿐일까?


디지털 인문학의 진정한 강점은 디지털화를 통해서 인간은 흉내내지 못하는 컴퓨터의 빠른 연산 속도를 이용할 수 있게 되었다는 것이다. 검색능력은 컴퓨터의 빠른 연산 속도의 단편에 불과하다. 컴퓨터의 놀라운 연산 능력과 인간의 직관적인 분석능력이 협력을 하면 그 동안 감히 시도해볼 생각도 하지 못하는 일들이 가능하다.


우리는 컴퓨터와 인간의 협력모델을 현재 기업영역에서 사용되는 고객 관계 관리 체계에서 살펴볼 수 있다. 고객 관계 관리 체계(Customer relationship management, CRM)는 소비자들을 자신의 고객으로 만들고 이를 장기간 유지하기 위한 경영방식이다. 그리고 현재 CRM에서 가장 큰 이슈로 대두되고 있는 것이 바로 그 동안의 고객자료을 대상으로 데이터 분석을 통해서 새로운 이익을 창출하는 방법에 대한 이야기이다. 바로 "빅데이터"와 "데이터 마이닝"이 바로 그것이다.


그런데 인문학은 이미 수 천년간 쌓여온 "빅데이터"와 그 동안 발전시킨 "데이터 마이닝"기술을 이미 가지고 있다. 사실 데이터 마이닝의 본질은 기존의 인문학 연구방법과 다르지 않다. 다만 그 동안 한명의 개인으로서는 평생에 걸쳐서 해야될 작업을 컴퓨터가 1분도 안되는 시간에 완성을 해준다는 차이점이 있을 뿐이다. 그렇기에 앞으로 인문학이 배워야할 것은 컴퓨터와 협력하여 데이터를 분석하는 방법이다.



컴퓨터와 협력하면 구체적으로 무엇을 할 수 있냐고?


"인물관계망"이라는 것을 들어보았는지 모르겠다. 사람들은 혈연, 지연, 학연 및 온갖 방식의 인맥으로 서로 연결되어 있다. 그리고 여러 인물들간의 관계에 대해서 조사하는 것이 얼마나 중요한지는 인문학 연구자들이 더욱 더 잘 알고 있다고 생각한다. 컴퓨터와의 협력은 한국 역사에서 출현하는 모든 인물들의 상호관계에 대해서 분석을 가능하게 할 수 있다.


물론 인문학 연구자들도 정사와 족보 및 서찰의 왕래등의 온갖 정보를 취합하여 1~2명을 중심으로 하는 "인물관계망"을 제작할 수 있을 것이다. 그러는데 걸리는 시간이 얼마일까? 컴퓨터는 10초미만의 시간으로 여러분들에게 1~2명이 아닌 모든 인물에 대한 인물관계망을 제시해줄 수 있다.


심지어 인문학 연구자들도 시간과 재력의 한계로 포기할 수 밖에 없는 조사범위까지 무한정 확장해줄 수 있다. 예를 들어서 우리는 같은 관청의 같은 부서에서 일한 사람들은 최소한 서로가 서로를 안다고 추론적으로 가정할 수 있다. 서로간의 관계가 좋을 수도 있고 나쁠 수도 있지만, 서로가 서로를 알고 있다는 것은 변함이 없다. 그러나 이런 관계까지 조사하는 것은 모든 임명장을 비롯한 "잡다한 자료"을 모두 모아서 분석해야된다는 의미이기에 포기할 수 밖에 없는 지점이다. 그런데 컴퓨터는 여유롭게 이런 것들을 처리할 수 있다.



컴퓨터는 절대적이 아니야!


맞다. 컴퓨터는 절대적이지 않다. 컴퓨터는 인간의 분석능력을 따라갈 수 없다. 그러나 반대로 인간은 컴퓨터의 계산능력을 따라갈 수 없다. 석사까지 역사학을 연구했던 본인도 모아놓은 자료들간의 연결고리를 찾아내고 논리의 끈으로서 이들을 묶어나가며 희열에 가득차고는 했다.


자료간의 연결고리를 찾아내고 논리로 연결하는 행위는 컴퓨터는 손대지 못할 영역이다. 그러나 자료를 찾고, 자료를 처리하는 작업은 인문학 연구의 본질도 아닌 "지식 노가다"행위에 가깝다. 왜 굳이 쓸모 없는 시간 낭비를 하려고 하는가? 우리의 사랑스런 컴퓨터에게 짐을 넘겨주도록 하자. 그리고 우리는 인간이 할 수 있는 위대한 일에만 집중을 하자.




  1. 사실 단순한 시간낭비만은 아니다. 특히 처음 연구방법에 대해서 공부하는 사람들은 자료를 찾는 과정에서 자료에 대해서 공부를 하게 되며, 이런 과정을 통해서 자료에 대한 이해가 깊어진다. 문제는 몇 십년간 연구한 학자들도 열심히 자료를 찾아야 한다는 점이다. [본문으로]

디지털 인문학은 이제 시작하는 단계이다. "디지털 인문학"의 정의조차 아직 명확하지 않고, 연구 방법과 연구범위도 아직은 논의를 하고 있는 단계라고 할 수 있다. 한국에서도 디지털 인문학 관련 학과의 석박사 졸업생들이 이제야 하나 둘 씩 배출되는 과정에서 디지털 인문학 석박사 논문의 주제와 범위 및 방법은 아직도 고민의 단계라고 할 수 있다.


그렇다면 디지털 인문학의 논문의 대상 어떤 것이 있을 수 있을까?


1. 디지털 인문학의 철학 및 역사

어떤 학문이든 해당 학문의 철학과 역사의 연구는 필연적으로 발생한다. 디지털 인문학을 어떻게 정의하냐는 문제부터 시작하여 지금까지의 디지털 인문학 발전사 등의 가장 기본적인 내용이지만 반드시 필요한 대상에 대한 연구 논문이 가능할 것이다. 좀 강하게 이야기하면, 지금 수준의 디지털 인문학 기반연구는 학문으로서 정립되기 위한 수준으로는 한참 미달한다고 생각될 정도이다.


추가적인 사항으로 모든 학문이 그렇지만, 디지털 인문학은 특히나 신흥학문으로서 학문의 발전을 위해서 후학들의 양성에 신경을 쓰고 있다. 특히 대다수의 디지털 인문학 연구자들이 디지털 인문학을 인문학의 필수적인 방법론으로 자리잡을 것으로 예상하는 만큼 디지털 인문학 연구자의 배양 뿐만이 아니라, 기존 인문학 영역의 연구자들에 대한 디지털 인문학 교육방안에 대한 고민은 매우 중요한 논문 주제라고 판단된다.



2. 디지털 인문학 정보처리방법

디지털 인문학은 그 특성상 데이터베이스 구축부터 시작하여 시각화까지 다양한 프로젝트를 수행하게 된다. 설령 수행하지 않더라도 수행 프로젝트에 대한 기획단계까지는 몇 가지나 가지고 있기 마련이다. 그렇기에 논문의 대상을 프로젝트 수행 전반으로 잡아서 구체적인 디지털 인문학 프로젝트의 수행과정에 대해서 논문을 쓸 수 있을 것이다. 구체적으로 메타언어 설계, DB설계, 데이터마이닝, 텍스트마이닝, 시각화 방법 등등의 내용이 가능할 것으로 보인다. 물론 각각의 세부 사항에 주제를 한정하여 논문을 작성하는 것도 가능할 것으로 생각된다.


디지털 인문학 프로젝트의 세부 분류는 개략적으로 다음과 같이 나눌 수 있다.

1. 자료수집-저장 : 디지털화 혹은 디지털로 생산하는 방법을 대상으로 하는 내용

2. 데이터마이닝(분석) : 디지털 자료에 대한 분석 방법을 대상으로 하는 내용

3. 가시화(UI) : 디지털 자료나 분석툴의 자료 및 UI 자체 등 보여주는 부분을 대상으로 하는 내용


추후 디지털 인문학 프로젝트 연구가 디지털 인문학 연구의 핵심주제가 될 것으로 생각된다. 그래서 현재로서는 전체 프로젝트에 대한 포괄적인 설명이 중심이 되겠지만, 추후에는 세부 기술적인 사항에 대한 전문적이고 심도 있는 연구가 이루어질 것으로 예상된다.



3. 디지털 인문학의 인문학적 응용

디지털 인문학은 인문학 연구의 새로운 형태이다. 다시 말해서 결국 기존의 인문학 연구 방법에 기여하거나, 기존의 인문학 연구에서는 나타나지 않은 연구방법을 제시하는 등의 역할을 수행하게 된다. 기존의 인문학 연구자들이 직접적으로 디지털 인문학의 성과를 활용하면 좋겠지만, 실질적으로는 우선 디지털 인문학 프로젝트를 수행한 연구자들이 디지털 인문학의 성과를 활용한 연구를 보여주어 모범이 되는 것이 합당하다고 하겠다.


여기서 디지털 인문학을 어떻게 생각하느냐에 따라서 두가지 미래 예측을 할 수 있다. 만약 디지털 인문학이 인문학의 도구적 학문으로 생각한다면, 추후 디지털 인문학의 인문학적 응용은 기존 인문학 연구자들의 몫으로 전환되어야 할 것이다. 그러나 만약 디지털 인문학을 인문학의 새로운 모습으로 생각한다면 기존의 인문학 연구자들을 디지털 인문학의 영역으로 포괄하는 식으로 이루어지게 될 것이다.




석사 논문의 경우 위에서 하나의 영역만을 선택하여 진행하여도 무방하다고 생각된다. 사실 프로젝트의 세부분류 혹은 하나의 기술적인 요인들에 대한 연구만 해도 충분하다고 본다. 그런데 박사논문의 경우는 최소한 2가지 이상의 사항이 동시에 출현하여야 하지 않을까 스스로 세뇌시켜 본다. 바로야. ㅠㅠ 할수 있어.ㅠㅠ 해야돼..ㅠㅠ 아..왜 눈물이..ㅠㅠ 자기 무덤 자기가 파고 있는거 같아..ㅠㅠ


전통적인 인문학에서 디지털에 대해서 가장 많은 비평을 하는 것 중에 하나가 "디지털화 해놓은 자료에 오탈자가 많아서 학문적으로 사용하기 힘들다는 것"이다. 오탈자는 엄정한 연구에서 분명히 문제가 되는 부분이며, 끊임없는 검토가 필요하다. 그런데 오탈자가 디지털화한 자료를 학문의 자료로 사용하지 못할 정도인가?


인문학의 기초는 자료에 대한 점검으로 시작한다. 자료의 출처는 어디인가? 자료의 내용에 문제는 없는가? 고대문헌을 대상으로 하는 점검은 문헌학 혹은 고문헌학이라는 독립적인 학문분파가 세워질 만큼 방대하고 어려운 작업이며, 인문학에서 기본 중에 기본인 작업이다.


그런데 인문학의 자료들을 보면 사실 생각보다 오탈자가 있는 사료가 많이 있다. 정식으로 출판된 서적에서조차 오탈자는 흔히 발견되고는 한다. 당연한 일이다. 인간이 하는 일인 이상 당연한 일이다. 여러분들에게 10페이지 정도의 글을 나누어주고 그것을 옮겨 적으라고 하면 한두글자의 오탈자는 반드시라고 해도 좋을 만큼 발견되는 것이다.


결국 전통적인 인문학에서도 오탈자의 문제는 피해갈 수 없다. 그런데 디지털에서는 비록 오탈자 문제 자체는 피해갈 수 없지만, 오탈자 문제를 효율적으로 해결할 수 있는 속성을 내포하고 있다. 과거의 출판물은 한 번 인쇄과정이 끝난 이후에 오탈자가 발생할 경우, "정오표"를 배포하는 수 밖에 없다. 그러나 디지털화된 문서는 매우 손쉽게 입력-수정이 가능하다.


결국 디지털화된 자료에서 발견되는 오탈자는 오히려 전통적인 인문학에서 발생한 오탈자보다 훨신 빨리 수정될 수 있고, 보다 완전한 자료가 되어 간다. 전통적인 인문학에서 거론하는 디지털화된 자료의 오탈자 문제는 자기 자신을 되돌아보지 못하는 무조건적인 반감에 불과하다.


오히려 근본적인 문제는 디지털화된 자료가 너무 빠르게 오탈자를 수정하여 고정화되지 않기에 속도가 비교적 느린 인문학 연구가 이를 따라가지 못하는데 있다. 그런데 이 문제는 수정전 히스토리에 고유값을 부여하는 방법으로 간단하게 해결될 수 있는 문제이다. 인문학이여 디지털을 무서워하지 마라. 디지털을 이용하라.



시간과 공간은 어떤 연구를 하더라도 기본 중에 기본이다. 그럼 "디지털 인문학"의 기본은 시간과 공간은 어떻게 디지털을 이용하여 효율적으로 처리하느냐가 기본적인 문제가 된다. 그래서 기본 중에 기본을 하자는 마음가짐이다. 

시간은 아래의 시간DB에 UI개혁과 집단지성을 활용하기 위한 사용자 참여를 추가
http://authority.ddbc.edu.tw/time/

공간은 아래의 중국공간DB 틀 위에 한국DB를 넣고, 지명간의 관계를 정의하는 요소 및 UI의 개선과 집단지성 활용을 위한 사용자 참여 추가
http://www.fas.harvard.edu/~chgis/data/chgis/downloads/v5/datasets/index.html


배끼는 것 아니냐고? 글쎄...배낀 것이라는 소리가 안 나올정도로 다르다. 최초 개념만 펜치마킹하는 수준이니 말이다. 이것을 배낀 것이라고 하면 세상 아래 새로울 것은 하나도 없다라는 말 밖에 안된다.

박사과정에서 완성할 건 딱 저정도이다.(사실 더 많지만...최소한의 최소한은 저것이다. 저것만 해도 어디냐..ㅠㅠ) 쉬워보이는가? 시간은 그나마 연구된 것이 있어서 삽질을 조금만 해도 되지만(이쪽은 프로그래밍 삽질이 더 많다). 공간쪽은 인문학영역의 연구부터 시작해야되기에 과연 끝낼 수 있을지 의문스러울 정도이다.ㅠㅠ


R을 통해서 단일 논문에서 자주 출현하는 키워드를 클라우드로 구현해보았다. 대상 논문은 김현교수님의 "디지털 인문학:인문학과 문화콘텐츠의 상생 구도에 관한 구상[각주:1]"으로 하였다. 만약 어떤 문장에서 자주 출현하는 단어들과 그 빈도수를 시각화하고 싶다면 괜찮은 방법으로 생각된다. 






김현 교수님의 "디지털 인문학:인문학과 문화콘텐츠의 상생 구도에 관한 구상"은 너무나 당연하게도 "인문학"과 "디지털"이 가장 많이 출현하였다. 특히 인문학의 기본에 디지털을 추가한다는 개념과도 같게 "인문학"은 물론이고 "인문"도 자주 출현하는 것을 볼 수 있다. 그 뒤를 "지식"이 따라가고 있다. 재미있는 것은 제목에 출현한 "문화콘텐츠"보다 "인문콘텐츠"의 출현빈도가 더욱 많다는 것이다. "인문콘텐츠"을 강조하고 싶으셨나 보다.


그 뒤를 따르고 있는 단어들은 대부분이 "연구"나 "인력" 혹은 "교육" 및 "육성"등이 자치하고 있다. 이는 본 논문에서 가장 중요시 하는 것이 앞으로 디지털 인문학이 발전하기 위하여 후학들을 어떻게 교육시키고 육성할 것인가에 맞추어져 있다고 할 수 있다.



# 모든 명령어의 세부 내용이 궁금할 때에는 "?file"혹은 "??file"의 형식으로 입력하면 상세한 설명이 당신의 눈앞에 펼쳐진다. 물론 영어 압박이다. 하지만...이쪽 바닥이 원래 꼬브랑말을 할 수 밖에 없다. ~.~;;

# 중간중간 실행결과를 "dh.lines"처럼 입력해서 구동하는 것을 추천한다. 그래야 어떻게 변환됐는지 알 수 있다.

# 본 내용에서는 다음과 같은 팩키지를 사용하게 된다. "KoNLP"는 한글에 관한 텍스트 마이닝(text mining package)의 기본이며 필수라고 생각해도 무방하다. "RColorBrewer"는 시각화시의 색 관련 사항이다. 아름다운 시각화에 관심이 없으면 무시해도 좋다. "wordcloud"는 단어들을 크라우드로 변환해주는 package이다.

# 패키지를 설치한다.

install.packages("KoNLP")
install.packages("RColorBrewer")
install.packages("wordcloud")

# 패키지를 로딩한다.

library(KoNLP)
library(RColorBrewer)
library(wordcloud)

# 한글처리의 경우 "UTF-8"코드로"txt"형식으로 저장이 기본이다.

dh <- file("c:/rtext/dh.txt", encoding="UTF-8")

# 불러온 text에 라인을 넣어주어야 한다.

dh.lines <- readLines(dh)

# 세종단어집을 불러온다. 그런데 세종단어집은 완전하지 않다.

useSejongDic()

# 그래서 "dh.lines"을 실행해서 세종단어집에 포함되지 않은 아래 단어들을 적당히 추가시켰다. 참고로 단어집에 포함되지 않은 단어들은 조사와 붙어서 나오는 경우가 많다.

mergeUserDic(data.frame(c("문화콘텐츠","인문콘텐츠","스토리텔링","코디네이터","콘텐츠"), c("ncn")))

# 이제 라인으로 구획된 text에서 단어만을 추출해준다.

dh.nouns <- sapply(dh.lines, extractNoun, USE.NAMES=F)

# 이제 각각의 단어들이 몇 회 출현하였는지 숫자를 센다. 사실 데이터만으로는 "dh.wordcount"만으로 완성되었다고 볼 수 있다. 남은 건 가시화다.

dh.wordcount <- table(unlist(dh.nouns))

# 예쁘게 꾸미기 옵션이다. 세팅을 바꾸어가면서 색의 변화을 즐겨보자. 본인은 취미 없다.

pal <- brewer.pal(12,"Set3")
pal <- pal[-c(1:2)]

# 이제 실제로 가시화를 한다. 랜덤으로 해놓고 몇 번 실행하면서 마음에 드는 것을 적당히 골라도 되고, 처음부터 철저하게 원하는대로 나오도록 세팅해도 된다. 본인은 렌덤이다.

wordcloud(names(dh.wordcount),freq=dh.wordcount,scale=c(6,0.3),min.freq=10,
          random.order=T,rot.per=.1,colors=pal)


  1. ...본인의 글이 아니어서 함부로 전문을 올리기가 힘들다. 각자 알아서 적당한 소설이나 논문을 대상으로 해보도록-0-;;; [본문으로]

디지털 인문학은 인문학과 IT의 융합이다. 더 정확히 말하면 인문학의 "당연한 것"과 IT의 "당연한 것"을 융합하여 "당연하지 않은 것"을 만드는 작업이다.

인문학만 보면 너무 당연하다고 생각하지만 IT에서는 의문을 표시하고, IT에서는 너무나 당연하지만 인문학에서는 의문을 표시하는 내용들을 다루다보니 각각의 영역에서 당연한 것을 건드릴 가치가 있느냐? 혹은 이해도 안되고 이상하다라는 평가가 수반되게 된다.

하지만 당연한 것은 그 무엇보다 강력한 힘이며 진리이다. 인간은 밥을 먹는다. 너무나 당연하지만 반대로 밥을 먹지 않으면 죽는다. 인간은 죽는다. 너무나 당연하지만 결코 피해갈 수 없다. 당연한 것은 너무나 당연해서 무시하는 순간 진리에서 멀어진다.


그런 의미에서 너무나 당연한 "대상", "시간", "장소"에 대해서 더욱더 파고 들어볼 것이다. 뭐냐고? 초등학생도 배우는 육하원칙의 "누가", "언제", "어디서"다. 당연한가? 그래서 중요하다.


+ Recent posts