the digital history of the History of Woman Suffrage



여성의 참정권의 역사를 당시의 텍스트 자료에서 출현하는 말뭉치(코퍼스) 분석을 통한 단어들의 빈도를 통계를 통하여 분석하고 해석한 글이다. 여성 참정권에 별 관심이 없어서 내용은 잘 보지는 않았다. 다만 해당 방법은 한국의 정치나 언론학계에서도 번번히 사용되는 말뭉치 분석 방법이며 어렵지 않다. 



바로 : 현재 한국은 세종 21세기 프로젝트를 통해서 다양한 말뭉치를 구축해놓았으며, 간단한 말뭉치 분석 프로그램들이 오픈소스로 공개되어 있는 상황이다. 사실 저 정도의 분석은 자체는 대상 텍스트만 있다면 길어봐야 10분이면 해결이 된다. 문제는 도출된 분석 결과를 어떻게 해.석.하느냐이다. 해석에는 반드시라고 해도 좋을만큼 인문학자가 필요하다. 그러나! 그렇다고 인문학자는 해석만 해도 된다는 소리는 결코 아니다. 대체 어떤 인문학자가 원본자료도 안 찾아보고 딸랑 나온 자료로만 해석하는가?! 분석에도 해석만큼은 아니지만, 대상자료의 선정부터 분석방법 선택 등등에서 판단이 들어가야하기에 인문학자 스스로도 "분석"을 할 줄 알아야 한다. 



타이완역사 디지털도서관 - 主義 검색결과



국립타이완대학교에서 1621년부터 1911년 사이의 250종류의 자료소스를 바탕으로 언어학의 분석도구나 네트워크분석 방법론 등 다양한 디지털인문학 분석방법론을 제공하여 타이완의 근현대 사회 연구에 큰 도움을 주고 있다. 예를 들어서 언어학의 접사분석모델을 이용하여 “주의(主義)”의 전방접사의 시대별 빈도를 추출해주고 있다. 이는 개념사 영역의 역사 연구자들은 특정 단어의 전방접사 빈도를 통하여 당시의 시대상과 용어의 변천에 대해서 규명하는데 도움을 주고 있다. 또한 네트워크 방법론을 통하여 토지매매에서의 인물간 네트워크 혹은 GIS(지리정보시스템)을 통하여 토지매매에 대한 지리학적 분석을 지원하는 디지털 도구를 제공하고 있다.


타이완 역사 디지털 도서관 홈페이지 : http://thdl.ntu.edu.tw/


분석보조도구들은 공개가 되어있으나 메인데이터베이스는 가입을 해야만 사용 가능하다. 가입은 http://thdl.ntu.edu.tw/THDL/OnlineTools/Reg/ApplyAccount_Sender.php 을 통해서 신청을 하면 메일로 가입확인메일이 온다. 다만...곧장이 아니라 시간이 좀 소요된다.


바로 : 본 싸이트의 강점은 웹에서 곧장 사용가능한 다양한 종류의 디지털분석툴을 제공하고 있다는 점이다. 중국어가 가능하신 분들은 직접 가셔서 온갖 보조도구들을 체험해보시길 바란다.



과거 문헌들에 사용된 문장간의 인용관계 관계도이다.



도쿄대학 지식의 구조화 센터(東京大学知の構造化センタ)에서 일본을 대표하는 사상 철학 처널인 이와나미 서점의 「사상(思想)」을 대상으로 디지털인문학의 방법론을 동원하여 연구한 프로젝트이다. 디지털 방법론의 1단계로 종이문서로 되어 있는 “사상(思想)”을 OCR 기술을 이용하여 디지털화하였다. 그 이후 디지털화 된 “사상(思想)” 텍스트에 대하여 자체 제작한 온톨로지 시스템 MIMA서치(MIMAサーチ)을 활용하여 말뭉치(코퍼스) 분석을 하여 그 결과를 시각화하였다. 


일본 잡지 사상의 구조화(「思想」の構造化) http://www.cks.u-tokyo.ac.jp/p1.html 


VOYANT는 웹기반 말뭉치(코퍼스) 분석 시스템이다. 텍스트를 직접 입력하여 분석하거나, 대용량 문서의 경우 문서파일을 업로드하여 분석을 진행할 수도 있다. 정교한 말뭉치(코퍼스)분석까지는 불가능하지만, 일반적인 태그클라우드, 단어출현빈도, 단어전후위어 분석 등은 효율적인 인터페이스(UI)을 통해서 사용자에게 제공하고 있다. 다만 영어에 대한 분석만을 지원하고 있다. 


http://voyeurtools.org/


바로 : 같은 방식의 한국어 웹기반 말뭉치 분석 시스템도 구축가능할듯 하다. 이쪽은 언어학계열에서 만들지 않을까?! 본인에게는 직접적인 관심사가 아니라...^^:::




+ Recent posts