
the digital history of the History of Woman Suffrage
여성의 참정권의 역사를 당시의 텍스트 자료에서 출현하는 말뭉치(코퍼스) 분석을 통한 단어들의 빈도를 통계를 통하여 분석하고 해석한 글이다. 여성 참정권에 별 관심이 없어서 내용은 잘 보지는 않았다. 다만 해당 방법은 한국의 정치나 언론학계에서도 번번히 사용되는 말뭉치 분석 방법이며 어렵지 않다.
바로 : 현재 한국은 세종 21세기 프로젝트를 통해서 다양한 말뭉치를 구축해놓았으며, 간단한 말뭉치 분석 프로그램들이 오픈소스로 공개되어 있는 상황이다. 사실 저 정도의 분석은 자체는 대상 텍스트만 있다면 길어봐야 10분이면 해결이 된다. 문제는 도출된 분석 결과를 어떻게 해.석.하느냐이다. 해석에는 반드시라고 해도 좋을만큼 인문학자가 필요하다. 그러나! 그렇다고 인문학자는 해석만 해도 된다는 소리는 결코 아니다. 대체 어떤 인문학자가 원본자료도 안 찾아보고 딸랑 나온 자료로만 해석하는가?! 분석에도 해석만큼은 아니지만, 대상자료의 선정부터 분석방법 선택 등등에서 판단이 들어가야하기에 인문학자 스스로도 "분석"을 할 줄 알아야 한다.
댓글을 달아 주세요
안녕하세요. 말뭉치 분석 프로그램을 찾았더니 여기에 왔습니다. 저는 한국어 공부하고 있는 중국 유학생인데요. 논문을 쓸 때 말뭉치로 오류 분석하고 싶은데 어떻게 해야 할 지 전혀 몰라서 이렇게 문자 남겨드립니다. 이 프로그램은 어디서 다운받을 수 있는지 사용방법은 어디서 배울 수 있는지를 알려 줄 수 있을까요? 급해서 혹시나 보시면 알려주실 수 있을 까요?
2016.04.12 19:27위의 내용은 영어에 대한 간단한 형태소 추출에 가깝습니다.
2016.04.16 04:53 신고말씀하신 논문에 쓰기 위한 오류분석은 아마도 "중국유학생의 한국어 쓰기에서의 오류분석"일듯 한데...그건 단순한 툴로 해결할 문제가 아닙니다.
우선 대상 text을 확보하고, 해당 text로 원하는 분석을 위한 코퍼스를 구축하고, 구축된 코퍼스에서 데이터를 추출하여, 분석을 하는 작업이 필요합니다. 이 과정에서는 필요한 방법은 한두가지가 아닙니다. 다시 말해서 급하다고 하셨는데...급하게 할 수 있는 것이 아니라, "전산언어"의 기본부터 차근차근 배워야 해결될 문제입니다.
코퍼스 확보까지는...제 기억이 맞다면 연세대쪽에서 외국인들의 한국어 코퍼스가 있기는 한것으로 알고 있습니다. 다만 연세대에서 해당 자료를 확보하기도 쉽지는 않을 것이고, 설령 확보해도 데이터를 추출할 수 있는 방법을 모르면 그다지 쓸모가 있다고 하기도 어렵군요.