the digital history of the History of Woman Suffrage



여성의 참정권의 역사를 당시의 텍스트 자료에서 출현하는 말뭉치(코퍼스) 분석을 통한 단어들의 빈도를 통계를 통하여 분석하고 해석한 글이다. 여성 참정권에 별 관심이 없어서 내용은 잘 보지는 않았다. 다만 해당 방법은 한국의 정치나 언론학계에서도 번번히 사용되는 말뭉치 분석 방법이며 어렵지 않다. 



바로 : 현재 한국은 세종 21세기 프로젝트를 통해서 다양한 말뭉치를 구축해놓았으며, 간단한 말뭉치 분석 프로그램들이 오픈소스로 공개되어 있는 상황이다. 사실 저 정도의 분석은 자체는 대상 텍스트만 있다면 길어봐야 10분이면 해결이 된다. 문제는 도출된 분석 결과를 어떻게 해.석.하느냐이다. 해석에는 반드시라고 해도 좋을만큼 인문학자가 필요하다. 그러나! 그렇다고 인문학자는 해석만 해도 된다는 소리는 결코 아니다. 대체 어떤 인문학자가 원본자료도 안 찾아보고 딸랑 나온 자료로만 해석하는가?! 분석에도 해석만큼은 아니지만, 대상자료의 선정부터 분석방법 선택 등등에서 판단이 들어가야하기에 인문학자 스스로도 "분석"을 할 줄 알아야 한다. 


댓글을 달아 주세요

  1. liujia  수정/삭제  댓글쓰기

    안녕하세요. 말뭉치 분석 프로그램을 찾았더니 여기에 왔습니다. 저는 한국어 공부하고 있는 중국 유학생인데요. 논문을 쓸 때 말뭉치로 오류 분석하고 싶은데 어떻게 해야 할 지 전혀 몰라서 이렇게 문자 남겨드립니다. 이 프로그램은 어디서 다운받을 수 있는지 사용방법은 어디서 배울 수 있는지를 알려 줄 수 있을까요? 급해서 혹시나 보시면 알려주실 수 있을 까요?

    2016.04.12 19:27
    • Favicon of https://www.ddokbaro.com BlogIcon 바로바로  수정/삭제

      위의 내용은 영어에 대한 간단한 형태소 추출에 가깝습니다.

      말씀하신 논문에 쓰기 위한 오류분석은 아마도 "중국유학생의 한국어 쓰기에서의 오류분석"일듯 한데...그건 단순한 툴로 해결할 문제가 아닙니다.

      우선 대상 text을 확보하고, 해당 text로 원하는 분석을 위한 코퍼스를 구축하고, 구축된 코퍼스에서 데이터를 추출하여, 분석을 하는 작업이 필요합니다. 이 과정에서는 필요한 방법은 한두가지가 아닙니다. 다시 말해서 급하다고 하셨는데...급하게 할 수 있는 것이 아니라, "전산언어"의 기본부터 차근차근 배워야 해결될 문제입니다.

      코퍼스 확보까지는...제 기억이 맞다면 연세대쪽에서 외국인들의 한국어 코퍼스가 있기는 한것으로 알고 있습니다. 다만 연세대에서 해당 자료를 확보하기도 쉽지는 않을 것이고, 설령 확보해도 데이터를 추출할 수 있는 방법을 모르면 그다지 쓸모가 있다고 하기도 어렵군요.

      2016.04.16 04:53 신고

BLOG main image
바로바로의 중얼중얼
인문학과 IT의 융합을 추구하는 디지털 인문학을 공부하고 있습니다. 그리고 중국을 비롯한 다양한 취미생활을 통하여 박학을 추구하는 잡학입니다. 개인적인 문의는 제 메일(ddokbaro@g메일.com)로 해주시기 바랍니다.
by 바로바로

카테고리

분류 전체보기 (3620)
디지털인문학 (256)
30살의 병사생활 (5)
중얼중얼 (435)
한국이야기 (140)
중국이야기 (1351)
중국유학 (282)
중국만화 (487)
역사-歷史 (202)
번역 프로젝트 (70)
취미생활 (224)
로바로바 (8)
Language (40)
中文 (100)
일본이야기 (17)
TNM Media textcube get rss DNS Powered by DNSEver.com
바로바로's Blog is powered by Textcube. Designed by Qwer999. Supported by TNM Media.