고적한자출현빈도통계는 강희자전(康熙字典)과 사고전서(四库全书) 그리고 사부총간(四部丛刊)의 디지털화 작업을 하면서 출현하는 한자들의 빈도수를 조사하였다. 그 외에도 디지털화를 하는 과정에서의 몇 가지 규칙들이 같이 소개되어 있다. 인문정보학을 공부하는 사람이라면 한번쯤 읽어볼만 하다.





그러나 재미있는 것은 그것이 아니라!!! "고적에서 가장 많이 출현하는 한자가 무엇이냐!?"라는 단순한 궁금증이다. 고문에서 가장 많이 등장하는 상위 50개 한자를 아래에 첨부하였다. 다른 숫자는 굳이 볼 필요가 없을 것이고, 한자 아래 등장하는 첫항은 해당 한자의 총 출현횟수이고, 그 다음은 만자당 해당 한자가 출현하는 평균횟수이다.



之가 압도적인 1위를 하였다. 그 다음으로 不자가 2등을 하였고, 미세한 차이로 以가 3등을 차지하였다. 이 수치들을 이용하여 해당 내용을 시각화해서 보여주면 나름 재미있을 것 같다. 3만자의 한자가 고적에 출현하는 빈도를 보여주는 시각화라.....한가해지면 해볼까나. -0-!



제목 : 《中国语言生活绿皮书-古籍汉字字频统计》

작가 : 北京书同文数字化技术有限公司 编

출판사 : 商务印书馆

출판년도 : 2008-07-01

ISBN : 9787100056076


BLOG main image
바로바로의 중얼중얼
인문학과 IT의 융합을 추구하는 디지털 인문학을 공부하고 있습니다. 그리고 중국을 비롯한 다양한 취미생활을 통하여 박학을 추구하는 잡학입니다. 개인적인 문의는 제 메일(ddokbaro@g메일.com)로 해주시기 바랍니다.
by 바로바로

카테고리

분류 전체보기 (3619)
디지털인문학 (256)
30살의 병사생활 (5)
중얼중얼 (435)
한국이야기 (140)
중국이야기 (1351)
중국유학 (282)
중국만화 (487)
역사-歷史 (202)
번역 프로젝트 (70)
취미생활 (224)
로바로바 (8)
Language (40)
中文 (100)
일본이야기 (17)
TNM Media textcube get rss DNS Powered by DNSEver.com
바로바로's Blog is powered by Textcube. Designed by Qwer999. Supported by TNM Media.