이름 : 베이징동악묘가상360도파노라마여행(北京东岳庙虚拟360度全景漫游)

기관 : 베이징민속박물관(北京民俗博物馆), 바이두(百度)

주소 : http://www.dym.com.cn/bwg/


베이징 민속박물관이 위치한 동악묘를 대상으로 Krpano 파노라마를 이용하여 가상여행 체험을 할 수 있도록 하였다.


바로 : 시각화와 UI측면은 괜찮은 수준이지만, 핫스팟등을 통하여 다른 정보를 제공하지는 않기에 단순히 돌아보는 이상의 역할을 하지 못한다.





* DH 리뷰는 DH스터디를 간략하게 요약한 내용입니다. DH스터디는 한국학중앙연구원에서 진행되며 모든 분들의 참가를 환영합니다. DH스터디에 관한 문의 사항은 ddokbaro@gmail.com 으로 언제든지 연락해주시기 바랍니다.







이름 : 버츄얼쿄토(バーチャル京都)

기관 : 리츠메이칸 대학교(立命館大学)

주소 : http://www.geo.lt.ritsumei.ac.jp



일본 교토를 대상으로 GIS(지리정보시스템) 기술을 응용하여 갤러리, 2D, 3D등으로 가시화하는 방법을 연구하고 있다.


바로 : 인문학정보를 GIS을 지용하여 가시화하는 방법론에서는 다양하고 심도 깊은 연구가 이루어지고 있다. 다만 하나의 시스템으로 통합되지 못하고, 각 개 연구로만 진행되고 있어서 아쉬움이 있으며, API와 같은 공유기술을 접목하고 있지 않다.


* DH 리뷰는 DH스터디를 간략하게 요약한 내용입니다. DH스터디는 한국학중앙연구원에서 진행되며 모든 분들의 참가를 환영합니다. DH스터디에 관한 문의 사항은 ddokbaro@gmail.com 으로 언제든지 연락해주시기 바랍니다.





이름 : 한국불교문화종합시스템

기관 : 동국대학교

주소 : http://buddha.dongguk.ac.kr/



동국대학교가 그 동안 진행해온 한국불교전서와 한글대장경 및 불교사전을 디지털화 한 작업이다.


바로 : 제대로된 서비스유지도 안되고, IE에서만 정상적으로 작동한다. 이렇게 관리 되지 않는 싸이트는 차라리 국가에서 지정 통합기관을 마련해서 DB관리를 하는 편이 좋을 듯 하다.





* DH 리뷰는 DH스터디를 간략하게 요약한 내용입니다. DH스터디는 한국학중앙연구원에서 진행되며 모든 분들의 참가를 환영합니다. DH스터디에 관한 문의 사항은 ddokbaro@gmail.com 으로 언제든지 연락해주시기 바랍니다.









이름 : 중국기본고적고(中国基本古籍库)

기관 : 베이징아이루셩디지탈화기술연구센터(北京爱如生数字化技术研究中心)

주소 : 웹기반 시스템이 아니기에 해당사항 없음


중국기본고적고는 대형의 종합고적DB로서 북경대학교 교수 리우쥔원(刘俊文)의 총감독하에 베이징아이루셩디지털화기술연구센타에서 만들었다. 중국기본고적고는 선진시대부터 민국시대에 이르는 중국 역사 서적을 집대성한다는 계획아래 방대한 중국역사DB을 모아서 데이타량만 330G에 이르고 있다. 시대별, 서적별, 작가별, 검색기능을 제공하고, 다운로드 기능과 인쇄기능을 제공하고 있다.


바로 : 방대한 자료는 그 자체로 연구에 거대한 도움을 준다. 하지만 API을 지원하지 않아서 빅데이타를 처리하는 방식으로 연구하기 제한된다. 또한 내부 "키워드"에 대한 태그들이 이루어지지 않아서 단순히 방대한 자료를 "검색"하는 용도로만 사용된다. 그리고 가격이...무시무시하다.






* DH 리뷰는 DH스터디를 간략하게 요약한 내용입니다. DH스터디는 한국학중앙연구원에서 진행되며 모든 분들의 참가를 환영합니다. DH스터디에 관한 문의 사항은 ddokbaro@gmail.com 으로 언제든지 연락해주시기 바랍니다.









이름 : 한국역대인물 종합정보시스템

기관 : 한국학중앙연구원

주소 : http://people.aks.ac.kr



한국역대인물종합정보시스템은 행정안전부와 한국정보화진흥원이 주관하는「국가DB사업」으로 구축되었습니다. 이 시스템에는 우리 역사에 족적을 남긴 인물에 대한 상세한 생애정보를 담은 인물사전을 중심으로, 고려와 조선시대 과거 합격자 신상정보, 성씨와 본관정보 및 관직명 정보 등이 종합적으로 수록되어 있습니다. 최종적으로 우리 역사 자료에 등장하는 모든 인물정보를 수록하는 것을 목표로 하고 있습니다. 그 결과 고조선시대부터 현대에 이르기까지 약 3만명의 인물정보와 조선시대 과거(문과, 무과, 생원 진사시, 잡과) 합격자와 고려시대 과거 합격자 및 음관정보, 중앙 및 지방관 정보를 통합하여 약 16만여 명의 인물정보를 서비스할 수 있게 되었습니다. 앞으로도 왕실 및 민간 족보 등에서 인물정보를 발굴하고 그 결과를 추가하는 사업을 지속적으로 추진하겠습니다. 한편, 그 동안 구축된 인물정보의 성과를 모든 기관과 공유하고 활용성을 한층 높이고자, OpenAPI를 제공합니다. 이용자들은 OpenAPI를 통해 좀 더 유연하게 인물정보 서비스를 이용할 수 있을 것입니다.



바로 : 기본적으로 상당히 완전한 싸이트이다. 다만 인물관계의 DB구축과 시각화와 GIS가 도입된다면 보다 완전한 시스템이 될 것이다. 물론 인물정보를 더욱 더 방대하게 구축하고, 다국어(영어) 지원들의 부수적인 행동도 좋을 것이다.







* DH 리뷰는 DH스터디를 간략하게 요약한 내용입니다. DH스터디는 한국학중앙연구원에서 진행되며 모든 분들의 참가를 환영합니다. DH스터디에 관한 문의 사항은 ddokbaro@gmail.com 으로 언제든지 연락해주시기 바랍니다.










이름 : 한국금석문 종합영상정보시스템

기관 : 국립문화재연구소

주소 : http://gsm.nricp.go.kr



2002년부터 한국의 문화재를 전담하는 국가기관인 국립문화재연구소에서 고대부터 조선시대에 이르는 자료를 연구자와 일반인 모두가 편리한 접근과 신속한 활용을 목적으로 국내에 산재한 금석문 자료를 수집하여 일반인은 물론이고 학술논문을 작성할 때 인터넷자료를 직접 인용할 수 있는 온라인 환경을 제공한다.


바로 : 정말 논문에 직접적으로 인용할 수 있을 정도의 품질을 보여준다. 현존하는 학술시스템에서 필요한 거의 대부분의 사항을 만족시켜주고 있다. 특히 금석문의 다양한 소장처와 판독 및 해석을 통합적으로 보여주는 것은 너무나 유용하다. 다만 API 등의 DB 공유를 지원하지 않아서 아쉽다. 그리고 웹표준 좀 지켜라!!!! IE에서만 제대로 돌아가!!!! 크왕!







* DH 리뷰는 DH스터디를 간략하게 요약한 내용입니다. DH스터디는 한국학중앙연구원에서 진행되며 모든 분들의 참가를 환영합니다. DH스터디에 관한 문의 사항은 ddokbaro@gmail.com 으로 언제든지 연락해주시기 바랍니다.






오랜 시간 동안 인류는 "펜"이라는 UI을 사용하였다. 손을 이용하여 종이에 생각을 옮기는 행동을 수행하였다. 컴퓨터가 나타나면서 인간은 "키보드"를 이용하여 자신의 생각을 디지털화하였다. 그러나 키보드는 펜과는 다르게 직관적으로 흥미가 가는 부분를 선택할 수가 없었다. 그래서 펜의 유사품인 "마우스"을 이용하기 시작하였다. 그리고 이제는 다른 부속장비를 쓰지 않고 "손가락"을 통해서 자신의 생각을 나타내기에 이른다.

그런데 사실 무엇인가를 조절하는 것은 결국 "뇌"에서 내리는 지시에 따른 결과일 뿐이다. 우리는 생각을 하고 그 생각이 전류로 변하여 손가락에 움직이도록 명령을 내리고, 손가락은 펜이나 키보드 혹은 마우스 등을 이용하여 생각을 표현한다. 결국 모든 것의 시작은 생각이고, 뇌 속에서 일어나는 전기 작용이다.

그렇기에 인간에게 있어서 가장 최선의 UI는 "뇌"의 생각을 직접적으로 전달하는 UI이다. 그리고 그것은 꿈이 아니다. 위의 영상은 원숭이를 대상으로 한 기초적인 조작에 관한 실험이고, 그 지향점을 장애인들을 위한 UI 제작에 두고 있지만! 현재까지의 내용만으로도 일반인들의 마우스나 터치패드의 역할은 충분히 수행할 수 있을 정도이다.

그리고 뇌UI는 단순히 인간이 뇌를 통해서 컴퓨터를 조작하기만 하는 것이 아니다. 컴퓨터의 정보를 직접적으로 뇌로 전달할 수 있다는 의미이기도 하다. 이제 어떤 정보를 암기하는 것은 의미가 없어진다. 필요할 때 뇌로 전달받으면 된다. 인간에게 가장 중요한 것은 컴퓨터가 행하기 힘든 추론이나 직관 등으로 압축될 것이다. 또한 집단지성도 지금의 클라우딩 기술처럼 사용될 수 있는 것이다. 서로의 뇌를 연결하여 어떤 문제에 대해서 다수의 사람들이 사고를 하여 문제를 해결하게 되는 것이다.

SF 소설이냐고? 아니. 현실이다. 그것도 10년내로 우리가 마주하게 될 현실이다. 50년전을 떠올려보라. 인류가 달에 가는 것은 망상이었다. 40년전을 떠올려보라. 개인용컴퓨터는 어처구니 없는 발상이었다. 30년전을 생각해보라. 인터넷은 극소수 해커들의 이상이었을 뿐이다. 20년전을 생각해보라. 노트북은 첩보영화에서나 나오는 특수장비였다. 10년전을 생각해보라. 지금의 스마트폰은 웃기는 소리였다. 지금 생각해보라. 앞으로 10년 뒤는 어떤 모습 일지.

물론 이런 미래상에는 빛 뿐만이 아니라, 악의적인 기억변형을 비롯한 다양한 어둠이 존재할 것이다. 그러나 기술의 진보는 막을 수 없고, 우리가 할 수 있는 일은 어떻게 최대한 기술의 빛나는 면을 활용하고, 어두운 면을 배제하느냐일 뿐이다.



8 월 27일-28일, 고려대학교에서 한국사회연구소 주최로 R Commander 특강이 진행됩니다. 한국사회연구소는 사회과학 연구방법론 분야에서 오랜 교육경험과 고급 연구를 진행해온 기관으로서, 한국 사회과학분야에서 R의 대중화를 위한 KRUG의 노력에 전폭적인 지지를 보내며, 이번 특강 개설을 제안하였습니다.

R의 학습에 부담을 느끼는 사회과학분야의 연구자를 주대상으로 하는 R의 기초 GUI 툴을 활용한 연구방법론 특강입니다. 이번 강의의 내용과 경험을 KRUG 회원들과 공유하겠습니다. 감사합니다.


- 신종화 올림


평소 데이터마이닝에 관심이 있는 분들은 한번 쯤 들어볼 만한 내용으로 생각됩니다.


개인적으로 관심을 가지고 있는 R 인지라 가고 싶지만,수업이 사회과학분야이다보니 본인이 관심을 가지고 있는 분야에 대한 내용이 없을 것 같기도 하고......사실 10만원은 학생입장에서 너무 부담이다. ㅠㅠ 그냥 열심히 자습해야겠다. 어차피 고문헌에 대한 R분석은...분석은...ㅠㅠ



한국은 출판대국이다. 정확히는 참고서 출판대국이다. 한국에서 출판되고 유통되는 대다수의 서적은 사실 중고등학교 참고서이다. 씁쓸한 현실에 대한 비판은 뒤로 하고, 참고서의 미래를 생각해보자.


맞춤형 교육은 한국 교육의 미래이다. 보편적인 지식의 전달을 넘어서 개개인이 더욱 알고 싶어하는 사항에 대한 내용을 제공하는 것이야 말로 맞춤형 교육의 미래이다. 역사 시간에 난중일기가 언급이 되었는데, 만약 난중일기에 대해서 관심이 있다면, 지금으로서는 난중일기를 찾아서 읽는 방법밖에 없다. 그러나 디지털 교육에서는 그 자리에서 곧장 난중일기의 해석된 전문을 읽을 수 있다. 더 관심을 가진다면 한자로 된 원문과 주석을 볼 수도 있다. 반대로 수학시간에 함수에 대해서 이해가 되지 않았다면, 함수에 대한 추가적인 교육내용을 제공하여 이해가 되지 않는 부분을 보충하게 할 수 있다.


무엇보다 디지털 교육은 단순히 암기력만을 강조하고 있는 현재의 시스템을 완전히 변화시킬 수 있다. 단순한 검색으로 알 수 있는 "년도"나 "고유명사"보다 사건에 대한 이해를 중점으로 하는 교육으로 이행을 할 수 있다. 그래서 수능시험에서도 단순한 계산이나 암기문제보다는 이해를 바탕으로 하는 실전적이고 실천적인 문제를 제시할 수 있다.


그런데 현재의 책으로 출판된 교과서와 참고서는 그 매체의 특성상 보편적인 지식을 밀어넣는 것도 힘들어하고 있다. 맞춤형 교육은 망상이며, 무조건적인 암기만을 강요할 수 밖에 없다. 결국 한국교육의 미래를 위해서는 디지털 교과서와 참고서의 등장은 반드시 필요하다.



사실 디지털 교육을 위한 한국의 환경은 상당히 뛰어나다. 한국의 어느 곳에서도 초고속인터넷 접속이 가능하며, 청소년들도 디지털 매체의 조작을 호흡처럼 생각하고 있다. 다만 제대로 된 디지털 교육 콘텐츠가 부재할 뿐이다. 이러한 디지털 교육 콘텐츠의 부재는 기존 학교선생들의 나태나 출판계 거대권력 참고서 출판사들의 방해 등 다양한 요인을 거론할 수 있다.


그러나 디지털 교육을 위한 콘텐츠 부재의 본질적인 핵심은 정부의 무관심이라고 할 수 있다. 참고서는 어디까지나 교과서의 부산물일 뿐이다. 만약 정부가 앞장서서 "디지털 교과서 표준안"을 마련하고 디지털 교과서로의 이행을 준비한다면, 디지털 교육으로의 이행에 충분한 추진력을 얻을 수 있을 것이다.


물론 디지털 교과서 표준안은 단순히 과거의 교과서 표준안을 복사하는 것으로는 부족하다. 내용의 무한확장이 가능하다는 점을 충분히 인지하고, 그에 합당한 다양한 내용을 포함하기 위한 방안이 마련되어야 한다. 그러나 설령 합리적인 디지털 교과서 표준안이 만들어지지 않더라도, 이를 보충하는 다양한 디지털 참고서가 탄생할 것이다. 정부가 해야되는 일의 핵심은 "디지털 교과서 표준안"을 시작하는 것 뿐이다. 잘하면 좋겠지만, 굳이 뛰어나지 않아도 된다. 시작 자체가 중요하다.



-------------------------------------------------


잡상이라서 아직 정리가 안된 글 ~.~

그냥 아이디어를 배출해서 나열할 뿐~~~

언젠가~ 먼 훗날에...


넓기만 하고 제약이 없으면 저속한 학문이오.

제약만 있고 넓지 못하면 이단이다.


“博而不約俗學也約而不博異端也”(明 劉宗周《論語學案》卷三上論)


디지털 인문학은 현재 넓기만 하고 제약은 없다. 물론 신흥학문으로서 제약이 없다는 것은 학문발전에 원동력이 되기는 하지만, 이제는 제약을 가져야 한다. 하다못해서 지금보다는 명확한 정의와 범위를 가져야 한다. 그렇지 않으면 "저속한 학문"일 수 밖에 없다.


디지털 인문학의 정의와 범위를 지정하는 것은 생각보다 어렵다. 넓게 잡아서 발전을 보장하려고 하면 너무 허황될 수도 있고, 좁게 잡아서 학문으로서 자리를 굳건히 하려고 하면 미래를 망칠수 있다. 하아...쉽지 않다.


논문 표절의 문제는 많은 사람들이 알고 있다. 타인의 논문을 적당한 절차를 거치지 않고 자신의 논문에 쓰는 행위는 연구자로서의 기본적인 도덕문제로 받아들여지고 있다. 그런데 논문 표절의 또 다른 일면에 대해서는 사람들이 잘 모르고 있다.


세상은 넓고 사람은 많다. 그러다 보니 어떤 한 가지 사실에 대한 서로 다른 판단 수 많은 판단이 존재하게 된다. 학계도 예외는 아니어서 어떤 사실에 대한 수 많은 다른 판단이 존재한다. 예를 들어서 "박정희에게 "전 대통령"이라는 칭호를 붙일 수 있는가?" 문제에 가장 간단하게 "쿠데타를 통해서 권력을 잡았기에 전 대통령이라는 칭호는 적합하지 않다."와 "결국 선거라는 적합한 민주적인 절차를 통해서 권력을 잡았기에 전 대통령이라는 칭고가 적합하다" 혹은 "유신개헌 및 그 이후의 행태는 민주주의에 바탕을 둔 행동이라고 할 수 없기에 유신개헌 이후는 '대통령"으로 인정할 수 없다" 등등의 다양한 의견이 가능하다.


이렇게 기존 연구가 충돌을 할 때, 연구자들은 최대한 관련 의견을 모두 열거한 이후에 "본 논문에서는 XXX의 의견에 따른다."라고 하거나 아예 다른 의견을 열거하지 않고 "XXX의 의견에 따르면......"이라고 문장에 명시를 한다. 연구자는 해당 내용에 대한 책임을 "XXX"에게 넘겨 버리는 것이다. 물론 최종적인 책임은 "XXX"을 선택한 연구자 자신에게 있다. 그러나 기본적인 해당 내용 자체에 대한 책임은 "XXX"에게 귀속한다.


실제적인 예시를 살펴보자. 대부분의 거대 "디지털 인문학" 싸이트는 현실적으로 다양한 연구자들에게 프로젝트를 분산해서 처리하도록 한다. 예를 들어서 고전번역원의 고문번역의 경우 다양한 연구자들이 참여해서 번역프로젝트를 수행하고 있다. 그리고 고전번역원은 해당 고문을 서비스할 때 해당 고문 번역 프로젝트의 책임자를 명시한다. 이를 통하여 어떤 고문의 번역에 대한 문제가 있거나 의견이 있을 경우 고전번역원은 1차적인 책임을 면할 수 있다. "이런 번역은 말이 안돼요! 틀렸어요. 수정하세요."라고 한다면 고전번역원은 "책임 번역자에게 문의하겠습니다." 라고 대답한다. 이런 방식은 다양한 의견이 공존하는 분야에서 특히 효과적이다. 번역에는 정답이 없고 다양한 번역 방식이 존재하기 때문이다.


그런데 사실 이런 책임 회피 방식은 과거의 시스템을 디지털 시스템에 억지로 적합시켜서 발생한 일이다. 과거에는 책이나 논문등의 글을 다양한 사람들에게 빠르게 보급하는 것은 꿈과 같은 일이었다. 문제가 있는 내용을 수정하고 재배포하는 것은 더더욱 그러하였다. 그런데 디지털에서는 빠른 보급과 수정이 가능하다. 무엇보다 한 문장에 대한 다른 의견이 있을 경우 모든 의견을 보여줄 수 있다.


과거의 인쇄물에서는 여러가지 제한사항으로 인하여 박정의에게 "전 대통령"이라는 칭호를 붙여주는 문제에 대해서 단 한가지만을 선택할 수 밖에 없는 경우가 있다. 그러나 디지털에서는 모든 의견을 열거해줄 수 있다. 해당 디지털을 보는 사람들은 어느 한 곳으로 편중된 의견이 아닌 소수의견을 포함한 다양한 의견을 보면서 시야를 넓힐 수 있다. 물론 기계적인 중립성의 문제를 벗어나기 위하여 열거된 의견 중에서 가중치를 부여하여 학술의 주류와 비주류를 보여줄 수 있다.


누군가가 고전번역원의 어떤 문장에 대해서 "이 해석은 다르게 해야됩니다. 수정해주세요"라고 한다면, 고전번역원은 이제 "님의 번역문도 등록하도록 하겠습니다" 혹은 "직접 님의 번역문을 등록하시면 됩니다"라고 해버리면 된다. 그럼 기존의 번역문과 추가된 다른 생각의 번역문이 공존하게 된다.


이러한 디지털의 특성을 가장 잘 표현하고 있는 디지털 인문학 싸이트는 한국금석문 종합영상정보시스템이다. 이곳에서는  금석문을 대상으로 다양한 탁본들과 각 탁본의 판독문들 및 각 판독문에 대한 해석문을 체계적으로 보여준다. 비록 각각의 탁본과 판독문 및 해석문간의 상호비교기능은 지원하지 못하고 있지만, 이미 다양한 의견을 한 곳에서 처리하는 개념적 전환과 모습을 보여주고 있다.


네트는 넓다. 디지털 자료는 다양한 의견을 수용할 수 있다. 다양한 의견의 수용은 과거 인쇄매체가 상상은 했지만 실현이 불가능했던 방법이다. 디지털 자료는 한 장소에서 다양한 의견들을 동시에 보여주면서 지식의 생태계를 풍부하게 할 수 있다. 또한 현실적으로 이러한 다양한 의견의 수용은 당신의 책임을 최대한 낮추어줄 수 있다.


"의견이 다르시다고요? 그럼 당신의 의견을 등록하세요."






....평소에도 그렇지만...오늘 쓴 글을 정말 뭔지 모르겠다.-_-;;.....머...일기장이니까......큼큼;;;;


한국 디지털 인문학의 선두주자 한국학중앙연구원 김현 교수님은 현재 인터넷으로 서비스가 되고 있는 "조선왕조실록"을 만든 이후 "조선왕조실록"을 소개하며 거의 반드시라고 해도 좋을 만큼 사용한 "코끼리"예시가 있다.

태종 11년(1411년) 일본 국왕으로 부터 진상되어 조선에 최초로 들어온 코끼리에 대한 이야기는 조선왕조실록에 1411년부터 1421년까지 6편의 단편적인 이야기만을 전하고 있다. 어떤 조선시대 전문가도 우선 코끼리의 존재에 대한 기록들이 나온다는 사실을 눈치채기 어렵고, 설령 코끼리의 존재에 대한 기록들을 알더라도 방대한 조선왕조실록 곳곳에 흩어져 있는 이상 어마어마한 노력을 기울여야 코끼리의 조선 생활을 추적할 수 있다.


디지털 인문학은 기존의 인문학자들에게 방대한 자료에 대한 검색능력은 분명히 인정받고 있다. 인문학 연구를 진행해본 사람들이라면 모두가 이해하겠지만, 필요한 자료를 이용하여 분석하는 시간보다, 필요한 자료를 찾으러 노력하는 시간이 더 오래 걸리고는 하기 때문이다. 디지털 인문학의 성과는 자료를 찾는 시간낭비[각주:1]를 대폭적으로 감소해주었다.



그러나 디지털 인문학의 강점과 능력이 검색능력일 뿐일까?


디지털 인문학의 진정한 강점은 디지털화를 통해서 인간은 흉내내지 못하는 컴퓨터의 빠른 연산 속도를 이용할 수 있게 되었다는 것이다. 검색능력은 컴퓨터의 빠른 연산 속도의 단편에 불과하다. 컴퓨터의 놀라운 연산 능력과 인간의 직관적인 분석능력이 협력을 하면 그 동안 감히 시도해볼 생각도 하지 못하는 일들이 가능하다.


우리는 컴퓨터와 인간의 협력모델을 현재 기업영역에서 사용되는 고객 관계 관리 체계에서 살펴볼 수 있다. 고객 관계 관리 체계(Customer relationship management, CRM)는 소비자들을 자신의 고객으로 만들고 이를 장기간 유지하기 위한 경영방식이다. 그리고 현재 CRM에서 가장 큰 이슈로 대두되고 있는 것이 바로 그 동안의 고객자료을 대상으로 데이터 분석을 통해서 새로운 이익을 창출하는 방법에 대한 이야기이다. 바로 "빅데이터"와 "데이터 마이닝"이 바로 그것이다.


그런데 인문학은 이미 수 천년간 쌓여온 "빅데이터"와 그 동안 발전시킨 "데이터 마이닝"기술을 이미 가지고 있다. 사실 데이터 마이닝의 본질은 기존의 인문학 연구방법과 다르지 않다. 다만 그 동안 한명의 개인으로서는 평생에 걸쳐서 해야될 작업을 컴퓨터가 1분도 안되는 시간에 완성을 해준다는 차이점이 있을 뿐이다. 그렇기에 앞으로 인문학이 배워야할 것은 컴퓨터와 협력하여 데이터를 분석하는 방법이다.



컴퓨터와 협력하면 구체적으로 무엇을 할 수 있냐고?


"인물관계망"이라는 것을 들어보았는지 모르겠다. 사람들은 혈연, 지연, 학연 및 온갖 방식의 인맥으로 서로 연결되어 있다. 그리고 여러 인물들간의 관계에 대해서 조사하는 것이 얼마나 중요한지는 인문학 연구자들이 더욱 더 잘 알고 있다고 생각한다. 컴퓨터와의 협력은 한국 역사에서 출현하는 모든 인물들의 상호관계에 대해서 분석을 가능하게 할 수 있다.


물론 인문학 연구자들도 정사와 족보 및 서찰의 왕래등의 온갖 정보를 취합하여 1~2명을 중심으로 하는 "인물관계망"을 제작할 수 있을 것이다. 그러는데 걸리는 시간이 얼마일까? 컴퓨터는 10초미만의 시간으로 여러분들에게 1~2명이 아닌 모든 인물에 대한 인물관계망을 제시해줄 수 있다.


심지어 인문학 연구자들도 시간과 재력의 한계로 포기할 수 밖에 없는 조사범위까지 무한정 확장해줄 수 있다. 예를 들어서 우리는 같은 관청의 같은 부서에서 일한 사람들은 최소한 서로가 서로를 안다고 추론적으로 가정할 수 있다. 서로간의 관계가 좋을 수도 있고 나쁠 수도 있지만, 서로가 서로를 알고 있다는 것은 변함이 없다. 그러나 이런 관계까지 조사하는 것은 모든 임명장을 비롯한 "잡다한 자료"을 모두 모아서 분석해야된다는 의미이기에 포기할 수 밖에 없는 지점이다. 그런데 컴퓨터는 여유롭게 이런 것들을 처리할 수 있다.



컴퓨터는 절대적이 아니야!


맞다. 컴퓨터는 절대적이지 않다. 컴퓨터는 인간의 분석능력을 따라갈 수 없다. 그러나 반대로 인간은 컴퓨터의 계산능력을 따라갈 수 없다. 석사까지 역사학을 연구했던 본인도 모아놓은 자료들간의 연결고리를 찾아내고 논리의 끈으로서 이들을 묶어나가며 희열에 가득차고는 했다.


자료간의 연결고리를 찾아내고 논리로 연결하는 행위는 컴퓨터는 손대지 못할 영역이다. 그러나 자료를 찾고, 자료를 처리하는 작업은 인문학 연구의 본질도 아닌 "지식 노가다"행위에 가깝다. 왜 굳이 쓸모 없는 시간 낭비를 하려고 하는가? 우리의 사랑스런 컴퓨터에게 짐을 넘겨주도록 하자. 그리고 우리는 인간이 할 수 있는 위대한 일에만 집중을 하자.




  1. 사실 단순한 시간낭비만은 아니다. 특히 처음 연구방법에 대해서 공부하는 사람들은 자료를 찾는 과정에서 자료에 대해서 공부를 하게 되며, 이런 과정을 통해서 자료에 대한 이해가 깊어진다. 문제는 몇 십년간 연구한 학자들도 열심히 자료를 찾아야 한다는 점이다. [본문으로]

2013년 7월 30일 제정되어 2013년 10월 31일부터 시행되는 공공데이터의 제공 및 이용 활성화에 관한 법률의 전문은 관련 영역의 사람들이 한 번 정독해야되는 내용으로 판단된다. 공공데이터의 문제는 정부의 투명성 보장을 위해서도 반드시 필요할 뿐만이 아니라, 공공데이터의 공개를 통하여 경제적 이득까지 이룰 수 있는 일석이조의 기회이다.


2008년에 제정된 공공기관의 정보공개에 관한 법률이 국민들이 신청을 한 경우 심사를 해서 데이터를 공개하는 수동적인 방식이었다면 공공데이터의 제공 및 이용 활성화에 관한 법률은 정부가 먼저 공공데이터를 공개하는 주동적인 방식이라고 할 수 있다. 실제 법령에서도 "제17조(제공대상 공공데이터의 범위) ① 공공기관의 장은 해당 공공기관이 보유ㆍ관리하는 공공데이터를 국민에게 제공하여야 한다. "라고 명시하여 강제성을 부여하였다.


물론 비밀정보와 저작권법에 대한 보호장치를 마련하고 있지만, 본인이 속한 "디지털 인문학"쪽의 내용은 비밀정보나 저작권법과 충돌하는 지점이 사실상 존재하지 않기에 이제 공공기관들은 그 동안 만든 데이터를 공개해야만 한다.


앞으로 추가적으로 나올 법령에서 주목해야될 지점은 "제23조(공공데이터의 표준화) ① 안전행정부장관은 미래창조과학부장관과 협의하여 공공데이터의 제공 및 이용을 활성화하고 효율적인 관리를 위하여 다음 각 호의 사항에 대한 표준을 제정ㆍ시행하여야 한다. "이다. 표준화되지 못한 데이터도 가공을 통해서 사용할 수 없는 것은 아니지만, 처음부터 표준화가 되어있다면 상당히 많은 시간을 절약할 수 있는 것도 사실이다.


그 외의 사항은 그냥 넘겼지만, 법령 자체는 상당히 다방면으로 고려를 한 흔적이 옅보인다. 만약 이 법령대로만 진행이 되면 한국은 정말 막강한 공공데이터 제국이 될 수 있다. 다만 완성된 데이터 뿐만이 아니라, 현재 세금으로서 진행되고 있는 데이터 구축사업에 대한 관리체계에 대한 보완이 필요하다고 생각한다. 



디지털 인문학은 이제 시작하는 단계이다. "디지털 인문학"의 정의조차 아직 명확하지 않고, 연구 방법과 연구범위도 아직은 논의를 하고 있는 단계라고 할 수 있다. 한국에서도 디지털 인문학 관련 학과의 석박사 졸업생들이 이제야 하나 둘 씩 배출되는 과정에서 디지털 인문학 석박사 논문의 주제와 범위 및 방법은 아직도 고민의 단계라고 할 수 있다.


그렇다면 디지털 인문학의 논문의 대상 어떤 것이 있을 수 있을까?


1. 디지털 인문학의 철학 및 역사

어떤 학문이든 해당 학문의 철학과 역사의 연구는 필연적으로 발생한다. 디지털 인문학을 어떻게 정의하냐는 문제부터 시작하여 지금까지의 디지털 인문학 발전사 등의 가장 기본적인 내용이지만 반드시 필요한 대상에 대한 연구 논문이 가능할 것이다. 좀 강하게 이야기하면, 지금 수준의 디지털 인문학 기반연구는 학문으로서 정립되기 위한 수준으로는 한참 미달한다고 생각될 정도이다.


추가적인 사항으로 모든 학문이 그렇지만, 디지털 인문학은 특히나 신흥학문으로서 학문의 발전을 위해서 후학들의 양성에 신경을 쓰고 있다. 특히 대다수의 디지털 인문학 연구자들이 디지털 인문학을 인문학의 필수적인 방법론으로 자리잡을 것으로 예상하는 만큼 디지털 인문학 연구자의 배양 뿐만이 아니라, 기존 인문학 영역의 연구자들에 대한 디지털 인문학 교육방안에 대한 고민은 매우 중요한 논문 주제라고 판단된다.



2. 디지털 인문학 정보처리방법

디지털 인문학은 그 특성상 데이터베이스 구축부터 시작하여 시각화까지 다양한 프로젝트를 수행하게 된다. 설령 수행하지 않더라도 수행 프로젝트에 대한 기획단계까지는 몇 가지나 가지고 있기 마련이다. 그렇기에 논문의 대상을 프로젝트 수행 전반으로 잡아서 구체적인 디지털 인문학 프로젝트의 수행과정에 대해서 논문을 쓸 수 있을 것이다. 구체적으로 메타언어 설계, DB설계, 데이터마이닝, 텍스트마이닝, 시각화 방법 등등의 내용이 가능할 것으로 보인다. 물론 각각의 세부 사항에 주제를 한정하여 논문을 작성하는 것도 가능할 것으로 생각된다.


디지털 인문학 프로젝트의 세부 분류는 개략적으로 다음과 같이 나눌 수 있다.

1. 자료수집-저장 : 디지털화 혹은 디지털로 생산하는 방법을 대상으로 하는 내용

2. 데이터마이닝(분석) : 디지털 자료에 대한 분석 방법을 대상으로 하는 내용

3. 가시화(UI) : 디지털 자료나 분석툴의 자료 및 UI 자체 등 보여주는 부분을 대상으로 하는 내용


추후 디지털 인문학 프로젝트 연구가 디지털 인문학 연구의 핵심주제가 될 것으로 생각된다. 그래서 현재로서는 전체 프로젝트에 대한 포괄적인 설명이 중심이 되겠지만, 추후에는 세부 기술적인 사항에 대한 전문적이고 심도 있는 연구가 이루어질 것으로 예상된다.



3. 디지털 인문학의 인문학적 응용

디지털 인문학은 인문학 연구의 새로운 형태이다. 다시 말해서 결국 기존의 인문학 연구 방법에 기여하거나, 기존의 인문학 연구에서는 나타나지 않은 연구방법을 제시하는 등의 역할을 수행하게 된다. 기존의 인문학 연구자들이 직접적으로 디지털 인문학의 성과를 활용하면 좋겠지만, 실질적으로는 우선 디지털 인문학 프로젝트를 수행한 연구자들이 디지털 인문학의 성과를 활용한 연구를 보여주어 모범이 되는 것이 합당하다고 하겠다.


여기서 디지털 인문학을 어떻게 생각하느냐에 따라서 두가지 미래 예측을 할 수 있다. 만약 디지털 인문학이 인문학의 도구적 학문으로 생각한다면, 추후 디지털 인문학의 인문학적 응용은 기존 인문학 연구자들의 몫으로 전환되어야 할 것이다. 그러나 만약 디지털 인문학을 인문학의 새로운 모습으로 생각한다면 기존의 인문학 연구자들을 디지털 인문학의 영역으로 포괄하는 식으로 이루어지게 될 것이다.




석사 논문의 경우 위에서 하나의 영역만을 선택하여 진행하여도 무방하다고 생각된다. 사실 프로젝트의 세부분류 혹은 하나의 기술적인 요인들에 대한 연구만 해도 충분하다고 본다. 그런데 박사논문의 경우는 최소한 2가지 이상의 사항이 동시에 출현하여야 하지 않을까 스스로 세뇌시켜 본다. 바로야. ㅠㅠ 할수 있어.ㅠㅠ 해야돼..ㅠㅠ 아..왜 눈물이..ㅠㅠ 자기 무덤 자기가 파고 있는거 같아..ㅠㅠ



서울특별시 외국어 표기 사전 : http://dictionary.seoul.go.kr/


서울시는 2002년부터 외국어표준화 사업을 시작하여 각종 안내 표지판과 홍보물 등에 사용되는 연문 표기를 표준화해 영문표기 사전을 배포해오고 있었다. 그러나 검색이 아닌 문서로 배포하고 있었기에 사용에 일정한 제한이 있어왔다.

서울시는 이에 8월 1일부터 "서울특별시 외국어 표기 사전" 홈페이지를 오픈하였다. 본 싸이트는 기존의 영문표기뿐만이 아니라 중국어와 일본어까지 지원하며, 표준화된 외국어 표기를 제공함으로서 외국인 관광객에게는 정확한 정보를 전달하고, 내국인들에게는 관광사업에서 큰 효과를 발휘할 것으로 보인다. 솔직히 공무원의 마인드에서 나왔다고는 상상도 못할 실용적인 싸이트라고 할 수 있다[각주:1].

기본적으로 국립국어원 표준국어대사전과 서울시가 그 동안 축적한 데이터를 바탕으로 하고, 음식명은 한국관광공사의 표기 기준, 문화재는 문화재청의 표기 기준, 도로명은 안전행정부의 표기 기준을 통합하여 제공하고 있다.

번역기준은 "우리나라 지명이나 도로명의 경우에는 현재 사용하고 있는 한자를 가능한 그대로 반영하도록 했으며, 한자가 없는 경우에는 최대한 의미역하여 그 유래를 보존하기로 했다. 그러나 유래가 명확하지 않거나, 동일한 음의 지명이 있는 경우 등 예외 조항을 두어 음역도 함께 병행하는 것"으로 하였다. 물론 이러한 번역원칙에 대해서 반론이 있을 수도 있지만, 번역원칙을 명확하게 하여 통일성을 주는 것은 칭찬받아 마땅한 방식이라고 본다.

그 뿐만이 아니라 단어 검색시 오류를 발견할 경우 바로 오류접수를 할 수 있도록 UI가 전면에 배치되어 있는 것도 특색이라고 할 수 있다. 무엇보다 서울시는 외국어 표기 데이터 베이스를 서울시 열린 데이터 광장을 통해서 8월 말부터 공개할 예정이다. 다시 말해서 공공의 차원에서 만들어진 데이터이기에 공공에 서비스를 한다는 너무나 당연해보이지만 실제로는 힘든 일을 했다.


그리고 역시 당연하다면 당연한 것이지만 IE(익스플로우)가 아닌 FF(파이어폭스)나 크롬에서도 정상적으로 작동한다[각주:2]. UI면에서도 내용자체가 간략하다면 간략할 수도  있지만, 검색 UI의 기본적인 기능을 충실하게 구현하고 있어서 사용자들이 편안하게 자신들이 원하는 내용을 찾아볼 수 있도록 배려하고 있다.

작은 나라라고 할 수 있는 서울의 외국어 표기사전은 단순히 서울시만의 데이터가 아니라 한국 전체에 파급력을 가져다 줄수 있는 성공적인 프로젝트가 될 것으로 보인다.



다만 체계적이고 지속가능한 유지보수 시스템이 구비되어 있기를 진심으로 소망한다. 이미 2002년부터 지속적으로 발전한 사업인만큼 유지보수에 큰 문제가 없을 것이라고 생각하지만, 그 동안 수 많은 공공사업들이 발표만 하고 정작 더욱 중요할 수 있는 유지보수에 무관심 했던 수 많은 사례를 생각하면 당부를 하지 않을 수 없다. 그리고 조그마한 부분이지만, 검색 결과의 표기 숫자가 10개로 고정되어 있는데, 이를 사용자가 선택할 수 있게 해주면 더욱 좋을듯 하다.


  1. 번역이라는 수 많은 이견이 있을 수 있는 곳에서 표준화를 추구하는 것 자체는 공무원 마인드라고도 할 수 있겠지만...반대로 생각하면 논란이 될 것이고 피곤할 일인데 굳이 하는 것은 공무원 마인드라고는 할 수 없는 것이다. [본문으로]
  2. 사실 이런 것에 기뻐해야되는 것 자체가 싫다. ㅠㅠ [본문으로]




词库下载-拼音加加输入法


Sogou만큼은 아니지만 중국어 입력기 부분에서 매니아층을 형성하고 있는 핀인쟈쟈(拼音加加)에서 공개한 전문분야별 단어데이터이다. 형식은 그냥 단어들이 나열되어 있는 형태로 되어 있다. 하지만 특별한 부분의 단어를 추가하려고 할 때 유용하게 사용될 수 있다.


그러나 인터넷에서 자발적으로 작성된 것이라 전문분야에서 사용하려고 할 경우 직접적으로 사용하기보다는 일정한 단어 추가-수정-삭제 처리를 하는 것을 추천한다.


세부적인 내용은 해당 데이터를 이용하려는 사람은 기본적으로 중국어를 구사할 수 있을 것으로 판단하여 생략하도록 하겠다. 만약 중국어에 자신이 없는데 해당 데이터를 다루실 분들은 연락을 주시면 도와드리도록 하겠다.






전통적인 인문학에서 디지털에 대해서 가장 많은 비평을 하는 것 중에 하나가 "디지털화 해놓은 자료에 오탈자가 많아서 학문적으로 사용하기 힘들다는 것"이다. 오탈자는 엄정한 연구에서 분명히 문제가 되는 부분이며, 끊임없는 검토가 필요하다. 그런데 오탈자가 디지털화한 자료를 학문의 자료로 사용하지 못할 정도인가?


인문학의 기초는 자료에 대한 점검으로 시작한다. 자료의 출처는 어디인가? 자료의 내용에 문제는 없는가? 고대문헌을 대상으로 하는 점검은 문헌학 혹은 고문헌학이라는 독립적인 학문분파가 세워질 만큼 방대하고 어려운 작업이며, 인문학에서 기본 중에 기본인 작업이다.


그런데 인문학의 자료들을 보면 사실 생각보다 오탈자가 있는 사료가 많이 있다. 정식으로 출판된 서적에서조차 오탈자는 흔히 발견되고는 한다. 당연한 일이다. 인간이 하는 일인 이상 당연한 일이다. 여러분들에게 10페이지 정도의 글을 나누어주고 그것을 옮겨 적으라고 하면 한두글자의 오탈자는 반드시라고 해도 좋을 만큼 발견되는 것이다.


결국 전통적인 인문학에서도 오탈자의 문제는 피해갈 수 없다. 그런데 디지털에서는 비록 오탈자 문제 자체는 피해갈 수 없지만, 오탈자 문제를 효율적으로 해결할 수 있는 속성을 내포하고 있다. 과거의 출판물은 한 번 인쇄과정이 끝난 이후에 오탈자가 발생할 경우, "정오표"를 배포하는 수 밖에 없다. 그러나 디지털화된 문서는 매우 손쉽게 입력-수정이 가능하다.


결국 디지털화된 자료에서 발견되는 오탈자는 오히려 전통적인 인문학에서 발생한 오탈자보다 훨신 빨리 수정될 수 있고, 보다 완전한 자료가 되어 간다. 전통적인 인문학에서 거론하는 디지털화된 자료의 오탈자 문제는 자기 자신을 되돌아보지 못하는 무조건적인 반감에 불과하다.


오히려 근본적인 문제는 디지털화된 자료가 너무 빠르게 오탈자를 수정하여 고정화되지 않기에 속도가 비교적 느린 인문학 연구가 이를 따라가지 못하는데 있다. 그런데 이 문제는 수정전 히스토리에 고유값을 부여하는 방법으로 간단하게 해결될 수 있는 문제이다. 인문학이여 디지털을 무서워하지 마라. 디지털을 이용하라.



시간과 공간은 어떤 연구를 하더라도 기본 중에 기본이다. 그럼 "디지털 인문학"의 기본은 시간과 공간은 어떻게 디지털을 이용하여 효율적으로 처리하느냐가 기본적인 문제가 된다. 그래서 기본 중에 기본을 하자는 마음가짐이다. 

시간은 아래의 시간DB에 UI개혁과 집단지성을 활용하기 위한 사용자 참여를 추가
http://authority.ddbc.edu.tw/time/

공간은 아래의 중국공간DB 틀 위에 한국DB를 넣고, 지명간의 관계를 정의하는 요소 및 UI의 개선과 집단지성 활용을 위한 사용자 참여 추가
http://www.fas.harvard.edu/~chgis/data/chgis/downloads/v5/datasets/index.html


배끼는 것 아니냐고? 글쎄...배낀 것이라는 소리가 안 나올정도로 다르다. 최초 개념만 펜치마킹하는 수준이니 말이다. 이것을 배낀 것이라고 하면 세상 아래 새로울 것은 하나도 없다라는 말 밖에 안된다.

박사과정에서 완성할 건 딱 저정도이다.(사실 더 많지만...최소한의 최소한은 저것이다. 저것만 해도 어디냐..ㅠㅠ) 쉬워보이는가? 시간은 그나마 연구된 것이 있어서 삽질을 조금만 해도 되지만(이쪽은 프로그래밍 삽질이 더 많다). 공간쪽은 인문학영역의 연구부터 시작해야되기에 과연 끝낼 수 있을지 의문스러울 정도이다.ㅠㅠ



Sogou는 현재 중국 최대 사용자를 보유하고 있는 중국어 입력기를 서비스하고 있는 회사이다. Sogou는 자신들의 서비스에서 추출된 중국어 단어들을 대상으로 무료로 단어 데이터(Word DB)을 서비스하고 있다.


한국어로 설명을 할까도 생각을 했지만, 해당 DB을 사용할 사람들은 기본적으로 중국어를 할 수 있다고 생각되어서 설명을 생략하도록 하겠다. 혹시 설명이 필요하신 분들이 있다면 연락을 주시면 상세 설명을 추가하도록 하겠다.


互联网词库(SogouW)(2006) : 중국어 단어 데이터이다. 단순한 단어 데이터 뿐만이 아니라 단어의 속성까지 명시해주고 있다. 다만 조사 시간이 2006년 10월이어서 최신 데이터를 구했으면 하는 아쉬움이 있다. 


中文词语搭配库(SogouR)(2006) : 중국어 단어 연결 데이터이다.  어떤 단어 뒤에 어떤 단어가 자주오는지를 분석한 결과이다. 단어 데이터와 마찬가지로 최신 데이터가 있으면 더욱 좋았을 것 같다.


互联网语料库(SogouT)(2012) : 중국어로 작성된 1.3억개의 웹페이지의 정보를 모아둔 자료이다. 압축 전 용량이 5TB이며, 압축을 해도 2.13TB이다. 현재 중국에 관하여 데이타 마이닝을 할 경우에 적합한 빅데이터라고 할 수 있다.


본인은 현재 한국 고대문헌들에 대한 텍스트 마이닝을 시도하고 있다. 위의 자료는 단어 데이터를 찾으려고 발악하다가 찾게 된 것으로서 필요하신 분들이 있을 것 같아서 자료 공유차원에서 올려본다.......다시 말해서.....혹시 한자로 된 고대문헌에 대한 자연어처리를 지원하는 패키지 아시는 분?! 아무리 찾아도 없어. ㅠㅠ


R을 통해서 단일 논문에서 자주 출현하는 키워드를 클라우드로 구현해보았다. 대상 논문은 김현교수님의 "디지털 인문학:인문학과 문화콘텐츠의 상생 구도에 관한 구상[각주:1]"으로 하였다. 만약 어떤 문장에서 자주 출현하는 단어들과 그 빈도수를 시각화하고 싶다면 괜찮은 방법으로 생각된다. 






김현 교수님의 "디지털 인문학:인문학과 문화콘텐츠의 상생 구도에 관한 구상"은 너무나 당연하게도 "인문학"과 "디지털"이 가장 많이 출현하였다. 특히 인문학의 기본에 디지털을 추가한다는 개념과도 같게 "인문학"은 물론이고 "인문"도 자주 출현하는 것을 볼 수 있다. 그 뒤를 "지식"이 따라가고 있다. 재미있는 것은 제목에 출현한 "문화콘텐츠"보다 "인문콘텐츠"의 출현빈도가 더욱 많다는 것이다. "인문콘텐츠"을 강조하고 싶으셨나 보다.


그 뒤를 따르고 있는 단어들은 대부분이 "연구"나 "인력" 혹은 "교육" 및 "육성"등이 자치하고 있다. 이는 본 논문에서 가장 중요시 하는 것이 앞으로 디지털 인문학이 발전하기 위하여 후학들을 어떻게 교육시키고 육성할 것인가에 맞추어져 있다고 할 수 있다.



# 모든 명령어의 세부 내용이 궁금할 때에는 "?file"혹은 "??file"의 형식으로 입력하면 상세한 설명이 당신의 눈앞에 펼쳐진다. 물론 영어 압박이다. 하지만...이쪽 바닥이 원래 꼬브랑말을 할 수 밖에 없다. ~.~;;

# 중간중간 실행결과를 "dh.lines"처럼 입력해서 구동하는 것을 추천한다. 그래야 어떻게 변환됐는지 알 수 있다.

# 본 내용에서는 다음과 같은 팩키지를 사용하게 된다. "KoNLP"는 한글에 관한 텍스트 마이닝(text mining package)의 기본이며 필수라고 생각해도 무방하다. "RColorBrewer"는 시각화시의 색 관련 사항이다. 아름다운 시각화에 관심이 없으면 무시해도 좋다. "wordcloud"는 단어들을 크라우드로 변환해주는 package이다.

# 패키지를 설치한다.

install.packages("KoNLP")
install.packages("RColorBrewer")
install.packages("wordcloud")

# 패키지를 로딩한다.

library(KoNLP)
library(RColorBrewer)
library(wordcloud)

# 한글처리의 경우 "UTF-8"코드로"txt"형식으로 저장이 기본이다.

dh <- file("c:/rtext/dh.txt", encoding="UTF-8")

# 불러온 text에 라인을 넣어주어야 한다.

dh.lines <- readLines(dh)

# 세종단어집을 불러온다. 그런데 세종단어집은 완전하지 않다.

useSejongDic()

# 그래서 "dh.lines"을 실행해서 세종단어집에 포함되지 않은 아래 단어들을 적당히 추가시켰다. 참고로 단어집에 포함되지 않은 단어들은 조사와 붙어서 나오는 경우가 많다.

mergeUserDic(data.frame(c("문화콘텐츠","인문콘텐츠","스토리텔링","코디네이터","콘텐츠"), c("ncn")))

# 이제 라인으로 구획된 text에서 단어만을 추출해준다.

dh.nouns <- sapply(dh.lines, extractNoun, USE.NAMES=F)

# 이제 각각의 단어들이 몇 회 출현하였는지 숫자를 센다. 사실 데이터만으로는 "dh.wordcount"만으로 완성되었다고 볼 수 있다. 남은 건 가시화다.

dh.wordcount <- table(unlist(dh.nouns))

# 예쁘게 꾸미기 옵션이다. 세팅을 바꾸어가면서 색의 변화을 즐겨보자. 본인은 취미 없다.

pal <- brewer.pal(12,"Set3")
pal <- pal[-c(1:2)]

# 이제 실제로 가시화를 한다. 랜덤으로 해놓고 몇 번 실행하면서 마음에 드는 것을 적당히 골라도 되고, 처음부터 철저하게 원하는대로 나오도록 세팅해도 된다. 본인은 렌덤이다.

wordcloud(names(dh.wordcount),freq=dh.wordcount,scale=c(6,0.3),min.freq=10,
          random.order=T,rot.per=.1,colors=pal)


  1. ...본인의 글이 아니어서 함부로 전문을 올리기가 힘들다. 각자 알아서 적당한 소설이나 논문을 대상으로 해보도록-0-;;; [본문으로]

2013년 07월 30일 -- 문화재청(청장 변영섭)은 그동안 하나의 문화재가 여러 가지 영문으로 표기되어 혼란을 초래하고, 새로운 영문명칭이 필요한 경우에도 통일된 표기 기준이 없어 어려움을 겪었던 것을 해소하기 위해 ‘문화재명칭 영문표기 기준 규칙’(문화재청 예규 제124호)을 제정하여 오는 8월 1일부터 시행한다.

문화재명칭 영문표기 기준 규칙은 문화재청이 2010년부터 세미나, 공청회 등 15회에 걸쳐 관계 전문가, 주한 외국인, 비영어권 유학생, 일반인 등 100여 명과 국립국어원, 국립중앙박물관, 한국관광공사, 서울특별시 등 관계 기관의 의견을 수렴하여 마련된 것이다.

표기의 기본원칙으로 네 가지를 정하였다. △국문 고유의 문화재명칭을 최대한 보존 △보통명사는 단어의 뜻을 영어로 옮기는 방식의 의미역을 적용하고, 고유명사는 해당 음을 로마자 표기법에 따르거나 의미역 표기 병행 △문화재명칭은 생략 없이 그 명칭 전체를 표기 △기준이 대립할 경우에는 활용성과 범용성이 큰 쪽을 선택하게 했다.

이 표기 기준에 맞추어 로마자표기법, 부호, 기관명, 인명, 지명, 띄어쓰기, 대소문자 표기 등 7가지 일반원칙과 문화재 유형별로 명칭을 부여하는 17가지 기준(방식)을 정하였다. 또 문화재명칭을 구성하는 890여 개의 국문요소에 대한 영문 대역어를 제시하였다.

이에 따라 건조물과 유적 명소는 문화재명 전체를 고유명사로 보아 자연지명과 유적이름 전체를 로마자로 표기하고 보통명사 의미역(접미어)을 덧붙이게 된다. ‘경복궁’은 ‘Gyeongbokgung Palace’, ‘숭례문’은 ‘Sungnyemun Gate’과 같이, 문화재명칭을 로마자표기와 의미역표기가 병행하도록 하였다.

또 문화재청의 누리집과 문화재 안내판, 인쇄 홍보물 등도 점차적으로 이번 기준을 적용해 나가기로 했다. 관계 기관에도 이 표기 기준에 맞추도록 협조를 요청할 예정이다. 또 사용자의 편의를 위하여 4천여 개의 국가지정(등록)문화재에 대한 문화재의 공식명칭을 제시하는 영문용례집을 올해 연말에 배포할 계획이다.

표준화된 문화재명칭 영문표기는 앞으로 학계, 번역계, 관광계, 문화재 활용과 안내·해설 분야 등에서 학술적·관광적·국제적으로 편익을 제공하고 사회적 비용을 절감할 것으로 기대된다.


-----------------------


바로 : 번역에 있어서 뇌와 뇌를 직접적으로 연결하는 그나마 완전해 보이는 의사소통 방식이 개발되기 까지는 끊임없이 논란이 될 수 밖에 없는 직역과 의역의 싸움이다. 고유명사를 보존하면 외국인들은 해당 물체가 무엇인지 자체를 모른다. 물론 해당 언어로 해당 물체를 이해하는 것이 가장 뛰어난 이해를 보장한다. 하지만!


대부분의 외국인은 한국어에 관심이 없으며, 한국문화에도 관심이 없다. 그것이 현실이다. 어떻게든 조금이라도 한국문화를 쉽게 이해할 수 있는 것이 답이지 않을까? 본 규칙은 최대한 외국인을 배려한 번역법이 기본이 되었다. 그리고 그것이 현재 상황에서의 정답에 가깝다고 생각한다. 


문화적 자존심? 좋다. 본인도 나름 열혈 청년이다. 그러나 한국문화를 알기는 것이 우선이다. 한국문화가 무엇인지도 모르는 사람에게 문화 자존심을 내세우는 건 한국말을 모르는 외국인에게 열심히 한국말로 계속 이야기하는 것과 같지 않은가?!


디지털 인문학은 인문학과 IT의 융합이다. 더 정확히 말하면 인문학의 "당연한 것"과 IT의 "당연한 것"을 융합하여 "당연하지 않은 것"을 만드는 작업이다.

인문학만 보면 너무 당연하다고 생각하지만 IT에서는 의문을 표시하고, IT에서는 너무나 당연하지만 인문학에서는 의문을 표시하는 내용들을 다루다보니 각각의 영역에서 당연한 것을 건드릴 가치가 있느냐? 혹은 이해도 안되고 이상하다라는 평가가 수반되게 된다.

하지만 당연한 것은 그 무엇보다 강력한 힘이며 진리이다. 인간은 밥을 먹는다. 너무나 당연하지만 반대로 밥을 먹지 않으면 죽는다. 인간은 죽는다. 너무나 당연하지만 결코 피해갈 수 없다. 당연한 것은 너무나 당연해서 무시하는 순간 진리에서 멀어진다.


그런 의미에서 너무나 당연한 "대상", "시간", "장소"에 대해서 더욱더 파고 들어볼 것이다. 뭐냐고? 초등학생도 배우는 육하원칙의 "누가", "언제", "어디서"다. 당연한가? 그래서 중요하다.


인문콘텐츠학이 디지털 인문학을 수용하기 위해 해야 할 일은 무엇인가? 이제 본격적으로 배출되기 시작한 문화콘텐츠학 전공자들의 일부가 인문정보기술의 운용 능력을 갖춘 지식 코디네이터로 성장할 수 있도록 해야 한다. 전부가 아니라 일부라고 하는 이유는 이곳에서도 분업과 협업이 필요하기 때문이다.


문화콘텐츠학 전공자 중에는 인문학보다는 문화산업의 현장 쪽에 더 가깝게 다가가려는 사람이 있을 것이다. 그들은 그 방향에서 요구하는 기획-제작-마케팅의 능력을 배양하는 것에 집중해야 한다. 한편 인문학 지식으로부터 문화상품의 자원을 끌어내는 일에 관심을 둔 사람들은 인문지식에 대한 기본적인 소양뿐 아니라 그곳에서 생산되는 지식을 디지털 콘텐츠로 조직화하는 정보 처리 능력을 갖출 필요가 있다. 이들이 바로 순수 인문학 연구자와 문화산업 종사자 사이에서 인문 지식의 소통과 응용을 가능케 하는 지식 코디네이터들이다. 인문지식 코디네이터의 위상을 그림으로 그려본다면 그들의 한 쪽 옆에는 순수 인문학 분야의 연구자들이 있고 다른 쪽에는 문화산업 종사자들이 있는 그림이 될 것이다.  문화산업계의 동향을 살펴 그곳에서의 인문지식 수요를 파악하는 한편, 인문학 연구자들을 도와 응용 가치가 있는 지식 콘텐츠를 만들어 내는 것이 지식 코디네이터의 역할이다. 




  대학의 문화콘텐츠학과에서 인문지식 코디네이터를 육성하기 위한 정보 기술 교육은 어떻게 시행되어야 할까? 이 분야의 지식과 경험을 갖춘 교수 인력과 적정한 교육 설비의 확보, 그리고 검증된 교수법과 교과과정의 도입 등 교육 인프라를 갖추는 일이 선행되어야 한다. 하지만, 모든 대학에서 단시간에 이같은 여건을 충족시키는 것은 현실적으로 어려운 일이다.  나는 인문콘텐츠학회가 중심이 되어 단계적으로 이 문제의 해법을 찾아가는 것이 유효한 벙법이라고 생각한다. 


  그 첫 번째 실천 방안은 학회 차원에서 각 대학의 문화콘텐츠학 및 인문학 전공 학생들을 대상으로 하는 디지털 인문학 교육 프로그램을 운영하는 것이다. 디지털 인문학의 전문 인력이 절대적으로 부족한 우리나라 현실에서 대학마다 독립적으로 이 분야의 정규 교과 과정을 운영하기는 힘들다. 하지만 학회 차원에서 누구나 참여할 수 있는 개방적인 교육 기회를 마련하고, 각 대학이 이를 일종의 과외 수업처럼 활용한다면, 소수의 교수 인력만 가지고도 다수에게 그 지식을 전달하는 효과를 거둘 수 있을 것이다.  


  학회 차원에서 회원들의 중지를 모아 추진할 필요가 있는 두 번째 실천 과제는 교육부와 한국연구재단에 우리나라의 디지털 인문학 육성을 위한 연구 지원 시스템을 조속히 시행하도록 촉구하고, 구체적인 실천 방안에 관해 조언하는 일이다. 앞에서 소개하였듯이 교육부(당시의 교육과학기술부)는 2010년에 이미 우리나라의 인문사회과학 진흥을 위해 ‘디지털 휴머니티스’의 육성이 필요하다는 제안을 수렴한 바 있다. 그런데 이에 관한 사업 계획이 아직까지 실천에 옮겨지지 못한 데에는 몇 가지 이유가 있다. 그 사이 교육과학기술부가 2개의 부처로 나뉘면서 융합적인 성격의 연구 지원에 혼선이 빚어진 것도 한 이유일 것이다. 하지만 더 중요한 이유는 ‘디지털 휴머니티스'의 육성 필요성에 대한 관련 학계의 목소리가 정부 부처와 전담기관의 실무자들이 생각한 만큼 크지 않았다는 점이다. 인문학계는 예전부터 해 온 연구 방식에 집착하는 보수성 때문에, 그리고 문화콘텐츠학계는 문화산업을 이해하고 그 쪽으로 다가가는 것이 더 급한 과제여서 인문지식의 기초적인 응용 환경을 조성하는 이 분야에는 무관심했던 듯하다. 


  순수 인문학의 입장에서 보면 디지털 인문학은 인문지식의 사회적 확산을 돕는 길이고, 인문콘텐츠학의 입장에서 보면 그것은 문화산업에 응용할 방대한 인문학지식을 가장 효과적으로 획득하는 방법을 마련하는 일이다. 미국과 유럽, 심지어는 가까운 일본과 대만의 상황을 보더라도 디지털 인문학의 육성은 범인문학계(인문학+인문콘텐츠학)의 자연스러운 발전 궤도 위에 놓인 과제이다.  시행 시기에 있어 다소의 빠르고 늦음은 있겠지만 언젠가는 들어서야 할 이 길에 인문콘텐츠학 연구자들이 선도적인 발걸음을 내딛고, 그 길의 올바른 방향 정립에 기여할 수 있기를 희망한다.



본 내용은 한국학중앙연구원 인문정보학 김현 교수의 "디지털 인문학: 인문학과 문화콘텐츠의 상생 구도에 관한 구상"의 일부를 발췌한 내용입니다.



바로 : 학생의 입장에서 지금 당장으로서는 다른 학교로의 자유로운 수업 청강이 절실히 필요하다. 그런 의미에서 다음 학기에 본인이 선봉장?!으로 다른 학교들 수업을 청강하려고 시도하고 있다. -0-!


 

Digital Humanities:

Cooperative Scheme between Humanities and Cultural Contents

 

Kim, Hyeon

 



This paper will argue that a cooperation is necessary between the fields of humanities contents and traditional humanities in exploring the potential of digital humanities.


Digital humanities refers to all new types of humanities research, education, and creative projects enabled by information technology. The definition is not limited to studies of traditional humanities topics using information technology as a research method; but it also includes completely new forms of humanities research realized by the use of computers.


Digital humanities can be beneficial to both humanities and cultural contents. For the traditional humanities studies, digital humanities will contribute to a wide dissemination of humanities knowledge in society; for cultural contents, digital humanities will provide the most efficient medium to acquire humanities knowledge for application in the cultural industry.


In order for the cultural contents to contain digital humanities, I suggest that education programs of the cultural contents departments should train some of their students in information technology to raise them as humanities knowledge coordinators. These coordinators should be equipped with not only the basic humanities knowledge, but also the information-processing skills to systemize the knowledge into digital contents. In case of Korea, where there is a shortage of professionals in the field of digital humanities, it is difficult for colleges to independently run digital humanities programs. But with open educational opportunities such as Digital Humanities Conference, it will be possible with just a few human resources to distribute knowledge and ideas to a large audience.



본 내용은 한국학중앙연구원 인문정보학 김현 교수의 "디지털 인문학: 인문학과 문화콘텐츠의 상생 구도에 관한 구상"의 일부를 발췌한 내용입니다.



영국 셰필드 대학과 허트포드셔 대학이 편찬한 'London Lives[각주:1]'이다.  이곳에는 1690년부터 1800년 사이에 영국 런던 거주민의 삶에 관계된 고문서 240,000 건이 집적되어 있다[각주:2].  교회 교구의 기록물을 비롯해 범죄와 재판에 관한 기록, 병원의 진료 기록과 검시 보고서, 상공인 조합의 기록, 빈민 구제에 관한 기록 등이다. 이 데이터 속에는 모두 3백35만 개의 인명이 포함되어 있는데, 데이터베이스 편찬자는 그 가운데 동일 인물들을 추적하여 18세기 런던의 하층민으로 살았던 수많은 사람들의 생애를 재구성할 수 있게 하였다. 이 데이터베이스의 효용을 가늠하는 사례로, 그 속에서 찾아진 한 고아 소년에 관한 기록을 살펴보기로 하자.




London Lives, 1690-1800: www.londonlives.org



John Conway는 1775년 6월 7일 St Clement Danes 교구회에 맡겨졌다. 교구 기록에는 그의 나이가 3년 6개월이고, 글을 읽고 주기도문을 욀 수 있다고 적혔다.  간호사 Hill이 주급 2 실링 6 펜스를 받고 그를 보육하였다. 1778년 John은 가난한 소년들에게 일거리와 숙식을 제공하는 구빈원(救貧元)으로 옮겨진다. (이 때 그의 나이는 2 살이 늘어난 8살로 기록된다.) 그는 이곳에서 걸레에 쓰는 실을 짜는 일을 했다. 교구의 도제 등록부에 의하면, John은 1783년 8월 30일 Essex 지방의 Barking에 사는 어부 Morris Jones의 도제(徒弟)로 보내진다. 이 때 만들어진 고용계약서에는 7주 후에 마스터인 Morris Jones가 2 파운드를 받고, 3년간의 고용 기간이 만료되면 2 파운드 2 실링을 더 받는 것으로 되어 있다. John은 3년 동안 일한 후에 옷 한 벌을 받기로 하였다. 1785년 4월 18일에 John은 다시 St Clement Danes 구빈원의 명부에 올랐다. 하지만 4월 22일에 열린 입원 자격 심사에서 그가 도제 생활을 한 지 9달 만에 도망쳤던 사실이 드러나 입원이 거부되었고, 다음날 그는 Barking으로 추방되었다. 1786년 3월 15일, John은 14살이라고 나이를 속이고 다시 구빈원에 들어오려고 했지만, 이번에도 심사를 통과하지 못했다. 3월 17일, 존은 다시 Barking으로 돌려보내졌다[각주:3]



본 내용은 한국학중앙연구원 인문정보학 김현 교수의 "디지털 인문학: 인문학과 문화콘텐츠의 상생 구도에 관한 구상"의 일부를 발췌한 내용입니다.


바로 : 이 프로젝트의 경우 세부적인 인물에 대한 ID값이 제대로 부여되지 않았기에 빅데이타 분석으로는 한계점이 보인다. 그러나 설령 그렇다고 하더라도 일단 모아놓으면 뭔가 된다. 다만 처음부터 제대로 설계했으면 더 좋은 결과가 있었을 것이다.




  1. London Lives, 1690-1800: http://www.londonlives.org, version 1.1, 24 April 2012. [본문으로]
  2. London Lives는 런던시의 8개 아카이브에 소장된 자료를 담은 15개 기존 데이터베이스를 이용하여 만들어졌다. [본문으로]
  3. London Lives: http://www.londonlives.org/static/ConwayJohn1775-1786.jsp [본문으로]

(서울=뉴스와이어) 2013년 07월 24일 -- 미래창조과학부(장관 최문기)는 창조경제를 견인할 민간전문가(CP, Creative Planner) 9명을 신규로 공모한다.

ICT를 활용한 창조경제를 실현하기 위해 CP는 민간의 다양한 경험과 최고의 지식을 갖춘 싱크탱크로서 미래선도 기술개발을 주도하며 산학연관의 협력 허브로서의 역할을 하게 된다.

이번에 선정될 CP는 9월부터 향후 2년간(연임 가능) 활동하게 된다.

미래부는 기존 방통위, 지경부 등에서 기술개발(R&D) 책임 기획 및 관리를 위해 운영해오던 PM(Project Manager)/PD(Program Director) 등 전문가제도를 개편하여, 기술개발뿐만 아니라 ICT 기반으로 창조경제 설계 역할을 수행하는 CP제도를 도입한다.

미래부는 CP제도를 통해 ICT분야의 기술정책, 기술개발, 기술사업화 등 정부 연구개발(R&D) 전과정에서 민간의 최고전문가를 활용하여 사업성과를 배가시킬 계획이다.

민간전문가(CP)는 미래부 ICT 주요 분야별로 R&D기획을 통한 신규과제의 발굴, R&D사업관리, R&D성과물의 확산 등 연구개발 전주기 관리를 하게 된다.

이번에 공모하는 민간전문가(CP) 분야는 ‘창조융합’, ‘네트워크’, ‘전파·위성’, ‘정보보호’, ‘기반SW·컴퓨팅’, ‘융합SW’, ‘스마트서비스’, ‘디지털콘텐츠’, ‘기술사업화’ 등 9개 분야로 구성된다.

CP 선정 절차는 서류전형, 면접전형을 거치게 되며, 9월 초에 최종 선발될 예정이다.

서류전형에서는 그간 업무성과, 직무수행계획서, 자기소개서 등을 평가하여 실제 채용인원의 3~5배수를 선발하고, 면접을 통해 전문성, 연구관리능력, 품성 등을 종합적으로 고려하여 최종 선발한다.

모집기간은 7월25일부터 8월19일까지 총 26일 동안 진행되며, 세부 채용 절차와 일정 등은 미래부 홈페이지(www.msip.go.kr), 한국방송통신전파진흥원 홈페이지(www.kca.kr)와 한국산업기술평가관리원 홈페이지(www.keit.re.kr)를 통해 확인할 수 있다. 


-----------------------------------------------------------


바로 : 고문직이면 디지털콘텐츠 분야에서 김현 교수님에게 하시도록 하고 싶지만......이건 고문직이 아니라 임용직임으로 눈물은 머금고 패스! 다만 "디지털콘텐츠" 영역을 어느 CP가 담당할지 궁금할 뿐이다. 사실 디지털콘텐츠 영역이 너무 방대해서 인문학의 디지털콘텐츠에 관심 없거나 모르는 CP면......


문화콘텐츠에 대한 정의가 무엇이냐를 떠나, 그 이름을 가지고 떠올리는 대상이 무엇이냐고 묻는다면, 그 답변은 아마도 수십 가지 이상으로 다양하게 나올 것이다. 방송 관계자는 드라마와 같은 방송 프로그램을, 음원 사업자는 대중음악, 모바일 서비스 프로바이더는 스마트폰 상에서 동작하는 게임 프로그램을 우선 연상할 것이다. 우리가 생각하는 ‘문화콘텐츠’는 무엇인가? 


  이 질문에 대해 여러 해 전부터 일관되게 유지해 온 나의 답변은 “인문지식이 곧 문화콘텐츠”라는 것이다[각주:1]부연하자면, 인문지식은 문화콘텐츠의 ‘소재’일 뿐 아니라, 그 자체로 문화콘텐츠일 수 있다는 것이다. 스마트폰이 만들어내고 있는 새로운 형태의 문화적 소비 현장을 들여다보자. 


  모바일 기기의 이용자들은 디지털 환경에서 영화나 드라마와 같은 영상물을 보면서 그 내용과 관련된 다양한 정보들을 끊임없이 탐색하고, 새로운 지식을 얻고 새로운 즐길 거리를 발견한다. 유적지를 탐방하면서 역사를 배우고 전통문화를 체험하는 활동의 양상도 예전과는 다르다. 방문자의 손에는 스마트폰이 들려 있고, 그것을 안내판의 한 구석이나 안내지도에 표시되어 있는 QR 코드 이미지에 비출 때마다 방문지에 관한 풍부한 정보가 쏟아진다. 


  인터넷, 모바일, IPTV 등 오늘날의 정보기술이 만들어낸 정보 통신 플랫폼은 지식이 곧 문화가 될 수 있는 여건을 만들어 주고 있다. 학술과 창작, 전문성과 대중성, 사실과 허구의 경계를 자유롭게 넘나드는 새로운 형태의 문화 향유가 가능해진 것이다. 놀이와 학습을 구분할 필요없이 그것들이 한 데 어우러진 복합적인 현상이 지식 정보화 시대인 오늘날의 ‘문화’이다.


  인문학을 배경으로 하는 문화콘텐츠학과의 교육 커리큘럼에서는 이른바 ‘스토리텔링’(Storytelling)이라고 하는 것이 비중있게 다루어지는 듯하다. 나 역시 스토리텔링의 인문콘텐츠의 중요한 부분이라는 점에 동의한다. 하지만  이 스토리텔링을 영화나 드라마, 게임과 같은 엔터테인먼트적 장르의 이야기 소재로만 보는 듯한 사고에는 찬성하지 않는다.  ‘노비의 도망’을 다루는 드라마를 보던 시청자가 호기심에 이끌려 ‘노비’라고 하는 키워드로 인터넷 상의 정보를 검색하고, 조선시대에 실제로 존재했던 노비 신분의 사람들과 도망 노비의 추쇄(推刷)에 관한 지식을 얻게 되었다고 가정해 보자. 이 드라마의 줄거리도 역사적 소재를 활용한 스토리텔링이지만, ‘노비’라는 키워드를 출발점으로 하여 노비의 생활, 노비의 도망, 노비의 신분 세탁, 노비의 추쇄의 실상 등 역사적 사실에 관한 지식을 단계적인 마우스 클릭으로 얻어낼 수 있도록 조직화화 하는 것 역시 스토리텔링의 한 가지라고 할 수 있다. 


  즐길거리로 만들어지는 ‘허구적 스토리텔링’과 지식을 조직화 하는 ‘사실적 스토리텔링’은 서로가 서로에 대해 뿌리와 열매가 되는 상보적 순환관계에 있다.  사실적 스토리텔링의 폭과 깊이가 더해질수록 그것을 응용한 허구적 스토리텔링의 수준이 높이질 것이고, 허구적 스토리텔링의 흥미와 인기는 다시 사실적 스토리텔링에 대한 수요를 촉발시키게 될 것이기 때문이다.


  우리가 디지털 인문학에 대해 갖는 비전은 그것이 인문학과 문화산업의 사이에서 부가가치의 선순환을 일으키는 펌프 역할을 하리라는 것이다. 기초적인 인문학 연구의 산물을 지식 콘텐츠로 조직화하고 이를 통해  문화산업적 콘텐츠의 생산을 돕는 것, 그렇게 해서 인문지식의 사회적 수요를 제고하고 인문학 연구가 더욱 활성화 되도록 할 것을 기대하는 것이다.



본 내용은 한국학중앙연구원 인문정보학 김현 교수의 "디지털 인문학: 인문학과 문화콘텐츠의 상생 구도에 관한 구상"의 일부를 발췌한 내용입니다.


바로 : 세속적으로 말하면...앞으로 이 전공은 어떻게든 먹고 살 수는 있을 것이다. 이것저것 할 것은 많거든...하지만 잘못하면 단순한 "지식노동자"가 될 가능성도 많다.


  1. 김현, 「문화콘텐츠, 정보기술 플랫폼, 그곳에서의 인문지식」, 『철학연구』 90, 2010. 8. [본문으로]

미국의 스텐포드 대학에서 수행한 ‘Mapping the Republic of Letters’ 프로젝트[각주:1]의 결과물이다. ‘편지 공화국’(Republic of Letters)이란 17, 18세기 유럽과 미국에서 원거리 편지 교신으로 지식과 감성의 공감대을 형성해 온 문화적 공동체를 지칭하는 표현이다. Mapping the Republic of Letters는 볼테르(Voltaire), 라이프니츠(Leibniz), 루소(Rousseau), 뉴톤(Newton), 디드로(Diderot) 등 계몽주의 시대의 인물들이 남긴 수 많은 편지의 발신지와 수신지, 발신 날짜로 기록된 공간, 시간 정보를 시각적으로 재현한 다이내믹 디지털 콘텐츠이다.


Mapping the Republic of Letters

http://www.stanford.edu/group/toolingup/rplviz/rplviz.swf

 
  예시 화면에서 보이듯이 특정 시간대에 주고받은 편지의 수발신 위치가 세계 지도 상에 표시되고 있다. 이 네트워크 그래프의 한 노드를 클릭하면 그것에 해당하는 편지의 목록이 나오고, 다시 클릭하면 개별 편지의 내용을 확인할 수 있게 된다.  이러한 수준의 고기능 시각화 프로그램은 스텐포드에서 컴퓨터 공학을 전공하는 학생들의 노력으로 만들어졌다. 하지만 그러한 응용이 가능했던 것은 방대한 규모의 유럽 계몽기 편지 데이터베이스가 인문학자들에 의해 먼저 구축되었기 때문이다. 


  ‘Mapping the Republic of Letters’에서 사용한 모든 데이터는 영국의 옥스퍼드 대학에서 만든 ‘Electronic Enlightenment[각주:2]’  데이터베이스에서 끌어온 것이다. 이 데이터베이스는 17세기 초에서 19세기 중반까지 약 200년의 기간 동안 7,476명의 사람들에 의해 쓰여진 60,647건의 역사적인 기록물을 담고 있다. 단순히 원문을 디지털화 한 것이 아니라, 본문에 270,000여 건의 주석을 부가하고, 관련 있는 사람들을 연결시키고, 중요한 키워드는 옥스퍼드 인명사전 등 50여 개의 다른 데이터베이스에 하이퍼링크로 연결되도록 하였다.



본 내용은 한국학중앙연구원 인문정보학 김현 교수의 "디지털 인문학: 인문학과 문화콘텐츠의 상생 구도에 관한 구상"의 일부를 발췌한 내용입니다.


바로 : 같은 시각화를 한국에 남아 있는 수 많은 서찰을 대상으로 진행했다고 생각해보자. 재미있을 것 같지 않은가? 문제는 무엇이냐...이런 시각화를 할 DB가 없어 ㅠㅠ 부분적으로 지금 만들고 있는 프로젝트가 있긴 하지만...기본적으로 없어. 사실 표준 공간정보DB도 없어서 확장도 제한적이야 ㅠㅠ



  1. Mapping the Republic of Letters: http://republicofletters.stanford.edu/, Stanford University [본문으로]
  2. Electronic Enlightenment Project: http://www.e-enlightenment.com/, Bodleian Libraries, University of Oxford [본문으로]

문화콘텐츠 관계자들과 이야기하다 보면 ‘디지털 기술’을 문화산업 분야에서 사용하는 디지털 영상이나 3D 전시관 구현 기술 쪽으로만 이해하는 경향이 있는 듯하다. 디지털 인문학에서도 시각화(Visualization) 분야에서는 이러한 것을 관심 있게 다룬다. 하지만 이보다 우선시하는 것은 인문지식을 정보화하는 방법이다. 이것은   인문지식을 그것의 학제적, 산업적 응용이 가능하도록 부품화 하고, 그 부품 사이에 새로운 문맥(Context)을 부여하는 기술이라고 할 수 있다. 


  나는 인문지식의 정보화 기술에 대한 연구를 인문정보학(Cultural Informatics)이라고 이름짓고[footnote]“인문정보학이라고 하는 것은 정보 기술을 인문 분야의 연구․교육 활동에 접목시켜 인문 지식의 사회적 공유체계를 구축하고, 아울러 그 체계 안에서 훈련을 받은 인문학 전공자가 정보 전문가로서 정보화 사회에 진출할 수 있는 여건을 조성하자는 제안이다.” (김현, 「인문정보학에 관한 구상」,

미국의 메사추세츠 공대(MIT)에서 수행하는 'Visualizing Cultures' 프로젝트는 “이미지가 이끄는 학술”(Image Driven Scholarship)을 표방하는 디지털 환경의 인문 교육 교재 개발 사업이다[각주:1].  역사적 사실에 관한 그림, 사진 등의 이미지 자료를 디지털 영상으로 제작하고[각주:2], 영상 자료의 구석 구석에 담긴 지식의 모티브를 찾아 학술적인 설명을 부가하는 방법으로 시각적인 스토리텔링을 구현하고 있다.




Visualizing Cultures: http://www.visualizingasia.com



이 저작물은 모두 월드 와이드 웹(World Wide Web)을 통해 공개되고 있으며 MIT의 온라인 교육 프로그램으로 활용되고 있다. ‘중국 광동 무역의 흥망’(Rise & Fall of the Canton Trade System), ‘흑선과 사무라이’(Black Ship & Samurai) 등 20개 주제에 관한 45개의 코스웨어 유닛이 만들어져 있는데, 흥미로운 사실은 그것이 모두 아시아의 근대에 관한 내용이라는 것이다. MIT의  Visualizing Cultures Project는 2010년부터 예일대학(Yale University)의 동아시아학위원회(Council of East Asian Studies)와 함께 'Visualizing Asia in the Modern World'라는 이름의 컨퍼런스를 개최해 오고 있다[각주:3]시각적인 자료를 통해 아시아의 역사와 문화를 연구한 것이나  아시아의 문화와 자연을 담은 멀티미디어 데이터베이스 등이 이 컨퍼런스를 통해 소개되고 있는데, 이러한 주제들이 앞으로 MIT의 Visualizing Cultures Project의 외연을 넓혀 갈 것으로 예상된다.



본 내용은 한국학중앙연구원 인문정보학 김현 교수의 "디지털 인문학: 인문학과 문화콘텐츠의 상생 구도에 관한 구상"의 일부를 발췌한 내용입니다.



바로 : 인문학 시각화의 훌륭한 예시이다. 그러나 기존의 인문학 교육내용을 억지로 컴퓨터로 옮겨놓은 느낌이다. 전체적인 UI가 좀 답답하다. 누가봐도 교.육.용.이라고 적혀 있기 때문이다. 인터넷 유져들은 교육용이라는 느낌이 들면 떠나간다. 그런 의미에서 구글의 역사적 순간의 UI나 접근이 더 좋지 않나 싶다.


  1. Vusualizing Cultures: http://ocw.mit.edu/ans7870/21f/21f.027/home/index.html, Massachusetts Institute of Technology [본문으로]
  2. Visualizing Cultures 프로젝트에서 활용하는 이미지는 대부분 미국과 일본의 유명 박물관에서 유물로 보존하고 있는 것들이다. 이러한 희귀 자료에 대한 접근성과 활용성을 높이는 것도 이 프로젝트가 지향하는 목표 가운데 하나이다. 이미지 자료 제공 기관: Arthur M. Sackler Gallery / Smithsonian Institution / Hiroshima Peace Memorial Museum / Honolulu Academy of Arts / Hood Museum of Art, Dartmouth College / Museum of Fine Arts, Boston / Peabody Essex Museum / Ryosenji Treasure Museum / Shiseido Corporation / Smith College Museum of Art [본문으로]
  3. Visualizing Asia in the Modern World: http://www.visualizingasia.com. 이 컨퍼런스는 2010년에 시작하여 해마다 열리고 있으며, Yale, Harvard, Princeton 세 대학이 각각의 연차 대회를 주관하였다. [본문으로]

+ Recent posts