한국외국어대학교 기록학연구센터 산하 기록과 사회.문화 연구회는 대학원정보,기록관리학과와 공동으로 아래와 같이 콜로키움을 개최합니다. 

 

    일시 : 2014년 03월 21일 금요일 오후 7시  

    장소 : 본관 109호 
    주제 : 디지털 휴머니티 실현을 위한 기록관리 시스템의 방향모색: 기호학 이론들과의 접목에서

 

    발표자 : 한상진 선생님

    토론자 : 김택헌 선생님 




-----

바로 : 넵. 저도 참석합니다. 하아...저기 갔다 오면 몇 시야...ㅠㅠ 한국 디지털 인문학의 가장 큰 세력 중에 하나인 기록학쪽의 디지털 인문학에 대한 이야기를 듣지 않을 수 없죠. 다만..."디지털 휴머니티"라고 하니까 조금 어색하군요. 저에게는 "디지털 인문학"이 좀 더 익숙합니다.




소셜 네트워크 분석|

존 스콧슨 (지은이) | 

김광재, 김효동 (옮긴이) | 

커뮤니케이션북스 | 

2012-10-24 | 

원제 Social Network Analysis: a handbook|


소셜 네트워크에 대한 개론서 강력추천하고 싶은 책이다. 소셜 네트워크의 기본과 응용에 대해서 초보자들도 쉽게 접근할 수 있는 수준으로 핵심을 다루고 있다. 다만 소셜 네트워크의 이론 부분을 주로 다루고 있고, 실무 작업에 대한 설명은 간략화되어 있다. 



주요 문장 : 

계량화된 척도를 사용하여 특정한 연구 문제나 사회현상을 적용하는 것은 연구자의 지적 판단(infomed judgment)가 요구되는 중요한 문제라는 점이다. 이런 문제점들은 단순화되어서, 부분적으로 이해된 수학 개념을 이용함으로써 피할 수 있는 것이 아니다. 오직 계량화되는 척도에 대한 기본적인 논리를 명확하게 이해하는 것이 바탕이 되어야하며, 이를 통해서만 지적이며 사회학적인 판단과 분석이 가능하다. - P3


일반적인 사회과학에서 사용되는 데이터의 가장 평범한 특징은 그것들이 문화적 가치와 상징에 기초한다는 점이다. 물리학에서 사용되는 데이터와는 달리 사회과학 데이터는 의미(meaning), 동기(motives), 정의(definition), 분류(typification) 등을 바탕으로 구성되며, 종종 이런 데이터를 이해하기 위해서는 판단 혹은 해석이 필요하다. 사회과학자들은 이런 특성, 즉 데이터의 문화적 가치나 상징 그리고 그에 대한 판단 혹은 해석에 기초하여 독특한 유형의 데이터와 그 분석법을 연구해 왔다. 

대표적인 것이 '속성형 데이터(attribute data)'와 '관계형 데이터(relational data)'다. 속성형 데이터는 일반적으로 사람들(agents)의 속성(attributes), 의견(opinions), 행동(behaviors)과 관계가 있으며, 이 속성은 해당 개인 혹은 단체에 귀속된 특성(properties), 본질(qualities), 특징(characteristics) 등으로 여겨진다. 예를 들면 서베이나 인터뷰에서 얻은 데이터들은 단순히 특정한 개인들의 속성을 나타내는 것이라고 여겨지고 기존의 통계학적인 절차를 통해서 분석되는 것이 대부분이다. 여기서 말하는 기존 통계학적 방법들은 변수 분석(가령 수입, 직업, 교육 등의 특정한 변수 값이 측정되고 이들 간의 변량 분석이나 상관관계 분석이 이루어지는)을 말한다.

반면에 관계형 데이터는 연락(contacts), 유대(ties), 관련(connections), 단체 귀속(group attachments), 만남(meetings) 등을 기록하여 얻을 수 있는데, 이런 종류의 데이터는 일반 사람들 간의 관계를 나타내는 것으로서 개개인의 속성 등으로 환원할 수 없다. 관계는 개인의 속성이나 특성이 아니라 개인이 속한 체제(system)의 특성이 되는 것이다. 즉 관계는 개인 간에 존재하는 연결을 전체적인 관계의 체제로 이어주는 수단인 것이다. 이런 종류의 데이터 분석에 어울리는 분석 방법들을 연결망 분석이라고 한다. 이런 분석 방법들은 대개 관계를 개인 혹은 단체 간의 연결을 나타내는 것으로 간주한다. 연결망 연구는 양적인 혹은 통계학적인 데이터를 다룰 뿐만이 아니라, 질적인 척도를 사용하기도 한다.

물론 속성형 데이터나 관계형 데이터가(대부분의 개설서나 방법론들이 주로 이 둘을 다루기는 하지만) 사회과학 데이터의 종류의 전부라고 볼 수는 없다. 세번째 종류는 데이터로는 관념형 데이터(ideational data)가 있다. 관념형 데이터는 의미, 동기, 정의 , 분류 등 그 자체가 기술하는 데 쓰인다. 사실 이런 관념 데이터가 사회과학의 구심점임에도 불구하고 이런 종류의 데이터를 다루는 기술은 그리 발전해 오지 않았다. 베버(Weber, 1920~1921)가 제창하였던 유형 분석(typological analysis)이 가장 생산적인 접근이었지만 현재로서는 아직 발전 단계에 있다고 하겠다. - P4~P5




http://data.riss.kr


한국교육학술정보원, ‘공공정보 개방을 위한 데이터 공개 시범사이트’ 오픈
  • - 국내 최초의 링크데이터 서비스 
    - 정부3.0구현을 위한 데이터공개 기술 주목 
    - 공공데이터의 개방뿐만 아니라 데이터 활용방향까지 제시하는 서비스
서울--(뉴스와이어) 2014년 03월 18일 -- 학술연구분야 정보서비스 및 전자도서관솔루션 전문업체 ㈜퓨쳐누리(대표이사 추정호)는 ㈜프로토마(시맨틱웹 및 링크드데이터 구축전문 업체)와 함께 작년 12월 한국교육학술정보원(KERIS)이 서비스 중인 학술연구정보서비스(RISS)의 단행본과 해외학술지 정보에 대하여 링크드데이터 발행시스템을 구축하고 시범서비스(http://data.riss.kr)를 개시했다고 밝혔다. 

이번 서비스는 공공정보를 적극 개방,공유하고 부처간 칸막이를 없애 창조경제를 지원하려는 새로운 정보운영 패러다임인 ‘정부3.0’ 구현을 위한 데이터공개 기술로 주목받고 있다. 

서비스의 핵심기술인 링크드데이터(Linked Data)는 웹상에 존재하는 데이터를 구조화하여 웹을 통하여 개방하고, 유통하여 연계, 융합할 수 있게 함으로써 데이터의 재활용성을 크게 높일 수 있는 기술로, 한국교육학술정보원의 링크드데이터 시범서비스는 기관이 보유한 공공데이터의 개방뿐만 아니라 발행된 링크드데이터를 어떻게 효율적으로 활용할 수 있는지에 대한 방향성 제시를 위해 활용서비스를 함께 만들어 서비스하고 있는 점이 특징이다. 

RISS 링크드데이터 활용서비스는 외부의 링크드데이터인 DBpedia, Flickr, OCLC WorldCat(세계도서관 카탈로그), LCSH(미의회도서관 주제명표목), BNB(영국 국가서지)의 데이터를 연결하여 내부 콘텐츠로 활용, 새로운 서비스를 구현한 국내 최초의 사이트이다. 

한국교육학술정보원은 올 실험사업의 결과를 바탕으로 내년에는 학술논문, 학위논문 등 다양한 교육학술DB로 링크드데이터 발행범위를 더욱 확대해 나갈 계획이다. 

또한 ㈜퓨쳐누리는 지난 10월 고객들을 대상으로 자사 전자도서관 패키지시스템에 LOD를 기반으로 한 Mash-up 서비스를 시범 구축하여 선보인 바 있으며, 우즈베키스탄의 2개 대학에도 자사 전자도서관시스템을 성공적으로 구축하는 등 국내뿐만 아니라 해외에도 영역을 넓히고 있다. 
-------------------
바로 : 저도 방금 획득한 정보이기에 세부 분석은 못하였습니다. 다만 국제표준인 BIBO을 기본으로 하여서 한국적인 부분은 KERIS을 추가한 것으로 보입니다. 일단 박수를 보냅니다!!!! 당신들 최고야!!!! 솔직히 아직 데이터 조작까지 해보지는 못했지만, 설계에 오픈데이터를 사용했다는 것! 시도를 했다는 것! 그것 자체만으로도...사...사랑합니다. *^^*
다만 대충 봐도 너무 눈에 띄어서 그러는데....자체적으로 만든 KERIS가 크게 작용한 부분이 "도서관"이나 "대학"이름에 대한 내용인데...이걸 굳이 KERIS로 따로 만들 필요가 있었나라는 생각이 듭니다. 그냥 같은 "기관"요소 내에서 해결해도 될 듯 한데 말이죠. 또한 "작가" 부분도 이미 BIBO 혹은 다른 수 많은 표준 메타데이터 언어에 있는 것을 그대로 써도 될 텐데....기왕이면 기존의 것을 많이 이용할 수록 좋은 링크드데이터 계열에서 그다지 찬성하고 싶지 않은 방법이다.
머..이런건 기술적인 문제고......어찌되었든 이것으로서 학문연구성과 분야에서는 한국교육학술정보원이 한국에서 표준기관으로서 확고한 자리를 얻게 되었다. 이제 학술정보의 표준데이터는 한국교육학술정보원의 것이 된다. 선점 효과로 인하여 다른 기관이 이 분야를 노리기는...심히 힘들어질 것이다. 
보다 세부적인 것은 실데이터 조작까지 해보고...언젠가 상세한 리뷰...뿅!


한국문화교류센터 "한국 홍보 해외단체 지원합니다"


(서울=연합뉴스) 강성철 기자 = 한국학중앙연구원 산하의 한국문화교류센터(김현 소장)는 다음 달 4일까지 한국 바로 알리기에 앞장서는 해외 민간단체·학회 지원사업을 공모한다.


공모 대상은 외국 역사교과서에 나오는 한국 관련 왜곡을 바로잡는 등 한국을 바로 알리기 위한 학술회의나 연구를 진행하는 단체, 외국인을 위한 한국 자료를 개발·배포하는 단체, 온라인이나 멀티미디어를 통해 한국에 대한 오류나 왜곡을 바로잡는 단체 등이다.


한국문화교류센터는 지난 2003년부터 국내외 단체를 대상으로 지원사업을 펼쳐오다가 2009년부터는 해외 부문에만 전념하고 있다.


그동안 미국 워싱턴정신대문제대책위원회, 마케도니아 국립대 인문대학, 불가리아 소피아 18번 외국인학교, 러시아 국립경영대 한국학교육원, 중국 윈난한국어교육학회, 베트남 하노이사범대학 아시아연구소, 독일 한국-유럽 문화 대화의 집 등 지금까지 21개국 52개 단체를 지원했다.


한국문화교류센터 관계자는 "지난 3년간 지원에 힘입어 마케도니아 국립대는 최근 한국학과 개설을 앞두고 있으며, 지난해 지원한 하노이 사범대학의 아시아연구소는 한국-베트남 공동 역사교재 개발을 추진하고 있다"며 "매년 8∼10개 단체가 지원 대상으로 선정되는데 다양한 국가에서 한국 바로 알리기와 이미지 개선 효과를 거두고 있다"고 소개했다.


지원금은 과제당 1천만 내외이며, 올해부터 사이버상의 한국 홍보를 강화하기 위해 공모 분야에 '한국 관련 홍보영상 제작'이 추가됐다.


김 소장은 "최근 미국 교과서의 동해와 일본해 병기 관련 법안 통과에는 현지 한인으로 구성된 다양한 민간단체의 노력이 결정적이었다"며 "앞으로 예산 규모를 늘려 더 많은 단체가 한국 홍보에 앞장서도록 돕겠다"고 밝혔다.


자세한 내용은 홈페이지(www.aks.ac.kr) 참조. 문의 ☎031-709-6573


출처 : 연합뉴스 

---------------------


바로 : ....한국 홍보. 후후후...제대로 된 디지털 홍보를 보여주마..-0-!


[정미하기자] 간송미술문화재단이 보유한 문화재와 국보급 미술품들이 온라인 상에서 최초로 공개된다.


네이버(대표 김상헌)는 간송미술문화재단(이사장 전성우)와 협약을 맺고, 간송미술관이 보유한 소장품들을 네이버를 통해 온라인 최초로 공개한다고 27일 발표했다. 간송미술관이 외부에 작품 관련 정보를 직접 제공하는 것은 이번이 처음이다.


간송미술관은 간송 전형필이 설립한 우리나라 최초의 근대적 사립 미술관으로 '훈민정음 해례본'(국보 제 70호)과 신윤복의 화첩 '혜원 전신첩'(국보 제 135호) 등 국보 12점·보물 10점을 포함해 불상·도자·서화 등 방대한 규모의 유물들을 수장하고 있다.


27일에 공개되는 첫 번째 온라인 전시회 '간송문화(澗松文華)'전(展)에서는 간송미술관의 주요 소장품들이 우선 공개된다. 이용자들은 간송미술관의 대표 문화재인 '훈민정음 해례본'를 비롯해 고려청자 등 국보급 도자기와 신윤복의 회화 '단오풍정', 김정희의 서예 '대팽고회' 등 역사적 예술품들을 한자리에서 감상할 수 있다.


이용자는 네이버 미술검색서비스에서 전시작품을 확대해서 살펴보거나 자동 플레이 기능의 슬라이드쇼 방식을 활용해 온라인 전시회를 볼 수 있다. 또한 전시작품 페이지의 왼편에 있는 작품 정보를 누르면 작품에 대한 상세한 해설이 제공된다.


네이버캐스트에서도 간송미술관의 온라인 전시회와 관련된 자세한 정보가 제공된다. 이용자는 간송미술문화재단이 직접 소개하는 간송미술관의 건립 배경과 주요 전시 내용뿐 아니라 간송 전형필의 일대기와 '훈민정음 해례본' 창제 배경 등의 설명을 접할 수 있다. 네이버캐스트의 '전시회 산책' 코너에서는 간송미술관 온라인 전시회와 관련된 정보들이 계속해서 소개될 예정이다.


이외에도 네이버 온라인 전시회는 1970년대부터 진행해온 지난 80여회의 간송미술관 기획전에 출품됐던 다양한 유물들을 새롭게 구성한다. 또한, 올 3월 동대문 디자인 플라자에서 열리는 '간송문화전(展)'을 포함해 앞으로 개최되는 간송미술관의 전시회들도 온라인 전시회를 통해 공개할 예정이다.


간송미술문화재단 전인건 사무국장은 "이번 협약으로 보다 많은 분들이 간송 소장품을 통해 우리 민족문화의 우수성을 느끼고, 문화적 자긍심을 갖는 기회가 되었으면 좋겠다"며 "간송미술관은 앞으로도 네이버와의 다양한 협력을 통해 이용자들이 우리 민족미술에 더욱 가깝고, 친근하게 다가갈 수 있도록 노력하겠다"고 말했다.


네이버 한성숙 서비스 1본부장은 "그 동안 우리나라 고미술 작품들은 관련 정보가 부족해 온라인에서도 다양한 정보를 만나기 어려웠다"며 "이번 협약으로 이용자들이 웹 상에서 역사적 예술품들을 고품질 이미지와 해설정보를 통해 보다 정확하고, 풍부한 내용으로 만날 수 있게 됐다"고 말했다.


정미하기자 lotus@inews24.com



출처 : 네이버 "간송미술관 소장품 온라인 최초 공개" - '훈민정음 해례본' 등 공개





바로 : 네이버가 공략불가라고 판정받던 간송미술관의 공략에 성공했다. 간송미술관도 이제는 디지털 시대의 흐름을 읽은 것으로 보인다. 다만 간송미술관 정도면 기존 네이버 플랫폼에 자신들의 작품만 올리는 것이 아닌, 자신들의 작품만을 위한 전용 플랫폼에 도전해보는 것은 어떨까?! 너무 큰 욕심일까?!

서울--(뉴스와이어) 2014년 01월 23일 -- 미래창조과학부와 한국정보화진흥원은 ‘13년 국가DB 사업을 통해 웹기반 데이터 공유기술인 LOD(Linked Open Data)기술을 적용한 한국사DB 및 생물정보DB 구축 사업을 완료하였다. 


이번사업은 DB구축에 LOD기술을 최초 적용한 시범사업으로 보다 진보된 형태의 데이터 기반을 제공함으로써 일반 국민이 정제되고 융합된 데이터를 활용 할 수 있도록 신기술이 도입되었다. 


LOD기술은 기존의 웹을 문서뿐만 아니라 데이터들도 상호 연결(링크)시켜 웹을 하나의 거대한 데이터베이스처럼 활용할 수 있게 하는 것으로 www(월드와이드웹)의 창시자인 팀버너스리에 의해 정의되어 최근 빠르게 성장하고 있다. 


기존 정보시스템의 검색키워드 중심의 정보검색은 필요한 정보 외에 불필요한 정보들까지 함께 검색되기 때문에 사용자가 한번 더 정보를 가려내야 하지만, LOD기반의 정보시스템에서는 기계가 데이터간의 연관정보를 활용하여 분석하기 때문에 보다 정확하고 정제된 정보를 사용자에게 전달할 수 있다. 


한국사DB는 국사편찬위원회, 한국학중앙연구원의 민족문화대백과사전, 문화재청의 유물/유적 데이터 등 국내 한국사와 관련된 자료를 통합하여 정보의 접근성과 사용편이성을 확보하였다. 


예를 들어, 그동안 강감찬 장군에 관한 교육용 동영상 콘텐츠 제작을 위해서는 다양한 역사기관의 서비스에서 ‘강감찬’을 검색하고 관련내용을 다운받아 사용해야 했지만, LOD를 이용하면 ‘강감찬’과 관련된 분산된 연관자료를 한번에 검색하여 사용할 수 있다. 


또한, LOD 적용 과정에서 역사교과서 및 한국사 관련 주요 주제에 전문가 해설을 추가함으로써 역사 드라마, 영화 등의 한류콘텐츠와 역사교육자료로 활용될 것으로 기대된다. 


생물정보DB는 국가자연사 연구종합 정보시스템과 국가 생물종 지식정보시스템에 분산된 생물정보를 통합하여 단일창구를 제공함으로써 생물자원정보에 대한 접근성이 향상되었다. 


만약, 이용자가 ‘노랑부리백로’라는 정보를 검색한다면 ‘노랑부리백로’가 ‘백로속’에 속하는 척추동물이며, ‘백로’가 주로 ‘붕어’를 먹기 때문에 ‘붕어’가 서식하고 있는 ‘하천’에 ‘노랑부리백로’가 서식한다는 연관데이터 추출이 가능하여 향후 전자교과서 등 다양한 활용이 가능할 것으로 보인다. 


아울러, 그동안은 개별DB간에 연계가 어려웠으나 LOD 기술로 한국사DB와 생물정보DB간의 연동이 가능하여 생물정보 중 ‘소나무’를 검색했을 때 ‘경국대전에 따르면 일반인은 소나무의 벌채를 금하고 있다’라는 ‘경국대전’에 대한 연관정보와 이것을 ‘정도전’이 찬술했다는 연관정보를 제공함으로써 ‘소나무→경국대전→정도전’으로 이어지는 한국사정보까지 찾아낼 수 있게 될 것이다. 


최근 오픈데이터(정부3.0)는 링크드데이터(LOD)로 진화하고 있는 단계로, LOD기술은 향후 데이터 융·복합 비즈니스 창출, 빅데이터 분석 등 다양한 분야에 활용될 것으로 예상된다. 


실제로 미국과 유럽의 데이터개방 플랫폼에서 LOD방식으로 데이터를 제공하는 등 전 세계적으로 활용되고 있으나, ‘13년 실시한 국내 시장조사 결과에 따르면 국내에서는 아직 LOD에 대한 인식이 상대적으로 낮은 것으로 파악되었다. 


따라서, 미래부는 국가DB 구축 사업을 통해 LOD 적용 과제도 점차 확대해 나가는 한편, LOD기술에 대한 홍보와 더불어 LOD구축가이드를 마련하여 보다 쉽게 LOD를 구축·활용할 수 있도록 지원할 계획이다.

출처: 미래창조과학부



바로 : LOD의 핵심은 공유이다. 만약 수집되고 정리된 데이터가 공유되지 못한다면 LOD을 안하느니만 못한 상황이 된다. 그런데 미래창조과학부의 해당 뉴스자료에는 구체적인 데이터 베이스 접속 방법에 대한 이야기가 없다. 또한 한국사데이터베이스쪽에서도 데이터 공유에 대한 내용이 없다.


미래할 선도할 LOD 적용이 진정한 효과를 발휘하기 위해서...개방적인 데이터 이용이 가능했으면 하는 마음뿐이다. ^^




미래창조과학부와 한국정보화진흥원은 국가 데이터베이스(DB)를 한눈에 살펴 볼 수 있는 '국가DB 온라인 카탈로그' 서비스를 제공한다고 21일 밝혔다. 


이는 지난해까지 구축된 87종 3억1000건의 국가DB를 기관별, 분야별 온라인 카탈로그 형식으로 제공해 원하는 DB를 검색·이용까지 한 번에 가능하도록 한 것. 


특히 'DB 활용' 섹션을 통해 기 구축된 DB를 활용한 산업화 사례도 함께 제공할 뿐만 아니라, 지난해 출범한 '디지털지식 기자단'을 통해서는 국가DB 등 지식정보를 활용한 컨슈머리포트 등도 게시하게 된다. 


한국정보화진흥원은 "국가DB 카탈로그를 통해 이용자 중심의 DB서비스를 제공함으로써 DB 융복합(Mash-up) 및 비즈니스 활용 기반이 마련됐다"며 "기존의 일방적인 홍보활동에서 벗어나 디지털 지식 기자단 등에 의한 활발한 쌍방향 소통을 통해 지식정보 생태계에 새로운 바람을 불어넣을 것으로 기대된다"고 말했다. 


국가DB 온라인 카탈로그 해당 페이지 주소(koreadb.data.go.kr)를 입력하거나 공공데이터포털 홈페이지(www.data.go.kr) 링크를 통해 이용할 수 있다.



바로 : 솔직히 아직 직접 사용해보지는 않아서 뭐라고 하기는 힘들다. 다만 개념 자체는 기존의 공공데이터 포털의 문제점을 해결할 수 있는 좋은 방식으로 보인다. 자세한 내용은 추후 사용해 본 뒤에 올리도록 하겠다. 


정부가 전국 국공립사립대학 박물관에서 소장중인 국가유물정보의 관리표준을 마련하고, 이를 적극적으로 일반에 공개해 산업적 활용을 장려하는 정책을 수립했다.


20일 문화체육관광부는 국가유물정보에 대한 종합적인 대국민 서비스의 활성화를 위한 국가유물정보서비스 선진화추진계획을 발표했다.


이에 따르면 문체부는 현재 3.5% 수준인 국립박물관의 대국민 유물정보 공개율을 2017년까지 92.8% 수준으로 향상시킬 예정이다. 이를 통해 기존의 국가유물정보에 대한 인식을 관리중심에서 공개활용중심으로 전환하는 계기를 마련한다는 것이다.


또, 국립중앙박물관을 중심으로 모든 대학박물관이 참여하는 국가유물표준화위원회를 상설화, 국가유물정보 관리표준안을 제정하고 이를 지속적으로 개선해 나갈 예정이다. 이를 통해 그간의 고고, 회화, 도자기 중심의 유물정보 관리체계에서 벗어나 민속사, 자연사 등을 망라하는 표준유물 관리체계를 확립하는 것이다.


유물 정보의 고품질화를 통해 유물을 단순히 관람하는 차원에서 벗어나 산업적으로 활용하는 방안도 추진한다. 민간의 관심이 높은 유물정보를 중심으로 데이터베이스를 순차적으로 구축, 개별 박물관의 데이터베이스 구축 시 이를 활용할 수 있도록 지원할 예정이다.


문체부는 "정부 3.0정보공개 확대 정책에 맞게 국가유물 관리 체계의 선진화를 이룰 것"이라며 "소장 유물정보의 적극적인 공개와 보유기관 간 협업 체계 마련, 기관별 서비스 제공 등으로 대국민 접근성을 제고하고 유물정보가 상이해서 생기는 문제점을 해결할 것"이라고 밝혔다.


문체부는 이번 계획을 통해 2017년까지 단계적으로 약 80억 원의 예산을 투입할 예정이다.


서정근기자 antilaw@ 


출처 : 디지털 타임즈 http://www.dt.co.kr/contents.html?article_no=2014012102010231749002



바로 : ...현재 인문학 영역중에서 디지털을 가장 잘 사용하는 곳은 역시 고고-박물학분야가 아닐까?! 다만 현재 진행예정인 계획은 어디까지나 소장유물정보에 대한 데이터 베이스 구축과 정보공개로 보이는데......소장유물정보의 기본이 되는 발굴보고서에 대한 표준 및 데이터베이스 구축이 필요하다. 참고로 PDF을 모아놓고 검색하도록 하는 것을 말하지 않는다. 그건......정말 1차적이고 후진적인 방식이다.


가칭 "한국 역사 관계 데이터베이스(Korea Historical Network DataBase, KHNDB)"


본 내용은 한국 역사에서 출현하는 관계를 데이터베이스화 하기 위한 기초작업이다. 관계는 인물, 기관, 사물 등 다양한 영역의 관계를 의미한다. 그러나 역량의 한계로 우선적으로 특정 DB들을 바탕으로 인물관계 데이터베이스만 구축 시도한다.(그래도 10만건……혼자서 10만건 하려니 죽을 거 같…-_)


아래의 규칙들은 추후 수정될 수도 있다.

혹시 괜찮은 아이디어나 관련 정보가 있으시면 언제든지....조언 좀..ㅠㅠ

 


+ 인물 ID 값 규칙

예시 : 1가귀U9999X0

남녀구별 : 남자(1), 여자(2), 혼합(3), 미상(9)

한글이름 :  이름(가귀) 명시. 3자리 이상의 이름도 모두 서술

보조연도 : B(생년) or D(몰년) or U(미상) B1545 : 생년(Birth) 1545년을 의미, 몰년일 경우 D와 서기연도, 생몰년 미상일 경우 U9999가 옴

X0 : 중복되는 인물이 있을 경우 X1, X2로 증가. X9는 기존DB에 없는 것을 표기

 


 


+ 사회관계 ID값 규칙

예시 : S0101

사회관계고유값 : S(society)

분류코드값 : 분류코드표 참조

ID

한국어

영어

중국어

S0100

사회관계(포괄)

Associations (General)

社會關係籠統

S0101

사회관계(포괄)

Associations (General)

社會關係籠統

S0102

모두 X 구성원

Association through common membership

……之成員

S0103

사회교제

Social Interactions

社會交際

S0200

학술관계류

Scholarship

學術關係類

S0201

학술(포괄)

Scholarship (General)

學術籠統

S0202

사도관계(스승)

Teacher-Student

師生關係

S0203

사도관계(제자)

Teacher-Student

師生關係

S0204

학술교류

Intellectual Affiliations

學術交往

S0205

학술주제밀접

Association by Scholarly Topic

學術主題相近

S0206

모두 X 구성원

Association through common membership

……之成員

S0207

학술원조

Academic Patronage

學術襄助

S0208

문학예술교류

Literary and Artistic Affiliations

文學藝術交往

S0209

학술비판

Intellectual Attacks

學術攻訐

S0300

친구관계류

Friendship

朋友關係類

S0301

친구관계(포괄)

Friendship(General)

朋友關係籠統

S0400

정치관계류

Politics

政治關係類

S0401

정치관계(포괄)

Politics (General)

政治關係籠統

S0402

관직관계(동급)

Connection via office (equal)

官場關係平級

S0403

관직관계(부하)

Connection via office (subordinate)

官場關係下屬

S0404

관직관계(상사)

Connection via office (superior)

官場關係上司

S0405

정치원조

Supportive political association

政治奧援

S0406

천거보증

Recommendation and sponsorship

舉保

S0407

정치대항

Oppositional political association

政治對抗

S0500

저술관계류

Writings

著述關係類

S0501

저술관계(포괄)

Writings (General)

著述關係籠統

S0502

일반문장

Commemorative Texts

記詠文字

S0503

묘지문장

Epitaphs

墓誌文字

S0504

서발문문장

Prefaces/Postfaces

序跋文字

S0505

예의문장

Ritual Texts

禮儀文字

S0506

전기문장

Biographical Texts

傳記文字

S0507

논설문장

Explanatory Texts

論說文字

S0508

모토문장

Mottos

箴銘文字

S0509

서찰문장

Correspondences

書札文字

S0510

계약(보상)문장

Occasional Texts

應酬文字

S0600

군사관계류

Military

軍事關係類

S0601

군사관계(포괄)

Military (General)

軍事關係籠統

S0602

군사지원

Supportive military association

軍事支持

S0603

군사대항

Oppositional military association

軍事對抗

S0700

의료관계류

Medicine

醫療關係類

S0701

의료관계(포괄)

Medicine (General)

醫療關係籠統

S0800

종교관계류

Religion

教關係

S0801

종교관계(포괄)

Religion (General)

教關係籠統

S0900

가정관계류

Family

家庭關係類

S0901

가정관계(포괄)

Family (General)

家庭關係籠統

S1000

재정관계류

Finance

財務關係類

S1001

재정관계(포괄)

Finance (General)

財務關係籠統

S1100

예술관계류

 

 

S1101

예술관계(포괄)

 

 

 


 






+ 혈연관계 ID값 규칙

B0201_0302

혈연관계 고유값 : B

촌수 : 01, 02, 03 (단순촌수계산. 법도무시)

관계속성(상하위) : 0(통합), 1(상위) 2(동급) 3(하위)

관계속성(구분) : 무속성(0) 친계(1) 외계(2) 부당계(3) 처당계(4)

구분자 : _

남녀구별 : 통합(0), 남자(1), 여자(2)

고유값 : 3자리


사실 위의 규칙으로 확장시 1000개정도는 무난히 넘을 것이다. 일단 몇 개만 예시로 제시한 것일 뿐이다. CBDB의 혈연코드가 559개였는데, 본인이 4촌이하 주요정보만 대략 했는데도 170여개이다. 만약 본인이 마음만 먹으면 정말 1000개 만들수도 있다. 하지만 실제로 그런 관계가 문헌이나 자료에 명시된 경우는 거의 없기에 사실상 아래 코드로 90%이상 커버 가능하다고 본다. 

 

코드

설명

B9999_9999

미상

B0000_0000

친척

B0000_0100

姻親(통합)

B0000_0200

親族

B0000_0300

親屬

B0000_0400

直系親族

B0001_0000

直系血族

B0011_0000

直系尊屬

B0031_0000

直系卑屬

B0003_0000

부당(夫黨)

B0004_0000

처당(妻黨)

B0020_0000

부부(통합)

B0020_1000

丈夫(통합)

B0020_1001

未婚夫

B0020_1051

第二任丈夫

B0020_1052

第三任丈夫

B0020_2000

妻子(통합)

B0020_2001

未婚妻

B0020_2010

B0110_0000

부모(통합)

B0110_1000

(통합)

B0110_1001

生父

B0110_1002

養父

B0110_1003

繼父

B0110_1004

嗣父

B0110_2000

(통합)

B0110_2001

生母

B0110_2002

養母

B0110_2003

繼母

B0110_2004

嗣母

B0110_2005

乳母,유모

B0114_0000

장인-장모(통합)

B0114_1000

장인

B0114_2000

장모

B0113_0000

시아버지-시어머니

B0113_1000

시아버지(시부)

B0113_2000

시어머니(시모)

B0130_0000

자식(통합)

B0130_1000

아들(통합)

B0130_1001

獨子

B0130_1002

繼子

B0130_1003

養子(非嗣子)

B0130_1004

庶子

B0130_1005

私生子

B0130_1101

長子; 第一子

B0130_1102

次子

B0130_1103

三子

B0130_1104

四子

B0130_1105

五子

B0130_1106

六子

B0130_1107

七子

B0130_1108

八子

B0130_1109

九子

B0130_2000

(통합)

B0130_2001

獨女

B0130_2002

繼女

B0130_2003

養女(非嗣女)

B0130_2004

庶女

B0130_2005

私生女

B0130_2101

長女; 第一女

B0130_2102

次女

B0130_2103

三女

B0130_2104

四女

B0130_2105

五女

B0130_2106

六女

B0130_2107

七女

B0130_2108

八女

B0130_2109

九女

B0211_0000

조부모

B0211_1000

할아버지

B0211_2000

할머니

B0212_0000

외조부모

B0212_1000

외할아버지

B0212_2000

외할머니

B0214_0000

처조부모

B0214_1000

처조부

B0214_2000

처조모

B0213_0000

부조부모

B0213_1000

부조부

B0213_2000

부조모

B0220_0000

형제-자매

B0220_1000

(오빠)

B0220_2000

(오빠)의 처

B0220_2100

누나(언니)

B0200_1100

누나(언니의) 남편

B0220_1200

남동생

B0220_2200

남동생의 처

B0220_2300

여동생

B0220_1300

여동생의 남편

B0224_0000

처의 형제-자매

B0224_1000

처의 형(오빠)

B0224_2000

처의 형(오빠)의 처

B0224_2100

처의 누나(언니)

B0204_1100

처의 누나(언니의) 남편

B0224_1200

처의 남동생

B0224_2200

처의 남동생의 처

B0224_2300

처의 여동생

B0224_1300

처의 여동생의 남편

B0223_0000

남편의 형제-자매

B0223_1000

남편의 형(오빠)

B0223_2000

남편의 형(오빠)의 처

B0223_2100

남편의 누나(언니)

B0203_1100

남편의 누나(언니의) 남편

B0223_1200

남편의 남동생

B0223_2200

남편의 남동생의 처

B0223_2300

남편의 여동생

B0223_1300

남편의 여동생의 남편

B0230_0000

손자-손녀

B0230_1000

손자

B0230_2000

손자의 처

B0230_2100

손녀

B0230_1100

손녀의 남편

B0311_0000

증조부모

B0311_1000

증조부

B0311_2000

증조모

B0312_0000

외증조부

B0312_1000

외증조부

B0312_2000

외증조모

B0314_0000

처증조부모

B0314_1000

처증조부

B0314_2000

처증조모

B0313_0000

부증조부모

B0313_1000

부증조부

B0313_2000

부증조모

B0311_0100

삼촌-고모-

B0311_1100

삼촌

B0311_2100

삼촌의 처

B0311_1110

백부(큰아버지)

B0311_2110

백모(큰아버지의 처)

B0311_1120

숙부(작은아버지)

B0311_2120

숙모(작은아버지의 처)

B0311_2150

고모

B0311_1150

고모의 남편

B0311_2160

큰고모

B0311_1160

큰고모의 남편

B0311_2170

작은고모

B0311_1170

작은고모의 남편

B0312_0200

외숙-이모-

B0312_1200

외숙

B0312_2200

외숙의 처

B0312_2150

이모

B0312_1150

이모의 남편

B0314_0100

처고모부-처숙부-

B0314_1100

처고모부

B0314_2100

처고모부의 처

B0314_2150

처고모

B0314_1150

처고모의 남편

B0313_0100

부고모부-부숙부-

B0313_1100

부고모부

B0313_2100

부고모부의 처

B0313_2150

부고모

B0313_1150

부고모의 남편

B0331_0100

-생질-

B0331_1100

B0331_1200

질의 처

B0331_2150

생질

B0331_1150

생질의 처

B0411_0000

고조부모

B0411_1000

고조부

B0411_2000

고조모

B0412_0000

사촌

B0412_1000

남자사촌

B0412_2000

여자사촌

B0412_0100

종형제

B0412_1100

남자종형제

B0412_2100

여자종형제

B0412_0200

내종형제

B0412_1200

남자내종형제

B0412_2200

여자내종형제

B1001_1000

대부(大父)

B1001_1100

족숙(族叔)

B1002_1000

족형(族兄)

B1002_1100

족제(族弟)

B1003_1000

족질(族姪)

B9900_1000

종씨(宗氏), 존장(尊長)

 


 






+ XML 문서 설계

최대한 단순화 시켰다. 사실 복잡하게 하는게 더 이상하다. 

문제는 어떤 관계인지 판단해서 추가해주는 것이...일이지. ㅠㅠ 아우..ㅠㅠ




DTD

<?xml version="1.0" encoding="UTF-8"?>

<?generated by 바로-Baro-把路 ddokbaro.com  ddokbaro@gmail.com (2014.01.10)?>

<?Korea Historical Network DataBase?>

 

<!ELEMENT KHNDB ((인물+))>

<?우선 인물만 네트워킹 작업을 하고 추후 기관, 관직 등을 추가?>

 

<!ELEMENT 인물 ((관계정보))>

<!ATTLIST 인물   id CDATA #REQUIRED>

 

<!ELEMENT 관계정보 ((관계*))>

 

<!ELEMENT 관계 (#PCDATA)>

<!ATTLIST 관계   유형 CDATA #REQUIRED>

 

 

XML 예시

<?xml version="1.0" encoding="UTF-8"?>

<!DOCTYPE KHNDB SYSTEM "KHNDB.dtd">

<?generated by 바로-Baro-把路 ddokbaro.com  ddokbaro@gmail.com (2014.01.10)?>

<?Korea Historical Network DataBase?>

<?대상 인물 : 98140......어느 세월에 하나?>

 

<KHNDB>

             <인물 id="가귀U9999X0">

                           <관계정보>

                                        <관계 유형="S202">승전U9999X0</관계>

                           </관계정보>

             </인물>

             <인물 id="가루U9999X0">

                           <관계정보>

                                        <관계 유형="S404">안승U9999X0</관계>

                           </관계정보>

             </인물>

             <인물 id="가마U9999X0">

                           <관계정보>

                                        <관계 유형="S0401">아탁득문U9999X0</관계>

                                        <관계 유형="S0401">奇非U9999X9</관계>

                                        <관계 유형="S0401">欽明王U9999X9</관계>

                                        <관계 유형="S0401">眞慕宣文U9999X9</관계>

                           </관계정보>

             </인물>

             <인물 id="가실U9999X0">

                           <관계정보>

                                        <관계 유형="B0020_2000">설씨녀U9999X0</관계>

                           </관계정보>

             </인물>

             <인물 id="가실왕U9999X0">

                           <관계정보>

                                        <관계 유형="S0403">우륵U9999X0</관계>

                                        <관계 유형="S0111">우륵U9999X0</관계>

                                        <관계 유형="S0407">진흥왕U9999X9</관계>

                                        <관계 유형="S0603">진흥왕U9999X9</관계>

                           </관계정보>

             </인물>

             <인물 id="가안책B1559X0">

                           <관계정보>

                                        <관계 유형="B0110_1000">賈忠權U9999X9</관계>

                                        <관계 유형="B0220_1200">賈安術U9999X9</관계>

                           </관계정보>

             </인물>

             <인물 id="가안책B1559X0">

                           <관계정보>

                                        <관계 유형="S0404">부여융B0615X0</관계>

                                        <관계 유형="S0603">蘇定方U9999X9</관계>

                           </관계정보>

             </인물>

</KHNDB>

 

 

 

 

DTD(문서 형식 정의(Document Type Definition)는 컴퓨터 용어로, SGML 계열의 마크업 언어에서 문서 형식을 정의하는 것이다. SGML을 비롯해 HTML, XHTML, XML 따위에서 쓰인다. XML DTD는 XML 문서의 구조를 정의한다. 다시 말해서 Valid XML 문서가 되기 위해 문서 내에 어떤 요소를 사용하고, 요소간의 계층구조를 기술하고, 요소의 내용으로 올 수 있는 내용을 정의한다.


DTD는 문법이 간단하며, SGML 계열에서 사용되어 왔기에 기존의 다양한 문서 정의가 DTD로 되어 있다. 그러나 DTD가 가지고 있는 XML에서의 다양한 확장의 한계로 인하여 XML_Schema 표준을 사용할 것을 추천한다.



1. DTD 선언 방식

1.1. 외부 DTD 선언

<?xml version="1.0" ending="utf-8"?>

<!DOCTYPE 루트요소이름 SYSTEM "DTD문서경로">


SYSTEM : 시스템에 존재하는 물리적인 위치정보. 파일이름 or 특정URL

<!DOCTYPE CONCEPT SYSTEM "concept.dtd">

<!DOCTYPE CONCEPT SYSTEM "http://ddokbaro.tistory.com/xml/concept.dtd">

<!DOCTYPE CONCEPT SYSTEM "file:///c:/concept.dtd">


PUBLIC : 특수한 형태를 식별자를 사용하여 외부DTD 참조

<!DOCTYPE member PUBLIC "-//W3C/DTD XHTML 1.0 Strict//EN" >


혼합방식 : SYSTEM  + PUBLIC 

<!DOCTYPE CONCEPT PUBLIC "-//W3C/DTD XHTML 1.0 Strict//EN" "http://ddokbaro.tistory.com/xml/concept.dtd" >


1.2. 내부 DTD 선언 - 실무에서 쓸일 없음.

1.3. 외부-내부 DTD 선언 - 실무에서 쓸일 없음. 




2. ELEMENT

2.1. ELEMENT 정의 형태

#PCDATA(문자 데이터) : <!ELEMENT ele-name (#PCDATA)>

자식요소 : <!ELEMENT ele-name (ele-name+, ele-name, ....)+>

자식요소와 문자 데이터의 혼합 : <!ELEMENT ele-name (#PCDATA | ele-name ....)*>

EMPTY(빈 content) : <!ELEMENT ele-name EMPTY>

ANY(위의 4가지가 모두 오는 경우) : <!ELEMENT ele-name ANY>


2.2. 출연횟수 정의


?

 0 or 1 (출현하지 않거나 1번만 출현)

 0개 이상 출현(출현하지 않거나 반복 출현가능)

+

 1개 이상 출현(무조건 1번은 출현해야되고, 여러번 반복 출현 가능)


2.3. #PCDATA(문자 데이터)

- PCDATA : Parsed Character Data 

- 출현횟수 정의 불가 : <!ELEMENT name (#PCDATA)+>  (X)


2.4. 자식요소

<!ELEMENT CONCEPT (time, place)> 

<!ELEMENT PEOPLE ( (Mr|Ms), Firstname, Middlename*, Lastname) >

<!ELEMENT PEOPLE ( email*, ( homePhone | officePhone | mobilePhone)+, address?) > 


2.5. #PCDATA + 자식요소

<!ELEMENT 요소이름 (#PCDATA|요소명1|요소명2.....)*>

#PCDATA는 반드시 자식요소보다 먼저 와야 한다.

- "|" 이외의 출현횟수나 출현방법은 괄호 밖에 정의한다.


2.6. EMPTY - 빈요소, 실무에서 사용빈도 적음

<!ELEMENT 요소명 EMPTY>


2.7. ANY - 모든사항 허용, 최대한 사용하지 말 것

<!ELEMENT 요소명 ANY>




3. Attribute

3.1. 기본형식

<!ATTLIST ele-name (att-name type default-decl)+>


ele-name : 속성이 포함될 요소의 이름

att-name : 요소 안에 포함될 속성의 이름

type : 속성값을 제한하기 위한 값으로 10가지 속성타입이 올 수 있다.

default-decl : 속성이 요소에 반드시 포함되어야 하는지 등의 특별한 제한을 두기 위하여 사용된다. => #IMPLIED, #REQUIRED, 기본값, #FIXED


3.2. att-name

- 문자 시작, 숫자 시작 불가, 공백불가, "_", ":"로 시작가능


3.3. type

 CDATA 

 문자데이터(단순한 텍스트 문자열) 

 열거형 

 속성값은 반드시 DTD에 명시적으로 정의된 일련의 값들 중의 하나가 되어야 한다. 

 ID 

 속성값은 해당 요소에서 고유한 식별자이다. 이것은 반드시 모든 XML 이름 규칙을 따르는 텍스트 문자열 이어야 한다.

 IDREF 

 IDREF의 값과 똑같은 ID 값을 갖고 있는 요소에 대한 참조 값 

 IDREFS 

 공백에 의해 경계가 나뉘는 IDREF들의 리스트 

 NMTOKEN 

 하나의 이름 토큰 - XML 이름 규칙을 따르는 텍스트 문자열 

 NMTOKENS 

 공백에 의해 경계가 나뉘는 NMTOKEN들의 리스트 

 ENTITY

 이미 정의된 ENTITY의 이름 

 ENTITIES 

 공백에 의해 경계가 나뉘는 ENTITY 이름들의 리스트 

 NOTATION

 속성값은 DTD에 명시적으로 선언된 NOTATION type이 되어야 한다. 


<!ATTLIST ele-name att-name CDATA default-decl >

<!ATTLIST elel-name att-name (value1 | value2 | .. ) default-decl >

<!ATTLIST ele-name att-name ID (#REQUIRED|#IMPLIED)>

<!ATTLIST ele-name att-name IDREF(S) default-decl>

<!ATTLIST ele-name att-name NMTOKEN(S) default-decl >



3.4. default-decl

#REQUIRED

 속성은 반드시 요소에서 사용되어야 한다. 

#IMPLIED   속성 사용이 선택적이며, 만일 사용하지 않으면 요소는 이 속성을 갖지 않는다. 기본 값은 줄 수없다. 

 #FIXED

 속성 사용은 선택적이고, 사용하지 않으면 고정 값을 기본 값으로 가지며 사용할 경우, "고정 값"을 속성 값으로 가진다. 즉 상수와 동일하다. 




4. ENTITY

- 반복적으로 사용되는 문장이나 문자열을 참조

XML조각, DTD조각, 긴 문자열, 상수, non-XML 데이터 사용가능

- 세부사항 참조 링크




5. NOTATION - 실무에서는 추천 안함

- XML 응용프로그램에서 사용할 외부 응용 프로그램이나 이진 데이터에 이름 부여

<!NOTATION not-name SYSTEM URI>

<!NOTATION not-name  PUBLIC pURI sURI>



+ Recent posts