본문 바로가기
ESSAYS & MISCELLANIES

고대박물관 vs. 고려대박물관, 시소러스 thesaurus는 문화재도 춤추게 한다

by taeshik.kim 2023. 9. 17.
반응형
이 고려대학교박물관만 해도 동궐도를 비롯한 지정 문화재가 더러 있는데 지금 꼬라지로는 동궐도 검색한다고 문화재청 기어들어가서 고대박물관이라 하면 뜨지 않을 것이다.


대한민국 사적으로 등재된 옛 고려대학교 중앙도서관 검색 문제를 얼마전에 논했거니와,

그에서 나는 이 건물을 문화재청 통합검색(https://www.cha.go.kr/main.html) 이건, 그 하위 분류 검색시스템인 문화재검색이건 저 말을 고대중앙도서관 고려대중도서관 고려대학중앙도서관 같은 검색어로 넣으면 검색이 되지 않는다는 점을 지적했다. 

물론 그 검색어가 고대중앙도서관이건 고려대중앙도서관이건 고려대학교중앙도서관이건, 또 중간 띄어쓰기를 하건 말건, 네이버나 다음, 혹은 구글 같은 검색엔진을 돌리면 내가 원하는 정보에 접근이 가능하다.

문제는 문화재청에 들어가서 검색하면 도대체가 저런 문화재가 없는 것으로 나온다는 데 심각성이 있다. 

결론은 간단하다. 그 검색어가 고대중앙도서관이건 고려대중앙도서관이건 고려대학교중앙도서관이건, 지칭하는 대상이 같으므로 그 어떤 검색어를 넣건 그걸 넣으면 내가 필요한 정보가 좌르르 뜨야 한다. 

이런 검색을 가능케 하는 사전 혹은 그 체계를 시소러스 thesaurus 라 한다.

K컬처기획단장을 끝내고 내가 새로운 부서에서 맡은 업무가 바로 이 시소러스 사전 편찬 작업이라, 얼마 전 9월 11일은 이른바 구일일테러가 발발한 날짜라, 이 구일일테러는 표현이 실로 다양해서 9.11 이라 하는가 하면, 9·11 이라고도 하고, 저 가운데 점은 다른 부호를 쓰기도 한다. 

이건 4.19니 8.15 등등도 마찬가지여서, 물론 다른 검색엔진을 통해 검색하면야 다 교차 검색이 가능하게 해 놨지만, 연합뉴스 홈피를 들어와서 검색할 때는 저와 같은 동의어 유의어 사전이 구축되지 아니하면 정작 내가 필요한 정보가 누락되고야 만다. 

문화재의 경우에도 이 문제는 특히 심각한데, 특히 이른바 학술성이 강한 문화재는 문화재청이 등록한 공식 명칭이 있기는 하지만, 그걸로 해당 문화재를 기억하는 국민은 열 명 중 아홉도 되지 아니해서 제각각이라, 그 제각각한 것 중에서도 적어도 일반성을 갖춘 것들은 모조리 검출해서 유의어 동의어로 등록을 해 놓아야 한다. 

부여 왕릉원? 근자 문화재청이 부여 능산리고분군을 이딴 식으로 바꿔놨는데, 이 경우 또 심각한 문제가 발생해서 부여 왕릉원만 고정하면 그 이전 능산리고분군 따위는 검색이 되지 않는다.

이런 일을 막기 위해서도 시소러스 사전 구축은 시급하고 절박하기만 하다. 

그 인근 백제시대 절터만 해도 어떤 사람은 능사陵寺라 하고, 능사지陵寺址라 하고 능산리 절터라 하고 각기 다양한데, 이것들을 어찌할 것인가? 능사건 능사지건 능산리 절터건 그 어떤 말을 넣어도 검색이 되어야지 않겠는가? 

물론 이 시소러스 사전은 정보의 범람을 부르는 치명적인 결함이 있으니 예컨대 능사라 하면 그렇게 하는 것이 능사가 아니다 할 때 그 능사와 혼동할 우려도 많고, 또 AI가 더 발달해서 문맥에 따른 그 의미까지 알아채는 시대가 오기는 하겠지만 그런 능사를 구분하지 못해서 내가 필요하지 아니한 동음이의어까지 검출하는 비극을 부르곤 한다. 

그럼에도 천마총이건 155호분이건 어느 하나 검색어를 넣으면 둘 다 뜨야 하며, 98호분이건 황남대총이건 그 어떤 검색어로도 둘 다를 포함한 정보가 뜨야 한다.

이 155호분 98호분 검색어 얘기 나온 김에 저렇게 검색어 넣으면 1970년대 이전 관련 언론보도가 거의 뜨지 않은 불상사를 내가 발견했으니, 이 얘기는 혹 다른 기회를 빌리고자 한다. 

문화재 시소러스 사전 구축은 그만큼 절박하며 그만큼 시급하다. 

반응형

댓글