본문 바로가기
ESSAYS & MISCELLANIES

간판 혹은 표기 변경과 검색의 문제

by taeshik.kim 2022. 3. 4.
반응형

다른 분야도 마찬가지겠지만, 언론은 DB와 검색이 생존 관건이다. DB구축이 잘 되고, 그렇게 구축된 자료들이 언제 어디서건 간단한 키워드 검색만으로 튀어나와야만 한다.

앞서 나는 이번 우크라이나 사태 와중에 그 도읍 키예프 표기가 '키우이'로 변경된 소식을 전하면서, 이 경우 관건은 실체가 같은 도시에 대한 동시 검색 기능 장착이라 했다.

간단히 말해 '키우이'를 쳐도 '키예프'라는 키워드가 들어간 기사가 자동으로 검출되고, 반대로 '키예프'라는 키워드를 넣어도 자동으로 '키우이'가 검색되어야만 한다. 그래야 자료의 일관성이 있다.

마침 우리 공장에서 그런 DB를 관장하는 부서 국장이 내 동기라, 커피 한 잔 하는 김에 이 얘기를 했더니 안 그래도 그런 작업을 진행하고 있다고 하기에 내심 안심되면서도 문제는 이런 경우야 알아차리기나 하지, 그렇지 아니하는 때는 어떤한가 하는 문제가 돌발한다.


근자 문화재청 산하 국립문화재연구소라는 기관이 간판을 국립문화재연구원으로 바꿨다. 한 글자 바꿨을 뿐이지만, 저런 관계를 알아채리지 못하고 그런갑다 하고 넘기면 큰 코 닥치게 되니, 자칫 국립문화재연구원 이라는 키워드만으로는 '국립문화재연구소'가 뜨지 않는 불상사로 이어진다.

물론 구글 같은 데서는 유사 혹은 연관 검색어라 해서 안내하지만, 개별 언론사 DB에서 이 기능이 구동되는 데는 얼마되지 않는다고 안다.

이 경우 국립문화재연구소와 국립문화재연구원은 따로 놀기 마련이다. 지금이야 갓 바뀌는 바람에 두 키워드를 넣어야 한다는 사실을 인지라도 하지, 금새 시간이 지나 버리면 영원히 한 쪽 자료가 사장하고 만다.

그리하여 내친 김에 '국립문화재연구소'와 '국립문화재연구원'은 연관 검색어로 장착토록 부탁을 했으며, 내친 김에 도쿄국립박물관 / 도쿄박물관 / 국립도쿄박물관 / 동경박물관도 연관어 검색을 넣었다.

또 생각난 김에 브리티시뮤지엄 / 영국박물관 / 대영박물관 셋도 한 꾸러미로 등록토록 했다.

지금 말한 것들은 오늘 내가 내 분야에서 이래저래 생각난 것들이지만, 나 역시 흘려버리고 만 것이 얼마나 많겠는가? 또 인간의 기억에는 한계가 있을 수밖에 없어, 이런 일이 어디 한두 개로 그치겠는가? 흔히 하는 말로 전 사적으로 매달려 해결해야 할 문제다.

자료는 단순히 쌓아 놓는다 해서 저절로 가치를 발하지 않는다.

그것은 가공을 거쳐야 하며, 그 가공을 위해서는 무엇보다 인덱싱이 필수다. 옛날에야 이 인덱싱이 오프라인 책 말미에 가나다 순서로 정리하고는 그 쪽수를 일일이 찾아 넣었지만, 지금 그렇게 한가한 시대가 아니다.

검색어 하나로 몇 초만에 내가 필요한 자료가 좌르르 뜨야 하는 시대다.

반응형

댓글