이용이 거부 되었습니다.
Permission denied please try again
Start Page
권호: 제24호
저자: 양혜영, 하태현, 홍성화, 김규리
• 미래기술을 예측하는 것은 정부가 예산계획을 수립하거나 기업이 경영전략을 수립할 때 필요한 정보 중 하나이다. 기술이 발전함에 따라 기술이 사회에 미치는 영향이 커지고 기술에 의한 산업의 변화도 가속화되기 때문에 미래사회를 전망하기 위해서는 미래기술에 대한 이해가 중요하다. 미래기술 예측에는 일반적으로 논문 데이터베이스가 이용되고, 대표적인 논문 데이터베이스는 Web of Science와 SCOPUS가 있다. 논문문헌은 잘 정리된 전문적인 문서로, 최신 연구개발 동향을 알려주는 텍스트 빅데이터이다. 빅데이터와 인공지능 기술이 발전함에 따라 미래기술 예측도 데이터 기반의 머신러닝 방법이 적용되는 추세이다. 한국과학기술정보연구원(Korea Institute of Science and Technology Information, 이하 KISTI)은 빅데이터와 인공지능 기반의 미래기술 예측방법에 대한 연구를 수년간에 걸쳐 수행하고 있다. KISTI가 그동안 수행한 연구는 주로 논문인용관계를 이용하여 클러스터를 탐지하고 이를 부상기술(emerging technology)로 해석하는 것이다. 그리고 논문인용관계 클러스터의 장기간에 걸친 데이터를 학습하여 미래에 클러스터가 성장할 것인지 여부를 예측하는 것이다. 이 방법은 높은 정확도로 클러스터의 성장성을 예측하는데 도움을 주었다. 다만, ‘인용’이 발생하려면 대체로 수년간의 시간이 소요되므로, 논문인용관계 클러스터는 비교적 장기간에 걸쳐 축적된 기술분야에 적합한 방법이라고 할 수 있다.
• 우리는 최근의 짧은 시구간에서 발생하는 변화를 탐지하기 위한 보완적 방법이 필요하다고 인지해왔다. 특히 코로나19와 같은 전세계적인 팬데믹이 갑작스럽게 발생한 사실을 경험하면서, 장기간 축적된 데이터에는 존재하지 않더라도 새롭게 등장하는 위크시그널(weak signals)을 탐지하는 방법의 필요성이 증가하였다. 최근 European Commision의 Joint Research Center(JRC)에서 데이터분석에 기반한 과학기술 위크시그널 탐색의 발전된 형태를 선보였다. EC의 위크시그널은 SCOPUS 논문 데이터베이스에서 텍스트마이닝을 이용하여 도출되었다. 이는 과학기술분야 빅데이터 분석에 기반한 것으로, 위크시그널 탐색의 진일보한 방식을 보여주었다. 그렇지만 EC의 위크시그널 탐색 프로세스에서도 전체 프로세스의 후반부에서는 전문가들의 검토와 필터링, 그리고 키워드 그룹핑 등 전문가의 식견에 의한 과정이 반영되어 최종적인 위크시그널을 선별한 것으로 보인다.
• 우리는 전문가의 도움 없이 위크시그널을 자동으로 탐지하는 기술의 개발을 시도하였다. 완전 자동화된 탐지 프로세스가 잘 작동한다면 상시적인 운영이 가능한 위크시그널 모니터링 시스템을 구축할 수 있다. 우리는 EC의 방법론과 유사하게 SCOPUS 5년치 논문 빅데이터를 이용하여 키워드/키워드 구문을 추출하였다. 그리고 키워드/키워드 구문의 움직임을 측정하는 몇 가지 파라미터를 이용하여 최근 떠오르는 키워드, 팝핑키워드(popping keywords)를 선별하였다. 그런 다음 SCOPUS 논문텍스트를 이용하여 구축된 워드임베딩 모델에 기반하여 팝핑키워드 사이의 문맥적 유사도를 측정하였다. 이를 이용하여 팝핑키워드를 자동으로 그룹핑하는 방법을 개발하였다. 이러한 과정을 통하여 도출된 팝핑키워드 그룹을 위크시그널로 정의하였다. 우리는 이 방법을 “위크시그널 자동탐지 프로세스“라고 명명하였고, 2017~2021년 SCOPUS 논문 데이터로부터 439개의 위크시그널을 도출하였다. 본 보고서에서는 이 방법을 통해 도출한 439개의 ‘위크시그널 2023‘의 목록을 제시하였다. 또한 2016~2020년 SCOPUS 논문 데이터로부터 탐지된 391개의 위크시그널2022와 439개의 위크시그널2023을 비교하여 분석한 결과를 함께 제시하였다.
• 본 연구에서 제시된 “위크시그널 자동탐지 프로세스”와 위크시그널 탐지결과가 과학기술 전 분야의 위크시그널을 모니터링하는 데 도움이 되길 기대하고, 더 나아가 기술분야별 전문가 집단의 도메인지식과 결합하여 분야별 인사이트를 도출할 수 있기를 기대한다.