이용이 거부 되었습니다.
Permission denied please try again
Start Page
권호: 제11호
저자: 이준영, 안세정, 김도현
• 이용가능한 지식의 규모가 급속히 확대되고, 다양한 분야 간 융합에 기반한 문제해결에 대한 요구가 높아지면서 과학기술의 전체 지형과 추세를 파악하는데 도움을 주는 ‘과학기술 지도’의 필요성은 더욱 증가하였다. 과학기술 연구활동의 산출물인 논문데이터를 기반으로 연구활동의 구성요소들과 요소 간의 관계를 추출하여 과학기술 활동이 수행되는 세부 영역을 확인하고, 각 영역의 상태를 각종 지표로 수치화하는 이른바 ‘과학계량학’의 작업에 대한 수요가 늘어난 것이다.
• 과학기술 지도는 ‘특정 시점’에서 과학기술의 ‘판세’를 파악하는데 도움을 주기도 하지만, 지도에 나타난 세부 영역들의 시계열적인 변동을 추적하고, 미래의 추세를 예측할 수 있는 토대도 제공한다. 지난 몇 년간 KISTI에서는 과학기술의 세부 연구영역(specialty)을 도출하고, 해당 영역에 속한 ‘노드’들이 형성하는 구조(structure)와 구조의 변동과 관련된 정보들이 영역의 미래 성장 추세에 대한 전조 지표(precursor) 역할을 할 가능성에 대하여 실험을 진행하였다.
• 초기 실험에서는 세부 연구영역별로 다양한 네트워크 분석지표를 설명 변수로, 미래 시점의 연구영역 성장 여부를 종속 변수로 설정한 머신러닝 기반 예측 모형을 구성하였으나 예측의 정확도가 목표 수준(85%)에 미달하는 결과를 얻었다. 이를 개선하기 위해 지표 중심의 예측 모형 구성 전략을 버리고, 세부 연구영역이 상층(연구분야/분과학문)과 하층(연구문제/주제)에서 위계적으로 중첩되어 있다는 점에 착안하여 각 층위별로 갖는 ‘구조’ 관련 정보를 벡터화(임베딩)하고 이를 예측 모형의 입력 변수로 설정하는 방식을 새롭게 개발하였다. 세부 연구영역에서는 ‘모티프’ 기법을 활용한 네트워크 임베딩 벡터, 상층에서는 분류코드 정보를 활용한 연구분야 임베딩 벡터, 하층에서는 BERT 모형을 활용한 문헌의 초록 임베딩 벡터를 생성하고, 이 벡터들을 결합한 최적의 딥러닝 예측 모형을 구성하였다.
• 세부 연구영역에 해당하는 ‘기술클러스터’는 연구결과의 신뢰성과 재현성을 위해 네덜란드 CWTS에서 공개한 클러스터(micro-field) 정보를 활용하였고, 학습 및 예측데이터 구성에 필요한 데이터는 Web of Science와 연동하여 수집하였다. 최종 실험 결과, 딥러닝 기반의 예측 모형은 정확도가 86.72%로 크게 향상되었으며 본 예측 모형을 활용하여 2019 KISTI 10대 미래유망기술도 발굴하였다. 본 고는 이러한 데이터 기반의 기술 예측이 기존 전문가 기반 기술 예측과 상호 보완적으로 결합함으로써 예측의 정확도 제고 뿐만 아니라, 과학기술 활동에 대한 이해를 심화시킬 수 있다고 제안한다.