재료마당, 35 (1) 67-79 (2022.1.) [pdf]

 

소재 연구데이터의 구조 및 표준 어휘 사전 구축

 

김수현, 김정한, 김지한, 신호선, 안재평, 오창석, 이광렬, 이동화, 이정훈, 박선화, 장현주, 한상수, 한승우, 허용학 (가나다순)
 

 

체계적으로 구조화된 소재 연구 데이터는 그 자체로 활용도가 높은 연구개발 자원일 뿐 아니라, 인공지능에 의한 소재 설계 역량을 갖추기 위한 핵심 연구기반이다. 다양한 소스로부터 수집된 소재 연구 데이터를 효율적으로 검색하고 활용하기 위해서는 데이터의 이름 등 키워드를 통일하고 해당 데이터의 타입 그리고 수치 데이터의 단위 를 일치시키는 것이 대단히 중요하다. 또한, 머신러닝에 의한 소재 설계를 위해서는 소재의 성능 데이터를 소재의 구조나 공정상의 특이성과 연계하여 수집 관리하여야 한다. 이 상관관계를 기계적으로 학습함으로써 소재 설계의 머신러닝 모델이 만들어 질 수 있기 때문이다. 따라서, 데이터 키워드의 표준화와 함께 데이터의 구조가 표준화되어야 소재 연구 데이터의 활용성을 크게 증진시킬 수 있을 것이다. 소재 연구 데이터 표준화 전문위원회에서는 다양한 소재 연구 데이터들을 일관되게 다룰 수 있는 데이터 구조를 구축하여 제안하였다. 응용범위가 다양한 소재 분야의 특성을 고려하여 “소재 시스템” 개념을 채택한 소재 연구 데이터의 표준 구조를 제안하고, 데이터 키워드 어휘들을 정의한 표준 어휘 사전을 구축하여 공개하고 있다.