한양대 AI솔루션센터는 기업들에 맞춤형 인공지능(AI) 기술을 제공하는 국내 최초의 전문 AI연구소로, 센터에서 진행한 지능화 구축 성공사례를 시리즈로 소개하고 있다. 이번에 네 번째로 소개할 성공 사례는 수작업 데이터 입력 업무를 AI 모델을 적용, 데이터의 추출 및 입력 자동화로 수작업에 따른 생산력 저하 및 데이터 오입력 리스크를 개선한 PCB전문 업체 이야기다.수천 개의 정보가 섞인 설계도면에서 목표로 하는 일부분의 제조정보만을 추출하기 위해 다음과 같은 작업을 거쳤다. 단어의 경우, 도면상의 모든 문자와 위치를 다 읽어 들인 후 단어 단위로 분리하고, 주변 단어의 상대적인 위치와 의미로부터 상황을 인지하여 필요한 정보만을 추출하는 ‘위치 및 의미 기반’ 텍스트 정보추출 모델을 개발하였다. 동시에 도면을 그림파일로 변환한 후, 딥러닝 기반 영상 객체인식 기술을 적용하여 각 객체 (특히 표와 특정한 형태의 인식마크)의 형태와 상대적인 배치, 크기로부터 필요한 제조정보를 추정하는 그림 인식 인공지능모델을 개발하였다. 최종적으로 텍스트와 그림 인식 모델의 출력을 조합하여 목표로 하는 제조정보를 추출할 수 있었다. 이는 도면 설계자가 설계 도면을 생성할 때, 도면에 싣는 각 정보의 배치 및 순서에 대한 기본적인 규칙을 따르며, 이러한 기본적인 규칙에서 벗어날 때는 주변 객체 (문자 혹은 그림)의 위치나 Context로부터 추정할 수 있다는 가정에서 출발한 것이다. 결과적으로 수백 개의 도면에 적용한 결과 모두 정확하게 추출할 수 있었다.
이러한 데이터의 인식, 추출에 대한 지능화 모델을 성공적으로 도입, 적용하기 위해서는 데이터의 신뢰성 확보가 무엇보다 중요하다. 때문에 도면에 대한 면밀한 검토가 필요하고, 추출된 데이터는 100% 신뢰할 수 있어야 한다. 모든 항목에 대해 100% 정확도로 인식할 수 있다면 좋겠지만 현실적으로 100%를 만족할 수는 없다. 따라서 정확도가 99.99%이어도 0.01%의 오류 데이터 때문에 제품의 품질이 떨어질 수 있다는 점을 감안해야 한다. 인식 오류가 발생할 경우 담당자가 즉시 인지해 육안으로 재검사할 수 있도록 하고, 수작업으로 입력할 수 있게 하는 것이 최선의 방법일 수 있다.
데이터 인식, 추출에 대한 지능화 모델은 PCB 도면 뿐만 아니라 유통업, 제조업 및 건설업, 보험사 업무 등 다양한 분야에 활용 될 수 있을 것으로 기대된다.
<강상기 한양대 AI솔루션센터장>
관련뉴스








