데이터 불균형과 측정 오차를 고려한 생분해성 섬유 인장 강신도 예측 모델 개발
논문 정보
- 제목: 데이터 불균형과 측정 오차를 고려한 생분해성 섬유 인장 강신도 예측 모델 개발 (The Development of Biodegradable Fiber Tensile Tenacity and Elongation Prediction Model Considering Data Imbalance and Measurement Error)
- 저자: Sechan Park (경북대학교), Deokyeop Kim (경북대학교), Kangbok Seo (경북대학교), 이우진 (경북대학교 컴퓨터학부)
- 학회/저널: 한국정보과학회 학술발표대회 (KSC 2022)
- 발행일: 2022-12-01
- DOI: -
- 주요 연구 내용: 생분해성 섬유(PLA) 방사 공정에서 데이터 불균형과 측정 오차를 고려한 이상치 처리 및 데이터 증강 기법을 적용하여 인장 강신도 예측 모델의 성능을 개선
- 주요 결과 및 결론: 제안된 이상치 처리와 데이터 증강 기법을 통해 인장 강도(tenacity)와 신도(elongation) 예측 모델의 성능이 유의미하게 향상
- 기여점: 섬유 방사 공정 데이터의 고유한 특성(불균형, 측정 오차)을 고려한 맞춤형 데이터 전처리 파이프라인 제안
요약
초록
생분해성 섬유, 특히 폴리유산(PLA, Polylactic Acid) 섬유는 환경 친화적 대안으로 주목받고 있으나, 방사 공정에서의 물성 예측은 데이터의 불균형과 측정 오차로 인해 어려운 과제이다. 본 연구는 섬유 방사 공정 데이터의 불균형과 측정 오차 특성을 고려한 이상치 처리 및 데이터 증강 기법을 제안하여, 인장 강도(tenacity)와 신도(elongation) 예측 모델의 성능을 개선한다.
서론
PLA 섬유는 옥수수 전분 등 천연 자원에서 추출되는 생분해성 고분자로, 기존 석유 기반 합성 섬유의 친환경적 대안으로 연구되고 있다. 섬유 방사 공정에서는 방사 온도, 연신비, 권취 속도 등 다양한 공정 파라미터가 최종 섬유의 물성(인장 강도, 신도)에 영향을 미친다. 그러나 실제 공정 데이터는 (1) 특정 공정 조건에 데이터가 편중되는 불균형 문제, (2) 물성 측정 시 발생하는 측정 오차 문제를 내포하고 있어, 이를 고려하지 않은 예측 모델은 성능이 저하될 수 있다.
방법론
본 연구의 방법론은 다음 단계로 구성된다:
-
이상치 처리:
- 측정 오차에 의한 이상치를 식별하기 위한 도메인 지식 기반 접근법 적용
- 물성 측정 시 반복 측정의 분산을 고려한 이상치 판별 기준 설정
- 통계적 기법(IQR, Z-score)과 도메인 특화 기법을 결합한 하이브리드 이상치 처리
-
데이터 증강(Data Augmentation):
- 데이터 불균형 문제를 해결하기 위한 오버샘플링 기법 적용
- 회귀 문제에 적합한 합성 데이터 생성 방법 활용
- 소수 클래스(적은 빈도의 공정 조건) 영역에서의 데이터 확대
-
예측 모델:
- 다양한 머신러닝 회귀 모델을 사용하여 인장 강도와 신도를 예측
- 전처리 전후의 모델 성능을 비교하여 제안 기법의 효과를 검증
실험 및 결과
PLA 섬유 방사 공정의 실제 데이터를 사용하여 실험을 수행하였다:
- 이상치 처리 효과: 측정 오차를 고려한 이상치 제거 후 모델의 예측 정확도가 향상되었으며, 특히 극단값 부근에서의 예측 오차가 크게 감소
- 데이터 증강 효과: 불균형 영역에 대한 오버샘플링을 통해 소수 공정 조건에서의 예측 성능이 개선
- 전체 파이프라인 효과: 이상치 처리와 데이터 증강을 순차적으로 적용했을 때 가장 높은 예측 성능을 달성
- 인장 강도와 신도 모두에서 제안된 전처리 파이프라인의 효과가 확인됨
결론
본 연구는 생분해성 섬유 방사 공정 데이터의 고유한 특성인 데이터 불균형과 측정 오차를 체계적으로 고려한 전처리 파이프라인을 제안하였다. 도메인 지식 기반의 이상치 처리와 회귀 문제에 적합한 데이터 증강 기법의 결합은 인장 강신도 예측 모델의 성능을 유의미하게 향상시켰다. 이 연구는 섬유 산업에서의 데이터 기반 물성 예측의 신뢰성을 높이는 데 기여하며, 유사한 데이터 특성을 가진 다른 제조 공정에도 적용 가능한 방법론을 제시한다.