본문으로 건너뛰기

"Data Imbalance" 태그로 연결된 3개 게시물개의 게시물이 있습니다.

모든 태그 보기

Automated machine learning for fabric quality prediction: a comparative analysis

· 약 5분
Ahmet Metin
Turgay Tugay Bilgin

논문 정보

  • 제목: Automated machine learning for fabric quality prediction: a comparative analysis
  • 저자: Ahmet Metin (Bursa Technical University), Turgay Tugay Bilgin (Bursa Technical University)
  • 학회/저널: PeerJ Computer Science
  • 발행일: 2024-07-23
  • DOI: 10.7717/peerj-cs.2188
  • 주요 연구 내용: 7개의 오픈소스 AutoML(FLAML, AutoViML, EvalML, AutoGluon, H2OAutoML, PyCaret, TPOT) 기술을 비교하여 직물 품질 데이터의 불균형 문제를 해결하고, 계산 효율성과 예측 정확성 간의 최적 균형점을 찾는 방법론을 제시. IoT 센서와 ERP 시스템에서 수집된 데이터를 활용하여 품질 예측 모델을 자동화함.
  • 주요 결과 및 결론: EvalML이 평균 절대 오차(MAE)에서 2.8282로 가장 우수한 성능을 보였고, AutoGluon은 평균 절대 백분율 오차(MAPE), 평균 제곱근 오차(RMSE), 결정 계수(R2R^2)에서 각각 1.0444, 21.129, 0.964로 가장 나은 성능을 기록함. 그러나 AutoGluon은 추론 시간이 길다는 단점이 있어, 정확성과 계산 효율성 간의 상충 관계를 확인함.
  • 기여점: 섬유 산업에서 AutoML 적용에 대한 실용적인 가이드를 제공하고 Industry 4.0 기술을 활용한 직물 품질 예측 향상 로드맵을 제시. 예측 정확성과 계산 효율성 간의 균형점 탐색의 중요성을 강조하고, 모델 해석을 위한 특징 중요도(feature importance) 분석의 유용성을 입증함.

데이터 불균형과 측정 오차를 고려한 생분해성 섬유 인장 강신도 예측 모델 개발

· 약 3분
Sechan Park
Deokyeop Kim
Kangbok Seo
경북대학교 컴퓨터학부 전임교수

논문 정보

  • 제목: 데이터 불균형과 측정 오차를 고려한 생분해성 섬유 인장 강신도 예측 모델 개발 (The Development of Biodegradable Fiber Tensile Tenacity and Elongation Prediction Model Considering Data Imbalance and Measurement Error)
  • 저자: Sechan Park (경북대학교), Deokyeop Kim (경북대학교), Kangbok Seo (경북대학교), 이우진 (경북대학교 컴퓨터학부)
  • 학회/저널: 한국정보과학회 학술발표대회 (KSC 2022)
  • 발행일: 2022-12-01
  • DOI: -
  • 주요 연구 내용: 생분해성 섬유(PLA) 방사 공정에서 데이터 불균형과 측정 오차를 고려한 이상치 처리 및 데이터 증강 기법을 적용하여 인장 강신도 예측 모델의 성능을 개선
  • 주요 결과 및 결론: 제안된 이상치 처리와 데이터 증강 기법을 통해 인장 강도(tenacity)와 신도(elongation) 예측 모델의 성능이 유의미하게 향상
  • 기여점: 섬유 방사 공정 데이터의 고유한 특성(불균형, 측정 오차)을 고려한 맞춤형 데이터 전처리 파이프라인 제안

Analysing an imbalanced stroke prediction dataset using machine learning techniques

· 약 5분
Viswapriya Subramaniyam Elangovan
Rajeswari Devarajan
Osamah I. Khalaf
Mhd Saeed Sharif
Wael Elmedany

논문 정보

  • 제목: Analysing an Imbalanced Stroke Prediction Dataset Using Machine Learning Techniques
  • 저자: Viswapriya Subramaniyam Elangovan (SRM Institute of Science and Technology), Rajeswari Devarajan (SRM Institute of Science and Technology), Osamah I. Khalaf (Al-Nahrain University), Mhd Saeed Sharif (UEL University), Wael Elmedany (University of Bahrain)
  • 학회/저널: KIJOMS
  • 발행일: 2022-01-01
  • DOI: DOI 링크 없음
  • 주요 연구 내용: Kaggle의 공개 뇌졸중 예측 데이터셋은 소수 클래스(뇌졸중 환자)가 매우 적은 불균형 문제를 가짐. 이 문제를 해결하기 위해 SMOTE와 Adasyn 같은 오버샘플링 기법을 적용하여 데이터셋의 균형을 맞추고, 제안하는 하이브리드 신경망-랜덤 포레스트(NN-RF) 모델의 성능을 평가함.
  • 주요 결과 및 결론: 제안된 NN-RF 모델은 Adasyn 오버샘플링 기법을 적용했을 때 가장 높은 성능을 보였음. F1-score 75%, 정확도 84%, AUC 86%를 달성하여 다른 벤치마킹 알고리즘(DT, LR, NN, RF)보다 우수한 예측 성능을 입증함.
  • 기여점: 데이터 불균형 문제를 해결하기 위한 오버샘플링 기법의 효과를 검증함. 또한, 기존 단일 모델들의 한계를 극복하기 위해 신경망과 랜덤 포레스트를 결합한 하이브리드 모델을 제안하고 그 우수성을 실험적으로 증명함.