본문으로 건너뛰기

Enhancing Game AI Behaviors with Large Language Models and Agentic AI

· 약 3분
Ciprian Paduraru
Miruna Gabriela Paduraru
Alin Stefanescu

논문 정보

  • 제목: Enhancing Game AI Behaviors with Large Language Models and Agentic AI
  • 저자: Ciprian Paduraru (Gameloft & University of Bucharest), Miruna Gabriela Paduraru (University of Bucharest), Alin Stefanescu (University of Bucharest)
  • 학회/저널: FSE 2025 (33rd ACM International Conference on the Foundations of Software Engineering) - Industry Papers
  • 발행일: 2025-06-25
  • DOI: 10.1145/3696630.3728553
  • 주요 연구 내용: LLM과 에이전트 기반 AI를 활용하여 게임 NPC의 복잡한 행동 트리(BT)를 자동 생성하는 프레임워크를 제안하며, 소스 코드와 게임 엔진 시각 도구 간의 간극을 해소
  • 주요 결과 및 결론: 소형 로컬 모델로 외부 API 없이 구동 가능하며, 기술/비기술 스테이크홀더 모두 활용 가능한 실용적 접근법을 산학 협력으로 검증
  • 기여점: LLM 기반 BT 자동 생성 파이프라인, 게임 엔진 시각 도구 통합, NPC 행동 다양성 및 테스트 가능성 향상, 다양한 게임 엔진에 적응 가능한 확장성 있는 아키텍처

A Study on the Capability of Generative AI to Understand and Utilize Test Cases

· 약 4분
김정인
경북대학교 컴퓨터학부 석사과정생
경북대학교 컴퓨터학부 전임교수

논문 정보

  • 제목: A Study on the Capability of Generative AI to Understand and Utilize Test Cases
  • 저자: 김정인, 이우진 (경북대학교 컴퓨터학부)
  • 학회/저널: KCC 2025
  • 발행일: 2025-06-20
  • DOI: N/A
  • 주요 연구 내용: 최신 LLM인 GPT-4.1을 대상으로 경쟁 프로그래밍(CP) 문제 해결 시, 제로샷 프롬프팅 환경에서 테스트케이스(TC) 정보를 제공하는 것이 코드 생성 정확도에 미치는 영향을 분석함. 문제 정의만 제공한 경우, 문제 정의와 TC를 함께 제공한 경우, 입출력 정보와 TC만 제공한 경우로 나누어 실험을 설계하고 결과를 비교함.
  • 주요 결과 및 결론: TC 정보 추가가 전반적인 코드 생성 정확도 향상으로 이어지지 않았으며, 특히 문제 난이도가 높을수록 성능이 저하되는 경향을 보였음. 또한, GPT-4.1은 TC를 생성하고 검증하는 능력에도 명확한 한계를 보였음.
  • 기여점: LLM의 코드 생성 과정에서 TC 정보가 항상 긍정적인 영향을 미치는 것은 아니라는 점을 실험적으로 밝힘. 이는 LLM이 개발자처럼 TC를 통해 문제의 요구사항이나 잠재적 오류를 추론하는 단계에 이르지 못했음을 시사하며, LLM 활용 시 TC 포함 전략에 신중한 접근이 필요함을 제기함.

OPENFACE 3.0: A Lightweight Multitask System for Comprehensive Facial Behavior Analysis

· 약 6분
Jiewen Hu
Leena Mathur
Paul Pu Liang
Louis-Philippe Morency

논문 정보

  • 제목: OPENFACE 3.0: A Lightweight Multitask System for Comprehensive Facial Behavior Analysis
  • 저자: Jiewen Hu (Carnegie Mellon University), Leena Mathur (Carnegie Mellon University), Paul Pu Liang (Massachusetts Institute of Technology), Louis-Philippe Morency (Carnegie Mellon University)
  • 학회/저널: arXiv (v1)
  • 발행일: 2025-06-03
  • DOI: N/A (arXiv submission)
  • 주요 연구 내용: 본 논문은 네 가지 핵심 안면 분석 작업(랜드마크 감지, 표정 단위(AU) 감지, 시선 추정, 감정 인식)을 동시에 수행하는 경량화된 통합 모델 OpenFace 3.0을 제안함. 다중 작업 학습(Multi-Task Learning, MTL) 아키텍처를 사용하여 파라미터를 공유함으로써 효율성을 극대화함.
  • 주요 결과 및 결론: OpenFace 3.0은 이전 버전(OpenFace 2.0) 및 타 툴킷 대비 예측 성능, 추론 속도, 메모리 효율성에서 상당한 개선을 보임. 특히 다중 작업 학습을 통해 정면이 아닌 각도의 얼굴(angled faces) 인식 성능이 SOTA 모델을 능가하는 강력한 일반화 성능을 입증함.
  • 기여점: 단일 모델로 4가지 안면 분석 작업을 실시간으로 처리할 수 있는 고성능 오픈소스 툴킷을 제공. 또한, 서로 다른 작업(예: 시선 추정 데이터)의 특징 공유가 다른 작업(예: 감정 인식)의 성능, 특히 비정면 얼굴에서의 성능을 향상시킬 수 있음을 보임.

Flow2Code: Evaluating Large Language Models for Flowchart-based Code Generation Capability

· 약 5분
Mengliang He
Jiayi Zeng
Yankai Jiang
Wei Zhang
Zeming Liu
Xiaoming Shi
Aimin Zhou

논문 정보

  • 제목: Flow2Code: Evaluating Large Language Models for Flowchart-based Code Generation Capability
  • 저자: Mengliang He (East China Normal University), Jiayi Zeng (East China Normal University), Yankai Jiang (Shanghai AI Lab), Wei Zhang (East China Normal University), Zeming Liu (Beihang University), Xiaoming Shi (East China Normal University), Aimin Zhou (East China Normal University)
  • 학회/저널: arXiv (v1)
  • 발행일: 2025-06-02
  • DOI: (arXiv:2506.02073)
  • 주요 연구 내용: 기존 LLM 코드 생성 벤치마크가 순서도(flowchart)를 간과하고 있다는 문제를 지적. 15개 프로그래밍 언어, 3가지 순서도 유형(코드, UML, 의사코드)에 걸친 총 16,866개의 순서도를 포함하는 'Flow2Code'라는 새로운 벤치마크 데이터셋을 구축.
  • 주요 결과 및 결론: 13개의 최신 멀티모달 LLM(MLLM)을 평가한 결과, 현재 모델들이 순서도를 완벽하게 코드로 변환하지 못하며, 특히 의사코드(pseudocode) 순서도에서 성능 저하가 큼을 발견. 또한, 지도 미세조정(Supervised Fine-Tuning)이 모델 성능 향상에 크게 기여함을 확인함.
  • 기여점: 순서도 기반 코드 생성이라는 새로운 연구 방향을 제시. 해당 작업을 위한 포괄적인 벤치마크(Flow2Code)를 공개하고, 현재 MLLM의 한계를 명확히 식별하며, 성능 향상을 위한 미세조정의 효과를 입증함.

Small Language Models are the Future of Agentic AI

· 약 8분
Peter Belcak
Greg Heinrich
Shizhe Diao
Yonggan Fu
Xin Dong
Saurav Muralidharan
Yingyan Lin
Pavlo Molchanov

논문 정보

  • 제목: Small Language Models are the Future of Agentic AI
  • 저자: Peter Belcak, Greg Heinrich, Saurav Muralidharan, Shizhe Diao, Yonggan Fu, Xin Dong, Yingyan Celine Lin, Pavlo Molchanov (Georgia Institute of Technology, NVIDIA Research)
  • 학회/저널: arXiv preprint
  • 발행일: 2025-06-02
  • DOI: 제공되지 않음
  • 주요 연구 내용: 에이전트 AI 시스템의 대부분 작업이 반복적이고 범위가 한정되어 있어, 범용 LLM보다는 특정 작업에 특화된 SLM이 더 적합하다고 주장함. SLM이 충분한 성능을 갖추고 있으며(V1), 운영상 더 적합하고(V2), 경제적으로 필연적인 선택(V3)임을 다양한 근거를 통해 설명함.
  • 주요 결과 및 결론: 최신 SLM들은 이미 LLM에 필적하는 성능을 보이며 추론 비용, 미세조정, 엣지 배포 등에서 상당한 이점을 가짐. 따라서 에이전트 시스템은 SLM을 기본으로 사용하고 필요할 때만 LLM을 호출하는 이기종(heterogeneous) 시스템으로 발전해야 하며, 이를 위한 LLM-to-SLM 변환 알고리즘을 제안함.
  • 기여점: 에이전트 AI 분야에서 LLM 중심 패러다임에 대한 비판적 관점을 제시하고, SLM의 효용성과 경제성을 강조하여 지속 가능하고 책임감 있는 AI 배포의 필요성에 대한 논의를 촉발함. 또한, 기존 LLM 기반 에이전트를 SLM 기반으로 전환할 수 있는 구체적인 알고리즘을 제공함.

Al Adoption for Collaboration: Factors Influencing Inclusive Learning Adoption in Higher Education

· 약 5분
IBRAHIM ALYOUSSEF
AMR MOHAMMED DRWISH
FATIMAH ADEL ALBAKHEET
RAFDAN HASSAN ALHAJHOJ

논문 정보

  • 제목: Al Adoption for Collaboration: Factors Influencing Inclusive Learning Adoption in Higher Education
  • 저자: IBRAHIM YOUSSEF ALYOUSSEFD 외 4명 (King Faisal University)
  • 학회/저널: IEEE Access
  • 발행일: 2025-05-07
  • DOI: 10.1109/ACCESS.2025.3567656
  • 주요 연구 내용: 기술 수용 모델(TAM)을 확장하여 '인식된 AI 출력 품질', '신뢰', '친숙도', '교육 서비스 품질', '참여 효능감' 등의 변수가 AI 기술 수용에 미치는 영향을 탐구함. 사우디아라비아의 King Faisal University 학생 443명을 대상으로 설문조사를 실시하고, 구조 방정식 모델링(SEM)을 통해 가설을 검증함.
  • 주요 결과 및 결론: '인식된 사용 용이성'과 '인식된 유용성'이 '행동 의도'에, 그리고 '행동 의도'가 실제 'AI 채택'에 긍정적인 영향을 미치는 것을 확인함. 특히 '참여 효능감'이 사용 용이성과 유용성 인식에 큰 영향을 주었으나, 'AI 출력 품질'은 '유용성'에 유의미한 영향을 미치지 않음.
  • 기여점: 고등 교육의 포용적, 협력적 학습 환경에서 AI 채택에 영향을 미치는 요인들을 실증적으로 분석함. 개발도상국 상황에서의 데이터를 제공하고, AI 기술의 효과적인 통합을 위한 실질적인 교육 전략을 제안하여 기존 TAM 연구를 확장함.

Test Intention Guided LLM-based Unit Test Generation

· 약 5분
Zifan Nan
Zhaoqiang Guo
Kui Liu
Xin Xia

논문 정보

  • 제목: Test Intention Guided LLM-based Unit Test Generation
  • 저자: Zifan Nan, Zhaoqiang Guo, Kui Liu, Xin Xia (Huawei Technologies Co., Ltd.)
  • 학회/저널: 2025 IEEE/ACM 47th International Conference on Software Engineering (ICSE)
  • 발행일: 2025-05-01 (ICSE 2025 Proceedings)
  • DOI: 10.1109/ICSE55347.2025.00243
  • 주요 연구 내용: 정적 분석 기반의 PAINT 기법을 통해 코드의 분기(Branch)와 의존성을 분석하고, 이를 바탕으로 명시적인 '테스트 의도(Test Intention)'를 생성하여 LLM 프롬프트에 주입함으로써 단위 테스트의 품질을 향상시키는 IntUT 프레임워크를 제안함.
  • 주요 결과 및 결론: 산업계 자바 프로젝트 적용 결과, 기존 방식 대비 분기 커버리지(Branch Coverage)를 94%, 라인 커버리지(Line Coverage)를 49% 향상시켰으며, 실제 개발자 대상 라이브 스터디에서 30%의 효율성 향상을 입증함.
  • 기여점: 단순 코드 컨텍스트 제공을 넘어, 프로그램 분석을 통해 도출된 명확한 테스트 시나리오(입력값, Mocking 동작, 기대 결과)를 LLM에 가이드함으로써 복잡한 분기와 의존성을 가진 코드에 대한 테스트 생성 한계를 극복함.

Real-time Semantic Full-Body Haptic Feedback Converted from Sound for Virtual Reality Gameplay

· 약 5분
Gyeore Yun
Seungmoon Choi

논문 정보

  • 제목: Real-time Semantic Full-Body Haptic Feedback Converted from Sound for Virtual Reality Gameplay
  • 저자: Gyeore Yun, Seungmoon Choi (Pohang University of Science and Technology, POSTECH)
  • 학회/저널: CHI Conference on Human Factors in Computing Systems (CHI '25)
  • 발행일: 2025-04-26
  • DOI: 10.1145/3706598.3713355
  • 주요 연구 내용: VR FPS 게임의 사운드 스트림을 실시간으로 캡처하여 Long-Short-Term Memory (LSTM) 모델로 총성, 피격, 폭발 등 의미론적 이벤트로 분류한다. 이후 분류된 이벤트에 맞춰 미리 디자인된 전신 햅틱 패턴을 생성하여 햅틱 슈트를 통해 사용자에게 전달하는 시스템을 제안함.
  • 주요 결과 및 결론: 사용자 연구를 통해 제안된 의미론적 사운드-햅틱 변환 시스템이 기존의 단순 신호 처리 기반 변환 방식(NS-ALL)이나 의미는 맞지만 패턴이 무작위인 방식(S-RAND)에 비해 일치성, 방해 요소, 선호도 측면에서 월등히 높은 사용자 경험 점수를 기록함. 이는 사운드의 의미를 정확히 분류하고 그에 맞는 햅틱 패턴을 제공하는 것이 몰입감 향상에 중요함을 시사함.
  • 기여점: 게임 프로그램과 독립적으로 작동하면서 실시간으로 사운드의 의미를 파악하여 전신 햅틱 피드백을 자동으로 생성하는 시스템을 개발함. 또한, 사용자 연구를 통해 의미론적 변환과 적절한 햅틱 패턴 디자인이 VR 게임 경험을 크게 향상시킬 수 있음을 실험적으로 증명함.

The Future of Software Testing: A Review of Trends, Challenges, and Opportunities

· 약 5분
Elavarasi Kesavan

논문 정보

  • 제목: The Future of Software Testing: A Review of Trends, Challenges, and Opportunities
  • 저자: Mrs. Elavarasi Kesavan (Full Stack QA Architect, Cognizant)
  • 학회/저널: International Journal of Innovations in Science Engineering and Management
  • 발행일: 2025-04-15
  • DOI: 10.69968/ijisem.2025v4i253-57
  • 주요 연구 내용: 본 논문은 AI, IoT, 클라우드, 애자일 등 최신 기술이 소프트웨어 테스팅 분야에 미치는 영향을 분석함. 문헌 연구를 통해 최신 테스팅 동향, 지속적인 과제, 그리고 새로운 기회들을 종합적으로 검토하고, 미래의 테스트 엔지니어가 갖추어야 할 역량을 조망함.
  • 주요 결과 및 결론: 소프트웨어 테스팅은 AI와 IoT 같은 신기술과 깊이 연관되어 빠르게 발전하고 있으며, 테스터에게는 코딩 능력과 새로운 도구 및 프레임워크에 대한 적응력이 요구됨. 애자일, 자동화, TCoE(Testing Centers of Excellence)가 QA Practice를 재편하고 있으나, 성능 테스트, 숨겨진 종속성, 품질 책임과 같은 과제는 여전히 남아있음.
  • 기여점: 소프트웨어 테스팅의 현재 상황과 미래 방향에 대한 포괄적인 개요를 제공함. 최신 동향, 고질적인 문제, 새로운 기회를 종합하여 미래의 테스트 엔지니어를 위한 지속적인 학습과 기술 개발의 필요성을 강조함.

Explainable Artificial Intelligence (XAI) for Material Design and Engineering Applications: A Quantitative Computational Framework

· 약 3분
Bokai Liu
Pengju Liu
Weizhuo Lu
Thomas Olofsson

논문 정보

  • 제목: Explainable Artificial Intelligence (XAI) for Material Design and Engineering Applications: A Quantitative Computational Framework
  • 저자: Bokai Liu (Umeå University), Pengju Liu (Umeå University), Weizhuo Lu (Umeå University), Thomas Olofsson (Umeå University)
  • 학회/저널: International Journal of Mechanical System Dynamics, Volume 5, Issue 2, pp. 236-265
  • 발행일: 2025-03-27
  • DOI: 10.1002/msd2.70017
  • 주요 연구 내용: 데이터 처리, 특징 선택, 모델 학습, 성능 평가, 설명가능성 분석, 클라우드 배포를 포함하는 체계적 ML-XAI 통합 파이프라인 제안
  • 주요 결과 및 결론: 고성능 콘크리트(HPC) 압축 강도 예측에서 XGBoost 모델이 R²=0.918로 최고 예측 성능을 달성하였으며, SHAP과 LIME을 통해 특징 중요도 및 재료 상호작용에 대한 상세한 해석 제공
  • 기여점: 재료 설계 및 엔지니어링 응용을 위한 정량적 XAI 계산 프레임워크를 제시하고, 클라우드 기반 API 배포까지 포함하는 완전한 워크플로우 구축