Blog | 99JIK

XGBoost: A Scalable Tree Boosting System

2016년 8월 13일 · 약 6분

Tianqi Chen

Carlos Guestrin

논문 정보

제목: XGBoost: A Scalable Tree Boosting System
저자: Tianqi Chen (University of Washington), Carlos Guestrin (University of Washington)
학회/저널: KDD '16 (The 22nd ACM SIGKDD International Conference on Knowledge Discovery and Data Mining)
발행일: 2016-08-13
DOI: 10.1145/2939672.2939785
주요 연구 내용: 본 논문은 확장 가능한 엔드투엔드 트리 부스팅 시스템인 XGBoost를 제안함. 희소 데이터를 효율적으로 처리하기 위한 새로운 희소성 인지 알고리즘(sparsity-aware algorithm)과 근사 트리 학습을 위한 가중치 분위 스케치(weighted quantile sketch)를 도입함. 또한, 캐시 접근 패턴, 데이터 압축, 샤딩(sharding)과 같은 시스템 최적화를 통해 확장성을 극대화함.
주요 결과 및 결론: XGBoost는 단일 머신에서 기존 솔루션보다 10배 이상 빠른 성능을 보이며, 분산 및 메모리 제한 환경에서도 수십억 개의 대용량 데이터를 훨씬 적은 리소스로 처리할 수 있음. 이러한 알고리즘과 시스템 최적화의 결합을 통해 실제 대규모 문제를 해결하는 강력한 솔루션 제공.
기여점: 고도로 확장 가능한 엔드투엔드 트리 부스팅 시스템을 설계 및 구축함. 병렬 트리 학습을 위한 새로운 희소성 인지 알고리즘과 효율적인 제안 계산을 위한 이론적으로 정당화된 가중치 분위 스케치를 제안함. 또한, 메모리 외부(out-of-core) 트리 학습을 위한 효과적인 캐시 인식 블록 구조를 도입하여 시스템 효율성을 높임.

MUST-CNN: A Multilayer Shift-and-Stitch Deep Convolutional Architecture for Sequence-Based Protein Structure Prediction

2016년 2월 12일 · 약 5분

Zeming Lin

Jack Lanchantin

Yanjun Qi

논문 정보

제목: MUST-CNN: A Multilayer Shift-and-Stitch Deep Convolutional Architecture for Sequence-Based Protein Structure Prediction
저자: Zeming Lin, Jack Lanchantin, Yanjun Qi (University of Virginia)
학회/저널: Thirtieth AAAI Conference on Artificial Intelligence (AAAI-16)
발행일: 2016-02-12
DOI: 해당 없음
주요 연구 내용: 단백질의 아미노산 서열로부터 2차 구조나 용매 접근성 같은 속성을 예측하기 위해 딥 컨볼루션 신경망(CNN)을 활용. Max-pooling으로 인한 해상도 저하 문제를 해결하기 위해, 다중 계층에 'shift-and-stitch' 기법을 적용하여 전체 서열에 대한 완전 밀집(fully dense) 예측을 효율적으로 생성하는 종단간(end-to-end) 모델 MUST-CNN을 제안함.
주요 결과 및 결론: 제안된 MUST-CNN 모델은 기존의 최첨단 모델들보다 구조적으로 더 단순함에도 불구하고, 4prot 및 CullPDB라는 두 개의 대규모 단백질 속성 예측 데이터셋에서 더 우수한 성능을 달성함. 특히 4prot 데이터셋에서 3클래스 2차 구조 예측(ssp) 정확도( $Q_3$ ) 89.6%를 기록했으며, CullPDB 데이터셋에서는 8클래스 예측( $Q_8$ ) 정확도 68.4%를 달성하여 기존 최고 성능을 경신함.
기여점: 딥 CNN에 적용 가능한 새로운 'multilayer shift-and-stitch' (MUST) 기법을 제안하여 학습 및 추론 시간을 크게 단축시키고 모델의 규모를 확장함. 또한, 임의 길이의 서열에 대해 각 위치별(per-position) 레이블링을 수행하는 일반적인 종단간 시스템을 제안했으며, 이를 통해 두 개의 대규모 단백질 데이터셋에서 최첨단 성능을 달성함.

Mastering the game of Go with deep neural networks and tree search

2016년 1월 28일 · 약 6분

David Silver

Aja Huang

Chris J. Maddison

Arthur Guez

Laurent Sifre

George van den Driessche

Thore Graepel

논문 정보

제목: Mastering the game of Go with deep neural networks and tree search
저자: David Silver 외 (Google DeepMind)
학회/저널: Nature
발행일: 2016-01-28
DOI: 10.1038/nature16961
주요 연구 내용: 바둑판의 국면을 평가하는 가치망(value network)과 다음 수를 선택하는 정책망(policy network)이라는 두 개의 심층 신경망을 몬테카를로 트리 탐색(MCTS)과 결합한 새로운 접근법을 제안함. 신경망은 인간 전문가의 기보를 이용한 지도 학습과 알파고 자체 대국을 통한 강화 학습의 조합으로 훈련됨.
주요 결과 및 결론: 개발된 프로그램 알파고(AlphaGo)는 다른 주요 바둑 프로그램들을 상대로 99.8%의 압도적인 승률을 기록했으며, 당시 유럽 챔피언이었던 판후이 프로 2단을 5대 0으로 이김. 이는 컴퓨터 프로그램이 정식 크기의 바둑판에서 인간 프로 기사를 상대로 거둔 최초의 승리임.
기여점: 인간 전문가의 기보를 활용한 지도 학습과 자체 대국 기반의 강화 학습을 결합한 혁신적인 신경망 훈련 파이프라인을 구축함. 심층 신경망을 통해 바둑의 복잡한 국면 평가와 수 선택 문제를 해결하고, 이를 효율적으로 몬테카를로 트리 탐색과 통합하여 인간 최고 수준의 기력을 달성함.

Deep Residual Learning for Image Recognition

2015년 12월 10일 · 약 5분

Kaiming He

Xiangyu Zhang

Shaoqing Ren

Jian Sun

논문 정보

제목: Deep Residual Learning for Image Recognition
저자: Kaiming He, Xiangyu Zhang, Shaoqing Ren, Jian Sun (Microsoft Research)
학회/저널: arXiv (ILSVRC 2015 우승)
발행일: 2015-12-10
DOI: arxiv.org/abs/1512.03385
주요 연구 내용: 네트워크가 깊어질수록 정확도가 떨어지는 'degradation' 문제를 해결하기 위해 잔차 학습(residual learning) 프레임워크를 제안함. 네트워크가 목표 함수를 직접 학습하는 대신, 입력에 대한 잔차 함수(residual function)를 학습하도록 shortcut connection을 도입하여 매우 깊은 네트워크의 최적화를 용이하게 함.
주요 결과 및 결론: ImageNet 데이터셋에서 최대 152개 레이어의 매우 깊은 잔차 네트워크(ResNet)를 성공적으로 훈련시켰으며, 이는 VGGNet보다 8배 깊지만 복잡도는 더 낮음. ResNet 앙상블 모델은 ImageNet test set에서 3.57%의 top-5 error를 달성하여 ILSVRC 2015 분류 과제에서 1위를 차지함.
기여점: 심층 신경망의 'degradation' 문제를 해결하는 잔차 학습 프레임워크(ResNet)를 제안함. 이전보다 훨씬 깊은 네트워크(152-layer)의 훈련을 가능하게 하여 이미지 인식 분야에서 SOTA(State-of-the-art) 성능을 달성함. 잔차 학습의 효과를 ImageNet 및 CIFAR-10 데이터셋에서 실험적으로 증명하고, COCO 데이터셋을 사용한 객체 탐지에서도 우수성을 입증함.

A Neural Algorithm of Artistic Style

2015년 9월 2일 · 약 4분

Leon Gatys

Alexander S. Ecker

Matthias Bethge

논문 정보

제목: A Neural Algorithm of Artistic Style
저자: Leon A. Gatys, Alexander S. Ecker, Matthias Bethge (University of Tübingen 등)
학회/저널: arXiv preprint
발행일: 2015-09-02
DOI: 10.48550/arXiv.1508.06576
주요 연구 내용: 사전 훈련된 VGG-19 네트워크를 사용하여 이미지의 콘텐츠(Content)와 스타일(Style) 표현을 분리하는 방법을 제안함. 콘텐츠는 네트워크의 상위 계층 피처 맵으로 정의하고, 스타일은 여러 계층에 걸친 피처 맵 간의 상관관계(Gram 행렬)로 정의하여 두 표현을 독립적으로 제어함.
주요 결과 및 결론: 사진의 콘텐츠와 명화의 스타일을 성공적으로 결합하여 높은 지각적 품질의 새로운 예술 이미지를 생성함. 이를 통해 CNN에서 콘텐츠와 스타일 표현이 분리 가능하다는 것을 입증했으며, 이는 인간의 예술 창작 및 인식 과정을 알고리즘적으로 이해하는 경로를 제시함.
기여점: 최초로 자연 이미지에서 콘텐츠와 스타일을 분리하는 이미지 피처를 시연함. 예술적 이미지 생성을 위한 신경망 알고리즘을 제공했으며, 예술 및 스타일에 대한 신경과학적 연구를 위한 새로운 도구를 제시함.

Combining some Biased Estimation Methods with Least Trimmed Squares Regression and its Application

2015년 7월 1일 · 약 5분

Betül Kan-Kılınç

Ozlem Alpu

논문 정보

제목: Combining some Biased Estimation Methods with Least Trimmed Squares Regression and its Application
저자: Betül Kan-Kılınç (Anadolu University), Ozlem Alpu (Eskisehir Osmangazi University)
학회/저널: Revista Colombiana de Estadística
발행일: 2015-07-01
DOI: 10.15446/rce.v38n2.51675
주요 연구 내용: 회귀분석에서 다중공선성(multicollinearity)과 이상치(outlier) 문제가 동시에 발생할 때, 기존의 최소자승법(OLS)은 신뢰할 수 없는 결과를 낳는다. 이 연구는 이 두 문제를 동시에 해결하기 위해 강건 회귀(robust regression) 방법인 LTS(Least Trimmed Squares)와 다중공선성 해결을 위한 편향 추정(biased estimation) 방법인 Ridge 및 Liu 회귀를 결합하는 접근법을 제안한다. 또한, 이러한 강건 편향 추정법을 쉽게 적용하고 비교할 수 있는 R 패키지 ltsbase를 개발하여 소개한다.
주요 결과 및 결론: 이상치를 포함하는 두 개의 실제 데이터셋(hbk, toxicity)을 대상으로 제안된 방법을 실험한 결과, LTS 기반의 Liu 추정법(LTS-Liu)이 OLS, Ridge, Liu, LTS-Ridge 등 다른 방법들보다 일관되게 가장 낮은 평균 제곱 오차(MSE)를 기록했다. 이는 다중공선성과 이상치가 공존하는 데이터에서 제안된 강건 편향 추정법이 매우 효과적임을 입증하며, 개발된 ltsbase 패키지가 실용적인 분석 도구로서의 가치가 있음을 보여준다.
기여점: 다중공선성과 이상치 문제를 동시에 다루는 강건 편향 추정법(LTS-Ridge, LTS-Liu)의 효과성을 실증적으로 검증했다. 이 방법론을 사용자가 편리하게 이용할 수 있도록 R 패키지 ltsbase를 개발하고 그 기능을 상세히 소개하여 관련 연구 및 분석의 접근성을 높였다.

Cross-dataset learning and person-specific normalisation for automatic Action Unit detection

2015년 1월 1일 · 약 3분

Tadas Baltrušaitis

Marwa Mahmoud

Peter Robinson

논문 정보

제목: Cross-dataset learning and person-specific normalisation for automatic Action Unit detection
저자: Tadas Baltrušaitis (University of Cambridge), Marwa Mahmoud (University of Cambridge), Peter Robinson (University of Cambridge)
학회/저널: 2015 11th IEEE International Conference and Workshops on Automatic Face and Gesture Recognition (FG 2015), Ljubljana, Slovenia
발행일: 2015-05-04
DOI: 10.1109/FG.2015.7284869
주요 연구 내용: 외형 특징(HOG)과 기하학적 특징(형상 파라미터, 랜드마크 위치)을 결합한 실시간 얼굴 행동 단위(AU) 강도 추정 및 발생 감지 시스템 개발
주요 결과 및 결론: FERA 2015 베이스라인 대비 AU 발생 감지, 완전 자동 AU 강도, 사전 분할 AU 강도 추정의 세 가지 과제 모두에서 우수한 성능 달성
기여점: 교차 데이터셋 학습을 통한 일반화 성능 향상 및 중위값 기반 개인별 정규화 기법 제안

Generative Adversarial Nets

2014년 6월 10일 · 약 5분

Ian J. Goodfellow

Jean Pouget-Abadie

Mehdi Mirza

Bing Xu

David Warde-Farley

Sherjil Ozair

Aaron Courville

Yoshua Bengio

논문 정보

제목: Generative Adversarial Nets
저자: Ian J. Goodfellow, Jean Pouget-Abadie, Mehdi Mirza, Bing Xu, David Warde-Farley, Sherjil Ozair, Aaron Courville, Yoshua Bengio (Université de Montréal)
학회/저널: arXiv preprint
발행일: 2014-06-10
DOI: Not available in the provided text
주요 연구 내용: 생성 모델(Generator, G)과 판별 모델(Discriminator, D)을 동시에 학습시키는 적대적 과정(adversarial process) 프레임워크를 제안함. 생성자는 실제 데이터와 유사한 데이터를 생성하도록 학습하고, 판별자는 주어진 데이터가 실제인지 생성된 것인지 구별하도록 학습하며, 두 모델은 서로 경쟁하며 성능을 향상시킴.
주요 결과 및 결론: 제안된 프레임워크는 이론적으로 생성자가 실제 데이터 분포를 완벽하게 복제( $p_g = p_{data}$ )할 때 유일한 해가 존재함을 증명함. MNIST, TFD, CIFAR-10 데이터셋에 대한 실험을 통해 생성된 샘플의 질적, 양적 평가를 수행하여 프레임워크의 잠재력을 입증함.
기여점: 기존 생성 모델들의 주요 난관이었던 다루기 힘든 확률 계산(intractable probabilistic computations) 문제를 회피함. 역전파(backpropagation)만으로 전체 시스템을 학습할 수 있으며, 학습이나 샘플 생성 과정에서 마르코프 연쇄(Markov chains)가 필요 없는 새로운 생성 모델 학습 패러다임을 제시함.

Towards a unified behavior trees framework for robot control

2014년 6월 1일 · 약 3분

Alejandro Marzinotto

Michele Colledanchise

Christian Smith

Petter Ögren

논문 정보

제목: Towards a unified behavior trees framework for robot control
저자: Alejandro Marzinotto (KTH CVAP), Michele Colledanchise (KTH CVAP), Christian Smith (KTH CVAP), Petter Ögren (KTH CVAP)
학회/저널: 2014 IEEE International Conference on Robotics and Automation (ICRA)
발행일: 2014-06-01
DOI: 10.1109/ICRA.2014.6907656
주요 연구 내용: Behavior Tree(BT)의 기존 문헌에서 일관성과 수학적 엄밀성이 부족한 문제를 해결하기 위해, 통합 BT 프레임워크를 제안하고 Controlled Hybrid Dynamical Systems(CHDS)와의 동치 관계를 정립
주요 결과 및 결론: 통합 프레임워크를 통해 BT의 표현력을 명확히 하고, NAO 로봇을 활용한 파지(grasping) 미션으로 프레임워크의 실용성을 검증
기여점: 로봇 제어에서 BT의 표준화된 정의와 형식적 분석 기반을 최초로 제공하여, BT의 이식성과 상호운용성 향상에 기여

Img2UML: A System for Extracting UML Models from Images

2013년 1월 1일 · 약 4분

Bilal Karasneh

Michel R.V. Chaudron

논문 정보

제목: Img2UML: A System for Extracting UML Models from Images
저자: Bilal Karasneh (Leiden University), Michel R.V. Chaudron (Chalmers and Gothenburg University)
학회/저널: 2013 39th Euromicro Conference Series on Software Engineering and Advanced Applications (SEAA)
발행일: 2013
DOI: 10.1109/SEAA.2013.45
주요 연구 내용: JPG, PNG 등 이미지 파일로만 존재하는 UML 클래스 다이어그램을 자동으로 인식하고 분석하는 Img2UML 시스템을 제안함. 이 시스템은 이미지 처리, OCR, 관계 탐지 기술을 사용해 다이어그램의 픽셀 정보를 엔지니어링 모델 정보로 변환함.
주요 결과 및 결론: 제안된 시스템은 200개의 이미지로 검증한 결과, 클래스 인식 95%, 텍스트 인식 92%, 관계 인식 80%의 정확도를 달성함. 이 시스템은 이미지화된 UML 모델을 StarUML과 호환되는 XMI 파일로 복원하여 문서 업데이트 및 학술 연구에 기여함.
기여점: 기존에 불가능했던 픽셀 기반의 UML 다이어그램 이미지로부터 편집 가능한 엔지니어링 모델(XMI)을 추출하는 리버스 엔지니어링 도구를 개발함. 또한, 추출된 모델들을 저장하는 리포지토리를 구축하여 향후 UML 모델 코퍼스 연구의 기반을 마련함.

논문 정보​

논문 정보​

논문 정보​

논문 정보​

논문 정보​

논문 정보​

논문 정보​

논문 정보​

논문 정보​

논문 정보​

논문 정보

논문 정보

논문 정보

논문 정보

논문 정보

논문 정보

논문 정보

논문 정보

논문 정보

논문 정보