본문으로 건너뛰기

"Architecture" 태그로 연결된 3개 게시물개의 게시물이 있습니다.

모든 태그 보기

Mamba: Linear-Time Sequence Modeling with Selective State Spaces

· 약 6분
Albert Gu
Tri Dao

논문 정보

  • 제목: Mamba: Linear-Time Sequence Modeling with Selective State Spaces
  • 저자: Albert Gu (Carnegie Mellon University), Tri Dao (Princeton University)
  • 학회/저널: arXiv
  • 발행일: 2024-05-31
  • DOI: 10.48550/arXiv.2312.00752
  • 주요 연구 내용: 기존 상태 공간 모델(SSM)의 한계인 내용 기반 추론(content-based reasoning) 능력 부재를 해결하기 위해, 모델의 파라미터가 입력에 따라 동적으로 변하는 '선택 메커니즘'을 도입함. 이로 인해 비효율적으로 변하는 계산 문제를 해결하기 위해 GPU 메모리 계층 구조를 활용한 하드웨어 친화적인 병렬 스캔 알고리즘을 설계함.
  • 주요 결과 및 결론: Mamba는 시퀀스 길이에 대해 선형적으로 확장되며, Transformer 대비 5배 높은 추론 처리량을 보임. 언어, 음성, 유전체 등 다양한 모달리티에서 기존 SOTA 모델 및 Transformer의 성능을 능가했으며, 특히 언어 모델링에서는 동일 크기의 Transformer를 압도하고 2배 큰 모델과 대등한 성능을 달성함.
  • 기여점: 첫째, SSM에 입력 의존적인 선택 메커니즘을 도입하여 시퀀스 내 정보를 선택적으로 처리하는 능력을 부여함. 둘째, 이 선택적 SSM을 효율적으로 계산하기 위한 하드웨어 인식 병렬 알고리즘을 개발함. 셋째, 어텐션과 MLP 블록 없이 선택적 SSM을 통합한 단순하고 효율적인 Mamba 아키텍처를 제안함.

An Expressiveness Hierarchy of Behavior Trees and Related Architectures

· 약 3분
Oliver Biggar
Mohammad Zamani
Iman Shames

논문 정보

  • 제목: An Expressiveness Hierarchy of Behavior Trees and Related Architectures
  • 저자: Oliver Biggar (University of Melbourne), Mohammad Zamani (University of Melbourne), Iman Shames (University of Melbourne)
  • 학회/저널: IEEE Robotics and Automation Letters (RA-L), Volume 6, Issue 3, pp. 5397-5404
  • 발행일: 2021-04-16
  • DOI: 10.1109/LRA.2021.3074337
  • 주요 연구 내용: BT, Decision Tree(DT), Teleo-reactive Program(TR), Finite State Machine(FSM) 간의 표현력(expressiveness)을 형식적으로 비교하는 계층 구조 수립
  • 주요 결과 및 결론: 보조 변수 유무에 따른 BT의 표현력 차이를 규명하고, 가독성-표현력 트레이드오프의 존재를 증명
  • 기여점: "BT가 FSM보다 나은가?"라는 실용적 질문에 이론적 답변을 제공하고, BT 설계 시 아키텍처 선택의 이론적 근거를 마련

An Architecture for Autonomy

· 약 3분
R. Peter Bonasso
R. James Firby
Erann Gat
David Kortenkamp
David P. Miller
Marc G. Slack

논문 정보

  • 제목: Experiences with an Architecture for Intelligent, Reactive Agents (An Architecture for Autonomy)
  • 저자: R. Peter Bonasso (Metrica Inc./NASA JSC), R. James Firby (University of Chicago), Erann Gat (Jet Propulsion Laboratory), David Kortenkamp (Metrica Inc./NASA JSC), David P. Miller, Marc G. Slack
  • 학회/저널: Journal of Experimental and Theoretical Artificial Intelligence (JETAI), Vol. 9, No. 1, pp. 237-256
  • 발행일: 1997
  • DOI: 10.1080/095281397147103
  • 주요 연구 내용: 반응적 제어, 시퀀싱, 심의적 계획을 분리된 계층으로 구성하는 3계층(3T) 로봇 아키텍처의 설계와 다수의 실제 로봇 시스템에 적용한 경험 정리
  • 주요 결과 및 결론: 8년간 개발된 3T 아키텍처가 6종 이상의 서로 다른 로봇 시스템에서 성공적으로 동작함을 검증
  • 기여점: 현대 자율 로봇 아키텍처의 초석이 된 3계층 구조를 형식화하고, 실용적인 소프트웨어 도구를 제공하며, BT·FSM 등 후속 제어 패러다임에 직접적 영향을 미침