본문 바로가기

논문 리뷰

(1)

[논문 리뷰] AudioGPT: Understanding and Generating Speech, Music, Sound, and Talking Head Rongjie Huang, Mingze Li, Dongchao Yang, Jiatong Shi, Xuankai Chang, Zhenhui Ye, Yuning Wu, Zhiqing Hong, Jiawei Huang, Jinglin Liu, Yi Ren, Zhou Zhao, Shinji Watanabe 25 Apr 2023 Introduction LLM의 텍스트 처리 및 생성 분야에서 성공적인 응용에도 불구하고 오디오 모달리티(담화, 음악, 소리, 인터뷰)에 대한 성공은 제한적이지만, 다음과 같은 이유로 매우 유용하다. 실제 상황에서 인간은 일상 대화를 통해 음성 언어를 사용하여 의사 소통하고, 편의성을 높이기 위해 음성 비서(e.g., Siri or Alexa)를 활용한다. 지능의 고유한 부분으로서, 오디..

이전 1 다음

티스토리툴바