[๋
ผ๋ฌธ ๋ฆฌ๋ทฐ] AudioGPT: Understanding and Generating Speech, Music, Sound, and Talking Head
Rongjie Huang, Mingze Li, Dongchao Yang, Jiatong Shi, Xuankai Chang, Zhenhui Ye, Yuning Wu, Zhiqing Hong, Jiawei Huang, Jinglin Liu, Yi Ren, Zhou Zhao, Shinji Watanabe 25 Apr 2023 Introduction LLM์ ํ
์คํธ ์ฒ๋ฆฌ ๋ฐ ์์ฑ ๋ถ์ผ์์ ์ฑ๊ณต์ ์ธ ์์ฉ์๋ ๋ถ๊ตฌํ๊ณ ์ค๋์ค ๋ชจ๋ฌ๋ฆฌํฐ(๋ดํ, ์์
, ์๋ฆฌ, ์ธํฐ๋ทฐ)์ ๋ํ ์ฑ๊ณต์ ์ ํ์ ์ด์ง๋ง, ๋ค์๊ณผ ๊ฐ์ ์ด์ ๋ก ๋งค์ฐ ์ ์ฉํ๋ค. ์ค์ ์ํฉ์์ ์ธ๊ฐ์ ์ผ์ ๋ํ๋ฅผ ํตํด ์์ฑ ์ธ์ด๋ฅผ ์ฌ์ฉํ์ฌ ์์ฌ ์ํตํ๊ณ , ํธ์์ฑ์ ๋์ด๊ธฐ ์ํด ์์ฑ ๋น์(e.g., Siri or Alexa)๋ฅผ ํ์ฉํ๋ค. ์ง๋ฅ์ ๊ณ ์ ํ ๋ถ๋ถ์ผ๋ก์, ์ค๋..