Growth Log/Word.Tree (1) 썸네일형 리스트형 로그-멜 스펙트로그램(Log-Mel Spectrogram) 로그-멜 스펙트로그램은 한마디로 사람의 청각 특성을 반영하여 음성 데이터를 시각적으로 표현한 이미지라고 할 수 있습니다. 컴퓨터가 음성을 더 잘 이해하도록 가공한 데이터 형태이죠. 이를 이해하기 위해 '스펙트로그램', '멜 스케일', '로그 스케일' 세 가지로 나누어 살펴보겠습니다.1. 스펙트로그램 (Spectrogram)음성은 시간에 따라 계속 변하는 복잡한 파동입니다. 이 파동을 그대로 분석하기는 어렵기 때문에, 컴퓨터는 '푸리에 변환(Fourier Transform)'이라는 수학적 도구를 사용해 음성을 여러 주파수(음의 높낮이) 성분으로 분해합니다.스펙트로그램은 이 분해된 결과를 시각화한 것입니다. 가로축은 시간의 흐름을 나타냅니다.세로축은 주파수(Hz)를 나타냅니다. (아래쪽이 저주파, 위쪽이 고.. 이전 1 다음