- 서울 공과대학 융합전자공학부 교수
사람목소리 구별하는 임베디드형 AI 스피커 '플루토' 최초 개발
- 2017년 11월 인터넷 연결 없이 목소리를 구별해 음성 인식하는 임베디드형 AI(인공지능) 스피커 ‘플루토’를 국내 최초 개발했다.
- 기존 국내 IT 기업들이 개발한 AI스피커는 음성인식을 위해 클라우드 서버에 연결해야하고 이 과정에서 네트워크 지연‧보안 문제가 있었다. 장 교수 팀은 이 문제를 해결하기 위해 20만 단어 수준의 대용량 음성인식시스템을 하드웨어시스템에 내장하는 임베디드 방식을 채택했다. 임베디드 시스템은 인터넷 연결이 어려운 다양한 환경에서 응용이 예상된다.
- 이번 개발의 핵심은 음성인식을 위해 해외 기술을 도입해 만든 기존 AI 스피커와 달리 플루토는 전(全)처리기술, 딥러닝기반 음향모델 및 언어모델기술 모두 자체적으로 개발했다는 점이다. 특히, 원거리 환경에서 원활한 음성인식을 위해 잡음을 제거하는 ‘빔포밍(beamforming)기술’과 등록된 사용자 목소리만 인식하고 TV등에서 나오는 목소리를 필터링하는 ‘화자인식기술’을 개발했는데, 현재 해당 원천기술들로 글로벌 IT기업과 산학협력을 통한 상용화 추진중이다.