장준혁
- 서울 공과대학 융합전자공학부 교수
임베디드형 AI 스피커 '플루토' 최초 개발
- 2017년 11월 인터넷 연결 없이 목소리를 구별해 음성 인식하는 임베디드형 AI(인공지능) 스피커 ‘플루토’를 국내 최초 개발했다.
- 기존 국내 IT 기업들이 개발한 AI스피커는 음성인식을 위해 클라우드 서버에 연결해야하고 이 과정에서 네트워크 지연‧보안 문제가 있었다. 장 교수 팀은 이 문제를 해결하기 위해 20만 단어 수준의 대용량 음성인식시스템을 하드웨어시스템에 내장하는 임베디드 방식을 채택했다. 임베디드 시스템은 인터넷 연결이 어려운 다양한 환경에서 응용이 예상된다.
- 이번 개발의 핵심은 음성인식을 위해 해외 기술을 도입해 만든 기존 AI 스피커와 달리 플루토는 전(全)처리기술, 딥러닝기반 음향모델 및 언어모델기술 모두 자체적으로 개발했다는 점이다. 특히, 원거리 환경에서 원활한 음성인식을 위해 잡음을 제거하는 ‘빔포밍(beamforming)기술’과 등록된 사용자 목소리만 인식하고 TV등에서 나오는 목소리를 필터링하는 ‘화자인식기술’을 개발했는데, 현재 해당 원천기술들로 글로벌 IT기업과 산학협력을 통한 상용화 추진중이다.
소리로 車 진단하는 AI 선보여
- 2018년 7월 장준혁 융합전자공학부 교수팀과 현대자동차가 세계 완성차업계 최초로 인공지능(AI)과 딥러닝을 이용해 소음으로 차량의 고장 여부를 판별하고 진단까지 내리는 기술을 공동 개발했다.
- 동아일보 7월 20일 자 기사에 따르면, 장 교수팀과 현대차는 가장 많이 쓰이는 ‘가솔린엔진’을 목표로 정하고 총 830개의 소리 샘플을 수집했다고 전했다. 수집된 소리를 부품과 고장 유형에 따라 18개 유형, 44개 세부유형으로 분류한 뒤 소리를 AI가 인식할 수 있도록 0.2초 단위로 짧게 잘라 ‘시간-주파수’ 기준으로 특징을 분석했다. 또, 수집된 소리(문제)와 그에 상응하는 고장 원인(답)을 AI에 반복 학습하는 방법으로 시스템을 구축했다. 예를 들어, 고장 난 자동차에서 사람은 알아차릴 수 없을 정도로 미세한 이상 소음이 나면 AI는 소리를 듣고 원인을 분석하고 축적된 빅 데이터로 원인을 판독한다. 사람이었다면 엔진을 뜯어보고 짧게는 몇 시간, 길게는 며칠 걸렸을 과정이지만 AI는 불과 수초 내 정확하게 원인을 파악하는 기술이다. 해당 기술은 이르면 내년 전국 현대차 수리센터에 적용할 예정이다.
- 현대차 연구개발본부 엔진NVH리서치랩 연구원들은 소음으로 차를 진단하는 아이디어를 떠올린 뒤 간단한 음향 샘플을 만들어 음성 및 소리 분야에서 국내 최고 권위자인 장준혁 교수를 찾아갔다고 전했다. 장 교수와 함께 논의한 결과 충분히 가능성이 있다고 판단해 공동 연구개발에 착수했다고 밝혔다.