본문 바로가기
컴퓨터&전자제품

인공지능스피커 또는 AI스피커는 음성인식스피커 수준에 가까워

by 핑구야 날자 2017. 12. 6.
반응형

인공지능 스피커 또는 AI스피커라고 하면서 제품들이 쏟아지고 있는데요. 인공지능 스피커 본연의 기능보다는 디자인과 콘텐츠 연동에 중점을 두고 서비스를 제공하는 것 같아요. 몇 년 전 부터 음성인식을 통해 문자입력을 이용하고 있습니다. 이유는 타이핑이 느리기도 하고 긴 문장을 입력하는 것 보다는 차라리 음성인식을 이용하는 게 더 편하고 효율적이었기 때문입니다. 처음에는 로봇처럼 말을 했지만 이젠 대화하듯이 음성인식을 이용하고 있어요. 음성인식율이 어떠냐구요. 만족스럽습니다. 다만 상황에 따라 다른 것은 여전히 개선해야 할 부분입니다.



음성인식기술과 인공지능기술은 다르다


인공지능 스피커라고 말하는 일부 제품은 약속된 말을 통해 작동하는 음성인식 스피커라고 부르는게 맞습니다. 마치 음성인식 스피커가 무슨 말을 하려고 하는지 알아 듣는 것 처럼 생각하게 만들어 소비자들이 혼동하게 만들고 있죠.




인기있는 노래 틀어줘 라고 명령하는 것은 인기있는 노래라는 키워드를 인식해 음원차트에서 순위 안에 있는 음악을 들려주는 것에 불과하죠. 이러한 기본적인 수행에 클래식, 영화음악과 같은 키워드를 더 추가해도 음원 카테고리에서 찾는 것은 어려운 일이 아니겠죠.



그 밖에 감성적인 명령어 예를 들면 기분좋은 음악, 슬픈 음악 등등도 음원을 감성 카테고리로 구분만 하면 되는 것이죠.



그리고 ~라고 메세지 보내줘, ~에게전화해줘, 재미있는 영화를 소개해줘 등등의 음성명령도 같은 원리입니다. 이런 기능은 인공지능이 아니라 단순 음성인식에 의해 수행되는 기능입니다. 요즘에는 인공지능 스피커라는 말을 공식적 사용을 자제하는 것 같아요.



음성인식율에 영향을 주는 것


음성인식을 사용하기 위해서는 네트워크 상태가 적정 수준으로 유지가 되어야 하는데요. 보통 인터넷이 연결되면 사용하는데는 문제가 없습니다. 다만 스마트폰이나 무선공유기의 통신상태가 불안정 한 경우는 원할하지 않을 수 있어요.


야외에서 음성인식 스피커를 사용하기 위해서는 스마트폰과 핫스팟을 통해 네트워크를 연동하거나 주변에 무선공유기와 연동해야 합니다.


그리고 주변의 소음의 정도에 따라서 음성인식율이 떨어져 엉뚱한 음성으로 받아드려 제대로 인식하지 못할 경우도 있습니다.


결국 음성인식 스피커의 주변의 소음 정도에 영향을 많이 받게 됩니다. 결국 야외에서 사용할 때는 네트워크 연결 상태와 소음 때문에 사용이 제한적일 수 밖에 없습니다.


음성인식율을 높이며 인공지능으로


음성인식을 통한 인공지능기술을 경험할 수 있는 서비스는 구글의 어시스턴트, 애플의 시리 그리고 마이크로소프트의 코타나 등등 입니다.



이들 기술은 음성인식 전용 머신러닝 시스템을 통해 많은 양의 데이터를 수집하고 있습니다. 또한 이를 통해 패턴을 찾아 자연어를 알아 듣고 어떤 말을 하는지 정확하게 예측하는 알고리즘을 경험할 수 있습니다.



음성인식율을 높이는 것이 관건인데요. 사용자마다 말하는 게 다르기 때문에 수 많은 데이터를 분석해 패턴 분석을 통한 음성인식은 결국 머신러닝 기간에 따라 수집한 데이터에 따라 차이가 날 수 밖에 없습니다. 현재는 구글의 어시스턴트와의 다른 업체들의 머신러닝 기간을 상당한 차이를 갖고 있습니다.



현재 인공지능 스피커 또는 AI스피커라고 말하는 일부 음성인식 스피커는 머신러닝을 적용해야 진정한 인공지능 스피커라고 할 수 있는 것입니다.


다음은 주변 소음을 얼마나 제거해 주느냐 입니다. 주변의 소음 정도에 따라 음성인식율의 차이가 많이 나거든요. 그래서  소니의 무선이어폰의 노이즈캔슬링 기술과 같은 노이즈제거 기술이 관건입니다. 인공지능 스피커와 스마트폰 등에 이러한 노이즈 제거 기술은 상당히 중요하다고 하겠습니다.



마지막으로 안정적인 네트워크 상태 유지입니다. 같은 위치에서 WiFi 상태가 안좋을 때가 있어요. 그러면 음성인식 앱 자체가 구동이 끊겨 사용하는데 여간 불편한게 아니랍니다. 차량으로 이동 중에도 마찬가지죠.



결국 제대로 음성인식이 되기에는 이렇게 노이즈 제거, 안정적인 네트워크 상태 유지가 되어야 음성인식율이 높아지게 됩니다. 더 나아가 머신러닝까지 제대로 적용한다면 음성인식율이 높은 인공지능 스피커가 되겠죠.

[관련글]

구글 블루투스 이어폰 픽셀버드(Pixel Buds)!! 실시간 번역기능 탑재 놀라워

인공지능 스피커 구글 홈 미니와 홈 맥스 무슨 차이가 있을까? 애플의 홈팟과 대결 구도 볼만하네!!

LG G7 출시일과 예상스펙 보다는 인공지능 스마트폰으로 터닝포인트 여부가 기대돼


반응형

댓글