구글이 모바일 음성인식 기술을 활용한 새로운 서비스를 내놓았다. ‘말로 쓰는 모바일 서비스’다.

‘말로 쓰는 모바일 서비스’는 스마트폰의 좁은 화면과 작은 키보드로 인한 불편함을 보완한 서비스다. 이름대로 텍스트로 쓰던 e메일이나 문자메시지를 음성으로 대체하는 기능이다.

이 서비스는 구글이 6월 내놓은 ‘모바일 음성검색’ 기술을 확장했다. 모바일 음성검색은 검색창에 질의어를 텍스트로 넣는 대신 음성으로 입력하면 이를 자동으로 텍스트로 변환해 검색 결과로 보여주는 서비스다. 이번 말로 쓰는 모바일 서비스는 검색어 입력 뿐 아니라 G메일이나 구글 토크 등에서 e메일 내용이나 대화, 문자메시지 등을 음성으로 입력하면 자동으로 텍스트로 변환해주는 방식이다.

이 서비스는 특히 영어에 이어 두 번째로 한국어 서비스를 선택했다는 점에서도 눈길을 끈다. 마이크 슈스터 구글 음성검색 총괄 연구원은 “지난 6월 모바일 음성검색 서비스를 출시한 이후 한국어 음성검색 정확성이나 한국 누리꾼 수용 면에서 성공적이었다고 판단해 말로 쓰는 모바일 서비스도 한국어를 먼저 선택하게 됐다”고 배경을 설명했다.

모바일 음성검색은 대개 2~3개 단어 조합으로 검색어를 입력하지만, e메일이나 문자메시지 내용을 입력할 경우 훨씬 많은 단어나 긴 문장 형태가 되기 십상이다. 단어 배열수도 많아질 뿐더러, 오류 발생 확률도 상대적으로 높다.

그래서 구글은 언어 모델을 다듬는 데 적잖이 공을 들인 모양새다. 마이크 슈스터 연구원은 “구어체 한국어 수백만 문장과 표현을 학습시키고 여러 검색어나 블로그 표현들, 뉴스 기사들을 참고해 다양한 표현과 문장 배열을 훈련시켰다”고 개발 과정의 어려움을 밝혔다.

말로 쓰는 구글 모바일 서비스는 1만개 이상의 한글 유니코드 캐릭터를 인식한다. 한국인들이 자주 쓰는 영어식 표현이나 숫자, 영어·한글 조합어나 약자도 인식하도록 시스템 학습 과정을 거쳤다고 한다. 남녀노소에 관계 없이 음성을 인식하도록 하는 데도 신경을 썼다.

마이크 슈스터 연구원은 “시끄러운 콘서트장이나 좁은 교회처럼 잡음이 심한 곳에선 아직 인식률이 떨어지는 게 사실이지만, 일반 가정에서 TV나 음악을 틀어놓은 상태에서 이용하는 데는 문제 없는 수준까지 서비스를 끌어올렸다”라며 “앞으로 꾸준히 성능을 판올림해 어떤 모바일 기기에서든 음성이 유용한 입력 수단으로 쓰이도록 하는 것이 목표”라고 밝혔다.

구글은 음성을 텍스트로 변환해주는 서비스 외에도 음성을 실시간 다른 언어로 통역해주는 보이스 번역 기능과 음성으로 각종 명령을 제어할 수 있는 보이스 액션 기능도 곧 선보일 예정이다.

말로 쓰는 구글 모바일 서비스는 안드로이드2.2가 탑재된 스마트폰에서 이용할 수 있다. 현재로선 아이폰이나 다른 운영체제용으로는 서비스를 제공할 계획이 없다.

마이크 슈스터 연구원은 “현재로선 애플에서 제공하는 키보드에 대한 접근권을 구글이 갖고 있지 않기 때문에 아이폰에서 서비스하는 건 불가능하다”라면서도 “말로 쓰는 구글 모바일 서비스를 특정 폰에서만 제공할 생각은 없으며, 이 서비스를 원하는 기업이나 이용자가 있다면 어느 정도 비용을 매기거나 다른 계약 조건으로 인터페이스를 제공하는 걸 이미 시도하고 있다”고 밝혔다.

Comments

  1. 음성 검색이 생각보다 너무 인식률이 좋아서 자주 애용하고있는데 sms라.. 기대되네요..

  2. 음성인식용 모바일 기능을 사용하려면 가능 기능이 내장된 단말기를 별도로 구해야 되잖아요? 기존 모바일의 녹음 기능을 잘 활용하여 음성인식 기능이 활성화 될 수 있게 할 수 있는 기술을 혹시 개발 중에 있는지요? “웹브라우저 오페라” 기사와 더불어 매우 재미있게 보고 갑니다. 감사!

답글 남기기

이메일은 공개되지 않습니다. 필수 입력창은 * 로 표시되어 있습니다.