▲ 타임케틀 테크놀로지(Timekettle Technologies) 에어팟과 비슷하게 생긴 두 개의 큰 이어폰으로 구성된 번역기를 개발했다. 사용자는 36개 언어와 84개 억양 중 두 가지로 대화를 할 수 있다.    출처= Timekettle Technologies

[이코노믹리뷰=홍석윤 기자] 이제 회화책이나 구글 번역기는 잊으시라. 새로운 번역기들이 공상과학소설 <은하수를 여행하는 히치하이커를 위한 안내서>(The Hitchhiker's Guide To The Galaxy)에서 사람의 귀 속에 들어가 앉아 어떤 외계어도 자동으로 번역해주는 물고기 바벨 피쉬(Babel fish)의 환상을 재현하는데 점점 더 가까워지고 있다.

타임케틀 테크놀로지(Timekettle Technologies)의 WT2 Plus AI 번역기(WT2 Plus Ear to Ear AI Translator Earbuds)는 이미 출시되었고, 웨이버리 랩(Wavery Labs)의 앰배서더(Ambassador)도 출시 준비를 마쳤다. 두 브랜드 모두 무선이며, 와이파이나 셀룰러 데이터에 연결된 하나의 스마트폰에 동기화되어야 두 개의 이어폰이 함께 제공된다.

머신러닝 및 자연어 처리 전문기인 카네기멜론대학교(Carnegie Mellon University) 어학기술원의 그레이엄 노이빅 교수는 "이 기기들이 다른 언어를 구사하는 사람들이 살고 있는 세상을 여행하며 그들과 원활하게 의사 소통하게 해 줄 것"이라고 말했다.

귀에 꽂거나, 손에 들고 하거나, 아니면 앱에서 연동되거나 하는 이 기술은, 신경망 기술이 실용화되기 시작한 2016년에 첫 선을 보이기 시작했는데, 대개 3단계 과정을 거쳐 음성 대 음성 변환 능력을 수행한다. 1단계는 자동 음성 인식 소프트웨어가 말을 문자로 변환한다. 2단계는 신경망 기계번역 기술을 사용해 이 문자를 다른 언어의 문자로 변환되며, 마지막 3단계에서 문자 음성 변조기가 변환된 다른 언어의 문자를 음성으로 표현한다.

더글러스 애덤스의 코미디 공상 과학 소설에 나오는 바벨 피시는 즉석에서 외계어를 번역하지만, 신경망 기술에서는 그 전환 과정에서 약간의 시간이 걸린다. 그럼에도 불구하고, 이 새로운 기기들은 번역이 이루어지고 있는 동안에도 말을 계속할 수 있게 해주며, 대화가 보다 자연스럽게 흐를 수 있도록 돕는다.

노이빅 교수는 "신경망 기술의 기능은 매우 놀랍고 중요한 의미를 갖는다”고 말한다.

“동시 번역 능력이 되지 않아 한 사람이 말하고 시스템이 번역하고 또 상대방이 말하고 시스템이 번역하는 식이라면 대화 시간이 두 배로 길어지겠지요.”

▲ WT2 Plus(왼쪽)는 말하는 사람이 번갈아 가며 교대로 말해야 하지만, 그 대화를 동시에 번역한다. 조만간 영어, 중국어, 일본어, 한국어, 러시아어를 오프라인 상태에서 번역할 수 있게 될 것이다.  포도주 색상의 번역기 앰배서더(오른쪽). 앰배서더와 WT2 모두 무선이며, 두 개의 이어폰이 와이파이나 셀룰러 데이터에 연결된 하나의 스마트폰에 동기화되어야 한다.    출처= Timekettle Technologies/Waverly Labs Inc.

WT2 Plus는 에어팟과 비슷하게 생긴 두 개의 큰 이어폰으로 구성되어 있으며, 사용자는 36개 언어와 84개 억양 중 두 가지로 대화할 수 있다. 또 동시 모드(Simul Mode), 터치 모드, 스피커 모드 등 세 가지 모드를 사용해 주변 소음을 제거할 수도 있고, 상대방에게 이어폰을 착용하게 하거나 전화기의 마이크나 스피커를 사용할 지를 선택할 수 있다.

20개 언어를 지원하는 앰배서더는 작은 헤드폰처럼 생긴 클립식 이어폰을 착용하고 자유롭게 대화할 수 있다. 또 몇 피트 떨어져 있어도 ‘듣기 모드’에서 이어폰에 내장된 마이크를 사용해 말하는 사람의 말을 번역된 말로 들을 수 있다. 앰배서더는 대화 모드와 듣기 모드 외에 강의 모드를 사용해 당신의 말을 전화로 스트리밍하거나 오디오 시스템으로 이어폰끼리 짝짓기를 할 수 있다.

이어폰이 얼마나 발달했는지 알아보기 위해 시중에 나와 있는 두 개의 번역 도구인 구글 번역기와 치타 모바일(Cheetah Mobile)의 휴대용 CM 번역기(소매가 117달러)와 비교했다. 앰배서더(소매가 150달러)는 브루클린의 본사에서 테스트했고, WT2 Plus(소매가 230달러)는 콜로라도 볼더 대학의 다국어가 가능한 학생 두 명이 테스트했다. 결론은 구글 번역기와 CM 번역기는 맥주를 주문하거나 박물관의 위치를 물어보는 정도는 괜찮겠지만, 기차에서 당신 옆 자리에 앉아 있는 사람과 대화를 하기에는 모두 부족하다는 것이었다.

WT2 Plus와 앰배서더는 각기 독특한 장점이 있다. 앰배서더는 대화 모드에서 한 사용자가 실시간으로 상대방의 대화 중에 동시에 같이 말해도 두 사람 모두에게 동시 번역을 제공한다. WT2 Plus는 대화자들이 교대로 말해야 하지만 대화는 동시 번역된다.

중국 선전에 본사를 두고 있는 타임케틀의 카자프 예 마케팅 담당이사는 조만간 오프라인 상태에서 영어, 중국어, 일본어, 한국어, 러시아어를 번역할 수 있게 될 것이라고 말했다. 웨이버리 랩의 앤드류 오초아 CEO는 “번역기의 궁극적인 목표는 오프라인에서 실시간으로 작동하며 당신이 듣는 모든 것을 번역할 수 있는 이어폰이 되는 것”이라고 말했다.

우리가 아직 거기까지 도달하지는 못했지만, 번역기는 지난 몇 년 동안 비약적 발전을 이루었다. 신경망 기계 번역은 단지 단어가 아니라 하나의 문장을 처리할 수 있기 때문이다.

지금까지의 번역기들은 문장에서 ‘멋진’(phat)와 ‘뚱뚱한’(fat)을 구별하지 못하지만, 신경망 기계번역은 스페인어 문장 ‘No hay mal que por bien no venga’(구름이 아무리 낀 하늘이라도 언제나 그 끝에는 해가 있다. 힘든 일이 있어도 그 끝에는 좋은 일이 있을 것이라는 뜻)을 ‘Every cloud has a silver lining’(쥐구멍에도 볕 들 날 있다)라는 좀 더 호감 가는 영어 표현으로 번역할 만큼 충분히 정교했다.

▲ 구글은 이미 한 언어에서 다른 언어로 직접 번역할 수 있는 최초의 직접소통(end-to-end) 모델 트랜스레이토트론(Translatotron)이라는 새로운 인공지능 번역을 실험하고 있다.   출처= 구글 AI

미래에 번역기는 더 빠르고, 더 정확하며, 심지어 당신의 목소리, 톤, 감정까지도 흉내 낼 수 있을 것이다. 구글은 이미 트랜스레이토트론(Translatotron)이라는 제목의 새로운 인공지능 번역을 실험하고 있다.

구글 AI 및 머신러닝(Google AI & Machine Learning)의 저스틴 버러 대변인은 "트랜스레이토트론 은 텍스트로 변환하는 1단계 과정을 거치지 않고 한 언어에서 다른 언어로 직접 번역할 수 있는 최초의 직접소통(end-to-end) 모델"이라고 말했다.

그는 트랜스레이토트론은 아직까지는 연구 단계이며 구글은 그것을 독립적인 번역기로 개발할 계획이 없다고 말했지만, 그렇다고 해서 다른 사람도 그러지 않을 것이라는 뜻은 아니다. 그리고 만약 그런 일이 일어난다면, 바벨 피쉬를 물 밖으로 날려버릴지도 모른다.