AI는 제4차 산업혁명의 근간이다. 딥러닝과 머신러닝을 기반으로 한 AI는 음성부터 이미지 분석 등으로 다양하게 세분화되며 진화를 거듭하고 있다 특히 자동번역서비스는 AI의 진화에 있어 뗄려야 뗄 수 없는 관계다. 그러나 그 예전 AI가 적용되지 않던 자동번역은 번역 품질이 매우 떨어졌으나, AI와의 결합으로 신경망 기계번역으로 진화하면서 승승장구하고 있다. 구글과 네이버, 시스트란 등 내로라할 관련 사업자의 자동번역기술을 비교하며 앞으로의 발전 가능성을 따져보자. 자동번역기술은 국내 기업의 글로벌, 특히 동남아 진출에 있어 한 번쯤 살펴봐야 할 기술이기도 하다.

supparsorn / shutterstock.com

갈수록 인공지능(AI)을 활용한 자동통번역 기술이 빠르게 진화하고 있는 가운데, 2018 평창 동계올림픽에서도 인공지능번역 디바이스가 다각도로 도입되는 등 관련 서비스 상용화가 임박했다. 최근 KT경제경영연구소가 발표한 자료를 보면 인공지능 자동통번역 기술 시장을 둘러싸고 글로벌 IT 기업과 국내 자동통번역 기술 기업 간의 경쟁이 갈수록 심화되고 있다.

자동통번역 기술이란, 단순히 텍스트를 입력 기반의 자동번역 기술에서 한 발 더 나아간다. 즉, 인공지능 기술이 음성을 알아듣고 실시간 자동으로 통역을 서비스하는 수준인 셈이다. 한 마디로 컴퓨터 처리능력을 활용해 타 언어를 희망하는 언어로 변화하는 서비스다. 여기서 주의해야 할 것은 자동통역과 자동번역의 차이. 전자가 말소리를 옮기는 것이라면 후자는 텍스트를 옮기는 행위다. 자동통역은 음성인식과 음성언어번역, 음성합성 기술로 비문이 많고, 문장 전체에 대한 정보가 부족할 경우 완성도가 떨어질 수 있다. 반면, 자동번역은 입력된 전체 텍스트를 중심으로 문단구분과 문장부호 등의 사전정보와 규칙연산으로 인해 난이도가 비교적 낮은 편에 속한다.

김슬기 KT경제경영연구소 연구원은 보고서에서 “실제 자동통번역 서비스는 1990년대부터 본격적으로 개발되기 시작했지만 그 결과에 따른 품질이 매우 낮아 실생활에 적용되기에는 무리였던 것이 사실”이라면서 “그러나 2016년 하반기 들어 AI를 적용한 신경기계번역(NMT) 기술로 진화하며 번역 품질이 급격히 향상되어 상용화에도 한 발짝 다가섰다”고 밝혔다.

(소스 링크 : Google Translate Blog)

실제 글로벌 IT 기업의 동향을 살펴보면 구글의 경우 2007년에 이미 통계기반 기계번역(SMT)을 적용한 구글번역기를 론칭한 바 있다. 이미 이 기술로 전 세계 5억 명 이상의 사용자를 확보했으며, 103개 언어 지원과 매일 1,400억 개의 단어절 번역이 가능하다. 2014년에는 카메라 기반 번역 앱 ‘워드렌즈’를 개발한 퀘스트비주얼을 인수, 자동통번역 기술에 박차를 가했으며, 2016년 10월에는 구글 신경망 기계번역(GNMT)으로 시스템을 전환해 번역품질을 크게 향상시켰다. 이로써 구글번역은 오류가 55~85% 감소했으며, 한국어에 GNMT를 도입 후 2개월 간 영어-한국어 번역 트래픽이 50% 이상 증가했다. 이어 구글은 2017년 10월 구글 스마트폰 픽셀2에 인이어(in ear) 통역기 ‘픽셀버드’를 발표했다.

스카이프 실시간 번역(자료 : 유튜브)

페이스북은 스카이프 실시간 음성번역서비스를 제공 중이다. 또 앱 내 번역을 위한 기술을 개발해 매일 45억 개 이상의 문장 번역이 가능하다. 특히 속어나 은어, 오타 등 문맥을 고려한 단어 등도 원활하게 번역해 서비스하고 있다. 마이크로소프트(MS)는 2013년 윈도 버전의 빙(Bing)을 출시했다. 이듬해인 2014년 11월부터 스카이프를 활용한 실시간 음성번역서비스를 제공하고 있다. 2015년 8월에는 번역 앱 ‘Microsoft Translator’를 출시했다. 2016년 11월에는 신경망 기계번역 기술을 적용해 영어와 독일어, 아랍어, 한국어 등 11개 언어 지원이 가능하며, 개발자의 경우 추가 비용 없이도 통번역 API 적용이 가능하다. 아마존도 2015년 9월, 인공지능 번역업체인 사파바(Safaba)를 인수했다. 2017년 11월에는 아마존웹서비스 내 개발자를 위한 번역서비스를 제공 중이다.

(이미지 : 네이버)

(이미지 : 카카오)

국내에서는 네이버의 ‘파파고’와 카카오의 ‘카카오아이(kakao I)’가 서비스를 론칭해 주목을 끌고 있다. 파파고는 2016년 8월에 베타버전을 출시한 후 국내 자동번역 경쟁에 뛰어들어 본격적인 레이스를 펼치고 있다. 그해 10월에는 한-영 번역 시 N2MT(Naver Neural Machine Translation) 기술을 적용했다. 네이버 파파고는 2018년 2월 현재까지 6개 언어를 지원 중이며, 추가로 베트남어와 인도네시아어, 태국어 들을 계획하고 있어 동남아시장 개척에도 공을 들일 것으로 보인다. 카카오 역시 2017년 9월 NMT 기술을 적용한 AI 베타 서비스를 출시, 카카오아이에 적용함으로써 자동번역기술에 뛰어들었다.

한글과컴퓨터도 후발 주자로 참여해 경쟁업체를 바짝 긴장시키고 있다. 한컴인터프리는 2008년부터 ‘지니톡’을 한국전자통신연구원(ETRI)로부터 기술이전 받아 ‘한컴 말랑말랑 지니톡’ 상용화에 한 걸음 다가섰으며, 2018년 평창 동계올림픽 공식 통번역 소프트웨어에 선정됐다. 플리토는 집단지성을 통한 번역서비스로 주목받고 있는 서비스다. 무려 173개국 120만 명의 번역가 집단이 집단지성을 활용해 번역서비스를 제공 중이며, 2017년 9월부터 인공신경망을 기반으로 한 자동번역적용으로 인간과 기계번역의 협업을 시도하고 있다.

(이미지 : 한글과컴퓨터)

이처럼 인공지능을 활용한 자동통번역 시장이 커지고, 신경망 기계번역과 데이터 확보 및 학습이 지속되면 발전 속도는 더욱 커질 것으로 예상된다. 나아가 업체 간 경쟁이 심화될 것으로 보이는 가운데, 앞으로는 텍스트 입력 기반 자동번역에서 음성을 알아듣고 실시간 자동 통역 서비스를 기대할 수 있는 디바이스도 속속 출시될 것으로 전망된다. 따라서 음성인식(ASR) 분야도 함께 발전해야 실시간 자동통역서비스 품질도 향상될 것이라는 기대를 낳고 있다.

아울러 국내 관련 업체의 발전을 위한 다각적인 투자 및 정부 지원도 강화되어야 할 것으로 보인다. 국내 시장이 비교적 좁게 느껴지는 현실 속에서 해외 진출을 꾀하는 기업이 해외에서 시장을 선점하기 위한 개척 지원이 요구된다. 특히 아시아 언어에 대해서는 아직 기술과 이해가 부족한 현실 속에 관련 언어 데이터 확보 등 여러 지원을 고려해야 할것이다.

 

 

Leave A Reply