본문 바로가기

구글번역

4차 산업혁명과 2017년, 그리고 학계 산업혁명의 차수와 시기를 물리적으로 정확히 나눌 수는 없지만, 2017년 현재의 뉴스를 보면, 인공지능, 생명과학, 로봇 등을 중심으로 한 4차 산업혁명이 이미 시작되었다고 보면 될 것 같습니다. 그렇다면, 4차 산업혁명이 학계에 미칠 영향은 어떤 것이 있을까요? 가장 먼저 꼽고 싶은 것은 논문의 표절 여부를 찾아내는 것입니다. 지금도 여러 소프트웨어를 이용해 표절을 적발하고 있지만, 이는 단순히 문장, 단어, 데이터가 기존 논문에서 사용되었는지를 확인하는 것에 그치고 있습니다. 하지만, 인공지능의 발달 및 도입에 따라, 컴퓨터는 기존 논문의 내용 자체를 이해하고, 동일한 내용이 들어간 논문을 찾아낼 수 있을 것입니다. 단어와 문장 구조 등을 바꿔서 표기했더라도, 주장하는 바가 같다면, 표절에 해당하게 .. 더보기
번역을 통한 소프트웨어 현지화 현지화(Localization)는 소프트웨어 등 제품과 서비스의 언어를 현지 언어로 바꾸는 작업이며, 번역 이외에도 여러 가지 추가 작업이 필요합니다. 80년대 소프트웨어의 개발과 보급에 따라 현지화 작업도 시작된 것으로 보고 있습니다. 간단히예를 들어, 윈도우와 MS워드의 한글화를 생각해 보시면 됩니다. 소프트웨어 개발은 고부가가치 산업으로, 매출액 대비 순이익 비중이 높고, 천 개를 판매하든 10만 개를 판매하든 이미 만들어진 소프트웨어이기에 판매량이 늘어날수록 수익률도 극대화됩니다. 이러한 특성상, 사업 초기부터 해외 판매를 적극적으로 추진한 개발사가 많습니다. 현지화는 번역 중 가장 난이도가 높은 분야로 꼽힙니다. 프로젝트 매니저(PM)에 따라 진행 방식이 다른데, 최종 결과물은 프로그램의 모든 .. 더보기
[이나고 제공] 스스로 배우고 번역하는 신경망 번역 전통의 구글 번역과 떠오르는 강자인 네이버 파파고 번역기가 비슷한 시기에 신경망 기계번역(Neural Machine Translation, NMT) 시스템을 도입하였습니다. 사용자 데이터에 기반하여 문장, 구나 절 단위로 번역하던 기존 통계 기반 기계번역(SMT)에서 한층 더 발전된 방식입니다. 프로그램은 스스로 학습하며, 문장 단위로 데이터를 쌓아가게 됩니다. 책 한 권을 읽고, 이해하고, 저장하는 데에 1초면 충분하다고 합니다. 이를 통해 자연스러운 문장으로 번역하여, 쉽고 빠른 이해가 가능해집니다. 프로그램이 언어를 학습하는 것이며, 이에 따라 번역도 가능한 것이라 볼 수 있습니다. 기존 번역과 접근 방법부터 다른 것이지요. 사용자가 많지 않은 외국어도 프로그램은 쉽게 학습할 수 있기에 다양한 언어.. 더보기
미래엔 번역사가 사라질 것인가? 개선된 구글 번역이 화두입니다. 2016년 11월, 구글 번역팀은 더보기
고양이가 할 수 있는 것과 할 수 없는 것? : 컴퓨터 보조 번역의 장점과 한계 CAT를 들어 본적이 있으신가요? 만약 당신이 고양이를 떠올렸다면 이 글의 절반은 성공한 셈이나 다름없습니다. 고양이라니 무슨 뜬 구름 잡는 소리냐고 생각할지도 모르겠습니다. 일단 많은 사람들이 흔히들 사용하는 구글 번역에 CAT를 써 보자. 공정하게 하기 위해 소문자로 cat과 대문자로 CAT, 두 가지 방법 모두를 사용하여 적어 보세요. 결과가 어떠한가요? 소문자나 대문자 모두 같은 결과로 고양이를 제시할 것입니다. 하지만 누가 번역기에 고양이 같은 간단한 단어를 넣고 찾아볼까요? 여기서 말하는 CAT는 고양이가 아닌 컴퓨터 보조 번역(Computer Aided Translation)의 준말입니다. 방금 우리가 사용한 구글 번역 역시 컴퓨터 보조 번역의 일종으로 볼 수 있습니다. 우리는 여기서 이렇게.. 더보기