북한 음성인식SW 룡남산에 딥러닝 기술 적용

 

(2017-06-18) 북한 음성인식SW 룡남산에 딥러닝 기술 적용

북한이 인공지능 딥러닝 기술을 북한이 개발한 음성인식프로그램 룡남산에 적용한 것으로 확인됐습니다. 이는 북한이 딥러닝 기술을 연구하는 것 뿐 아니라 실제로 적용하고 있다는 것을 보여줍니다.

대북 소식통에 따르면 김일성종합대학학보 2017년 제63권 제4호에 ‘조선어련속음성인식을 위한 대규모 재귀 신경망 언어모형 구축의 한 가지 방법’이라는 논문이 수록됐다고 합니다.

<사진1>
사진1이 논문 내용입니다.
북한 연구원들은 최근 음성인식 체계에서 지금까지 많이 이용된 통계적N-그람언어모형의 제한성을 극복하기 위해 신경망을 언어모형 학습에 이용하고 있다고 소개했습니다.
북한 연구원들은 재귀신경망언어모형(RNNLM)이 단어 이력을 제한하지 않고 임의의 길이를 가지는 단어 문맥을 이력으로 이용해 연속 공간에서 파라메터 추정함으로써 신경망언어모형의 성능을 높이고 있다고 지적했습니다.
이어 현재 어휘규모가 크지 않은 조선어연속음성인식체계에서 RNNLM을 이용해 인식률
을 개선하고 있지만 대규모 학습자료를 이용하는 경우 숨은층의 크기를 증가시키는데 따
라 계산량이 늘어나고 학습속도가 떨어져 대어휘 연속음성인식 체계들에는 아직까지 도입
되지 못하고 있다고 밝혔습니다.
이에 논문에서는 음성인식체계의 대규모 언어모형학습에 재귀신경망을 이용할 때 학습속도개선방법을 제안한다는 것입니다.
북한이 재귀신경망이라고 부르는 것은 Recurrent Neural Network으로 우리는 순환신경망이라고 부르는 기술입니다.
순환신경망은 위키백과에 딥러닝 기술 중 일부로 소개되고 있습니다. 순환신경망은 시간 순서 대로 받아들인 데이터를 학습할 때 은닉층에 기억 기능으로 각각 상태를 저장했다가 활용하는 신경망 기술을 뜻한다고 합니다.

<사진2>

사진2를 보면 연구결과에 대한 내용이 나옵니다. 북한 연구원들은 조선어음성인식프로그램 룡남산을 이용해 대규모 순환신경망 언어모델의 성능평가실험을 진행했다고 합니다.

그리고 맺음말에서 성능을 거의 유지하면서도 학습속도를 훨씬 개선해 조선어연속음성인식을 위한 대규모 순환신경망 언어모형학습에 이용할 수 있게 했다고 설명했습니다.

즉 이 기술을 북한이 개발한 음성인식프로그램 룡남산에 적용했다는 뜻입니다. 이는 북한이 딥러닝 기술을 연구하는 것 뿐 아니라 실제로 음성인식 분야에 적용했다는 것입니다.

룡남산은 북한이 문자인식, 번역 기술을 심화해서 음성인식으로 발전시킨 소프트웨어(SW)로 추정됩니다.

2012년 12월 6일 조선중앙TV는 김일성종합대학 콤퓨터과학대학 지능기술연구소에서 ‘조선어문자인식 프로그람 룡남산’을 개발했다고 보도한 바 있습니다. 이 프로그램은 종이에 써진 문자를 인식해 전자문서로 바꿔준다고 합니다.

2015년말에는 북한이 자체 개발한 언어번역 프로그램 룡남산이 알려졌습니다. 이 역시 김일성종합대학 컴퓨터과학대학 지능기술연구소가 개발했다고 합니다. 이 프로그램은 영어로 된 과학기술문서들을 한글로 번역하는 인공지능 프로그램으로 수학, 물리, 화학, 생물학, 정보기술, 지구환경, 의학 등 30여개의 전문 분야 번역을 지원한다고 합니다.

당시 북한 보도에 따르면 룡남산의 전문분야 사전에 등록된 단어가 250여만개에 달하며 8만개 이상의 번역 표현들을 지원하고 있다고 합니다. 북한 개발자들은 자연언어처리기술과 인공지능기술들을 룡남산에 적용해 번역품질을 높였다고 합니다.

<사진3>
사진3은 북한이 개발했다는 문자인식프로그램 룡남산 모습입니다.
딥러닝이 적용된 음성인식프로그램 룡남산은 문자인식, 번역기술 등이 적용된 룡남산의 상위 버전이거나 음성인식 버전일 것으로 추정됩니다.
이전기사

2015/12/30 – 북한 번역프로그램 룡남산은?

2012/12/07 – 북한, 문자인식 SW 개발…전자문서화 박차

국내외적으로 음성인식 기술에 인공지능 기술을 접목하는 것은 사례는 많습니다. 애플 시리, 아마존 알렉사, 삼성전자 빅스비 등이 대표적입니다. 북한도 이와 유사한 기술을 개발하고 있는 것으로 추정됩니다. 다만 북한이 어느 정도 기술력을 갖추고 있는지 현재로써는 확인하기 쉽지 않아 보입니다.

확실한 것은 북한이 딥러닝 기술을 실제로 적용하고 있다는 점입니다. 북한이 음성인식 뿐 아니라 다른 분야에도 딥러닝 기술을 적용하고 있거나 적용을 시도할 가능성이 높아 보입니다. 가령 국내외적으로 딥러닝 적용이 시도되고 있는 의료, 보안 등 분야에 북한도 적용할수도 있을 것입니다. 또 국방이나 무기개발 등에도 적용할 가능성도 있을 것으로 추정됩니다.

강진규 기자 wingofwolf@gmail.com

글쓴이

wingofwolf

디지털 허리케인(Digital hurricane)을 방문해 주셔서 감사합니다. 강진규 기자의 블로그입니다. 디지털 허리케인은 진짜 북한 뉴스를 제공합니다. 2007년 11월~2015년 9월 디지털타임스 기자, 2016년 6월~현재 머니투데이방송 테크M 기자, 인하대 컴퓨터공학부 졸업, 동국대 북한학과 석사과정 중

댓글 남기기