Baidu社, 인간의 목소리를 복제할 수 있는 음성복제 소프트웨어 개발
최근 Baidu社는 사람의 음성을 수 초 내로 복사할 수 있는 능력을 지닌 일명 'Deep Voice'라는 소프트웨어를 개발해 생체인증 보안과 관련한 두려움을 야기시킬 수 있다는 주장이 제기되고 있어 관련 내용을 살펴보고자 한다.
상기 소프트웨어는 현재 약 1년 넘게 개발작업이 진행되어왔으며 이미 30분 가량의 훈련데이터의 유입을 통해 강연자의 신원을 거의 완벽히 재현해낼 수 있는 능력을 발휘하는 것으로 나타났으나, 개발작업이 진행됨에 따라 그 시간이 약 3.7초로 단축된 것으로 나타났다고 한다.
양질의 샘플데이터가 있을 수록 보다 높은 품질의 결과치를 얻을 수 있는 것으로 나타난 상기 음성복제 소프트웨어는 단순 음성을 복제하는 것에서부터 남성에서 여성, 혹은 영국발음에서 미국발음으로의 변경 등 다양한 조작 등이 가능한 것으로 예상되고 있다 하겠다. 이에 개발업체인 Baidu社는 음성복제를 통해 인간과 기기사이의 상호작용에 있어 개인화에 대한 중대한 어플리케이션들의 사용을 가능하게 만들 수 있을 것으로 기대하고 있다고 밝혔으나, 신분도용에 대한 우려 또한 있다고 밝혔다고 한다.
음성보안솔루션 제공업체인 Aeriandi社의 최고정책관리자인 Tom Harwood씨는 음성복제 기술의 발전에 대해 기기 인터페이스에서 개인화에 중대한 변화를 일으킬 수 있지만 이와 동시에 음성인식보안시스템에 심각한 우려가 예상된다고 밝혔으며, 범죄자들이 음성인식 보안시스템을 속여 누군가의 목소리로 위장하는데 수 초 밖에 걸리지 않게 되어 보안위협이 예상될 수 있다는 의견을 내놓았다고 한다.
일례로 전화번호가 합법적으로 사용되고 있는지 혹은 이전에 신용사기 용도로 사용되어있는지 등에 대한 정보에 대한 분석을 통해 전화를 통한 신용사기 공격이 해외로부터 다수 발생되고 있음을 감안해볼 때 음성신용사기 기술이 국내외적인 위협을 대비하는데 효과적인 솔루션으로 대두되고 있음을 고려해봐야 할 시기가 도래한 것으로 보인다.
이제 기업들이 신기술을 구현하는 것에 대해 조금 더 심도있는 고민이 필요할 것으로 예상되고 있으며, 음성사기 탐지기술이 사용자의 음성복제보다 훨씬 더 많은 부수적인 효과를 불러올 수 있는 만큼, 이러한 정보들이 악의적으로 사용될 경우를 대비해 실질적인 안전장치를 마련해야 하는 노력이 필요한 시기가 도래한 것으로 보인다.
