딥브레인AI, ‘엔비디아 GTC 2022’ 참가.. AI 휴먼 기술 및 연구 성과 공개

▶ 딥브레인AI 채경수 CTO 참석해 립싱크 영상 합성 기술 및 합성 시간 단축 성과 발표 ▶ ‘디지털 휴먼과 대화형 인공지능’ 세션 패널로 참가해 AI 휴먼 사업 현황 소개   딥브레인AI는 세계 최대 AI 개발자 컨퍼런스로 불리는 ‘엔비디아 GTC 2022’에 참가하여 AI 휴먼 기반의 연구 성과와 기술 전반에 대해 소개를 했습니다. ‘엔비디아 GTC(GPU Technology Conference)’는 AI 컴퓨팅 기술 분야의 선두주자인 엔비디아가 주관하는 글로벌 기술 컨퍼런스로, 올해는 3월 21일부터 24일까지…


[Deep.人. Article] 비전사 데이터를 활용한 개인화 음성 합성

Deep Learning Team : Colin 들어가며 지난 시간에 살펴본 AdaSpeech 모델과 같이 기존의 TTS 적응 방식은 특정 화자의 목소리를 합성하기 위해 텍스트-음성 쌍의 데이터를 사용해 왔습니다. 그렇지만 데이터를 쌍으로 확보하는 것이 현실적으로 어렵기 때문에 전사가 안된 음성 데이터만으로 TTS 모델을 적응 시킬 수 있다면 훨씬 효율적인 방법이 될 것입니다. 가장 쉽게 접근해 볼 수 있는 방법으로 음성의 전사를 위해서 음성인식(ASR) 시스템을 활용하는 것을 생각할 수 있겠으나 특정 상황에서는 적용이 어렵고…


[Deep.人. Article] AdaSpeech: 개인화 음성 합성을 위한 적응형 TTS 모델

Deep Learning Team : Colin 들어가며 AI 스피커나 네비게이션을 사용하면서 안내 음성의 목소리를 바꿔본 경험이 있으실 겁니다. 필자도 좋아하는 배우인 유인나님의 음성으로 스피커 목소리를 설정해놨는데 이처럼 음성 합성 기술이 개인 비서, 뉴스 방송, 음성 길 안내 등 삶의 곳곳에 녹아들면서 여러 사람의 목소리로 음성을 합성해내는 것이 중요해졌습니다. 그리고 다른 사람들의 목소리 뿐만 아니라 본인의 목소리를 AI의 음성으로 사용하고자 하는 수요도 늘고 있는데 이를 음성 합성 연구 분야에서는 개인화 음성…


[Deep.人. Article] 당신에게 필요한 것은 립싱크 전문가입니다.

Deep Learning Team : Dunkin 들어가며 주어진 음성 데이터에 대해서 알맞은 입술의 움직임을 만들어내는 립싱크 기술은 딥러닝 분야에서 가장 각광받는 분야 중 하나입니다. 영화를 예로 들어볼까요? 국적이 다른 배우가 개봉되는 국가의 언어에 맞추어 더빙한다면 어떨까요? 마치 같은 나라의 사람이 한국어를 배워 이야기 하는 것 처럼 청자에게 전달이 잘 될것이며, 몰입도 훨씬 잘 될 것입니다. 이 뿐만 아니라 다른 나라 정치인이 딥러닝 기술을 통해 한국어로 연설하여 의사를 전달하는 장면이 뉴스에 나오는 것도 놀랄 일은…


[Deep.人. Article] 한국형 딥페이크 탐지 데이터 세트(KoDF) 구축

  최근 몇 년 동안 영상 합성 기술이 크게 대중화되면서 다양한 분야에 활용되기 시작했습니다. 하지만 일부 합성기술로 제작된 영상은 각종 사회적 문제를 일으키며 딥페이크 영상을 검출하는 기술을 필요로 하게 되었고 다양한 기술들이 등장하기 시작했습니다. 이러한 딥페이크 영상물을 탐지하는 알고리즘의 개발하기 위해서는 변조 데이터가 필요하며 현재 공개된 데이터(FaceForensics++, DeepFaceLab, DFDC 등)들은 백인 얼굴에 편향되어 있거나, 변조모델의 다양성/투명성이 부족하며 일부는 합성기술을 공개하지 않아…


[Deep.人. Article] 딥페이크(deepfake) 기술 이란?

최근 영화 ‘아이언맨’의 주인공역으로 배우 톰크루즈도 후보에 있었다는 사실이 공개되면서 영화속 일부 장면이 톰크루즈의 얼굴로 된 영상이 화제가 되었습니다. 바로 딥페이크(deepfake) 기술로 영상속 얼굴을 변형한 것인데요. 딥페이크(deepfake) 란, '딥러닝(deep learning)'과 '페이크(fake)'의 합성어로 딥러닝 기술을 이용하여 진위 여부를 구별하기 어려운 가짜 이미지나 영상물을 말합니다. 일반적으로 ‘가짜’라는 부정적인 인식을 가지고 있지만, 딥러닝 기술의 하나입니다.   오늘은 딥페이크가 악용된…


[Deep.人. Article] 딥브레인AI의 딥러닝 기반 영상 및 음성 합성 기술

  AI Human은 딥러닝 AI기술을 기반으로 사람 얼굴을 학습하여 텍스트만 입력하면 사람의 말투, 억양 등과 같은 목소리 뿐만 아니라 영상으로 말하는 얼굴, 표정, 움직임까지 자연스럽게 표현이 가능한 기술입니다. 오늘은 딥러닝 기반의 영상합성 관련 학습모델에 대한 설명과 딥브레인AI만의 AI Human 구현 기술을 소개 합니다.   1)기술과 관련된 주요 학습모델 [CNN-이미지분류 알고리즘] Convolution Neurul Networks(합성곱 신경망)으로 Filter(shared weights) 를…