본문 바로가기

 

[블로그] 티스토리 초보 운영/[AI] 인공지능시대 살아남기

유튜브 영상 편집용 AI 이미지 및 TTS(보이스) 생성 툴 추천 및 사용방법

by §◎◁※♠ 2023. 8. 16.
반응형

 

OPEN AI로 인해서, AI 시대는 새롭게 그 장을 열었습니다. 더 이상 우리는 고비용을 들여 전문가의 도움 없이도 우리가 원하는 정도의 이미지는 물론, TTS까지 빠르고 손쉽게 만들 수 있는 시대가 도래했기 때문입니다. 이번 포스팅에서는 AI를 활용해서 디자이너나 성우의 도움 없이 직접 이런 이미지와 보이스 생성을 쉽게 할 수 있는 툴 중에서 가장 보편적으로 추천할 만한 사이트와 간략한 후기를 함께 설명해 드리도록 하겠습니다.

 

반응형

 


목차

 

     

     


    AI 이미지 생성 툴 사이트 추천 및 간략 사용 후기

     

    무언가 우리가 원하는 느낌으로 이미지를 가공하고 만드는 것은 디자이너의 전유물 이었습니다. 하지만, 이제는 디자인 프로그램을 하나도 사용할 수 없는 분들도 AI를 통해서 이미지를 만들고 가공하는 것이 가능해졌을 뿐만 아니라, 디자이너분들도 먼저 AI를 통해서 다양한 이미지를 빠르게 확인해서 최적의 결과물을 만드는 데 사용할 만큼 AI 이미지 생성툴은 점점 발전하고 있기 때문에 아래 추천해 드리는 툴을 한 번 여러분도 함께 살펴보시는 것도 좋은 방법이라고 생각합니다.

     

    미드저니(Midjourney)

     

    미드저니는 굉장히 사용하기 쉽고, 텍스트 프롬프트가 채널 내의 메시지로 전송되는 방식을 차용하고 있으며, 다른 사용자가 작성해서 생성되는 이미지도 보고 다운 받을 수 있도록 되어 있기 때문에, 어떻게 명령어를 입력하면 어떤 결과 값을 받고 이런 이미지들이 내가 하고자 하는 일에 도움이 되는지 직관적으로 빠르게 판단이 가능합니다.

     

    사용되는 이미지는 어떠한 저작권에도 저촉되지 않으며, 1-2분이면 우리가 요청하는 이미지가 최대한 잘 구현되어 굉장히 놀라운 결과물을 가져다 주기도 합니다. 다만 현재 trial 버전으로는 결과를 얻을 수 없어서 유료 버전으로 구매를 해야 하며, 영문으로만 타이핑을 해야 한다는 단점이 있습니다. 유료버전은 기본 10 usd로 한 달에 약 200여 개의 이미지를 생성할 수 있도록 되어 있으며, 40 usd로는 무제한으로 생성할 수 있어, 평소 많은 신규 이미지 생성이 필요하신 분에게는 크게 부담되지는 않습니다.

     

    미드저니 사이트 바로가기

     

     

     

     

     

     

     

     

    스테이블 디퓨젼(Stable Diffusion)

     

    스테이블 디퓨전은 오픈 소스 머신러닝 이미지 생성기 입니다. 다른 것들과 마찬가지로 텍스트 명령을 통해서 이미지를 생성합니다. 스테이블 디퓨전은 실제 사진이나 삽화 등을 굉장히 실사에 가깝게 만들 수 있다는 장점이 있습니다.

     

    사용되는 이미지는 어떠한 저작권에 저촉되지 않아, 모든 용도로 사용이 가능하며 무료로 사용할 수 있는 플랫폼이지만, 플랫폼 구조 자체가 원하는 이미지를 구현하는데 다소 어려워 사용법을 익히는데 다소 시간이 소요되어 초보자에게는 접근성이 좋은 툴은 아닙니다.

     

    스테이블 디퓨전 사이트 바로가기

     

    나이트 카페(Night Cafe)

     

    나이트 카페는 유화, 입체, 판타지, 3D 게임과 같은 아트 스타일로 텍스트 프롬프트에서 이미지를 생성하는 툴로, 해당 이미지는 상품에 붙여서 사용하기보다는 인테리어 또는 크리에이터 분들을 위한 이미지를 만들어주는 도구에 더 가깝습니다.

     

    생성된 이미지는 저작권에 저촉이 없어 모든 용도로 사용이 가능하나, 이미지 생성의 한계가 다소 위에 소개드린 두 가지보다는 금방 느껴진다는 단점이 있습니다.

     

    나이트 카페 바로가기

     

     

     

     

     

     

     

    AI TTS(보이스) 생성 툴 사이트 추천 및 후기

     

    TTS는 Text to Speech 의 약자로, 텍스트 음성 변환이라고 합니다. 텍스트 음성 변환은 우리가 유튜브 등의 동영상을 제작할 때나, 전자책 등을 읽어주는 용도로 변환할 때 등 굉장히 많이 사용되고 있습니다. 과거에는 전문 성우를 섭외하여 녹음을 한 뒤 녹음파일을 전달받아야 했기 때문에, 성우를 섭외하는 비용과 성우가 녹음할 스튜디오 및 장비를 섭외하는데 큰 비용을 들여야 했지만, 이제는 TTS 프로그램이면 충분히 그 역할을 하고 있기 때문에 어떤 툴 사이트가 있는지 말씀드리겠습니다.

     

    크로버 보이스(CLOVA Voice)

     

    크로버 보이스는 네이버에서 운영하고 있는 AI 인 만큼 한국어를 음성 합성 하는 프로그램 툴 중에서 굉장히 높은 퀄리티를 구현해주고 있으며, 이미 보편적으로 가장 널리 알려져 있어 많이 사용되고 있습니다. 

     

    크로버 보이스 바로가기

     

    CLOVA Voice - 네이버 클로바

    자연스럽고 깨끗한 합성음, CLOVA Voice를 체험해보세요.

    clova.ai

     

    내추럴 리더(Natural Reader)

     

    내추럴 리더는 PDF, WORD는 물론 웹페이지 등 다양한 형식의 문서를 지원하기 때문에 다양한 문서를 읽는 데에는 가장 최적화되어 있습니다. 음성으로 변환을 원하는 파일을 라이브러리로 업로드해서 사용하며, 다수 파일을 한 번에 관리 및 전자책 포맷을 포함한 다양한 형태의 포맷도 지원합니다.

     

    뿐만 아니라, 사진을 업로드하면, 사진을 음성으로 변환해서 읽게 할 수도 있고 툴바를 사용해서 웹 브라우저와 워드프로세서 등에서 텍스트에 하이라이트를 하는 것 만으로도 작동이 되어 굉장히 범용적입니다.

     

    내추럴 리더 바로가기

     

    Free Text to Speech Online with Realistic AI Voices

     

    www.naturalreaders.com

     

     

     

     

     

     

    발라볼카(Balabolka)

     

    발라볼카는 굉장히 다양한 언어와 음성을 제공합니다. 또한 텍스트 파일을 오디오 파일로도 저장할 수 있어 휴대용 장치에서도 쉽게 활용할 수 있다는 장점을 가지고 있습니다.

     

    뿐만 아니라, 음성 속도, 음량, 음색까지 사용자가 직접 설정할 수 있어서 가장 자신이 구현하고 싶은 TTS에 가깝게 모든 부분을 직접 컨트롤할 수 있어 굉장히 유용하며, 구글에서 검색해서 해당 프로그램을 다운로드하여서 사용하면 됩니다.

     

    지금까지 이번 포스팅에서는 AI를 활용하여 이미지를 생성하는 것은 물론, TTS 작업까지 굉장히 손쉽게 할 수 있도록 도와주는 프로그램 사이트와 툴을 알아보았습니다. 챗 GPT를 통해서 많은 분들의 일상에 AI가 녹아들었을뿐, 위 툴은 짧게는 2년 길게는 5년 이상 이미 배포되고 있었으며, 점점 더 발전하는 추세입니다. AI 또한 이젠 정보 싸움입니다. 누가 더 많은 툴을 가지고 손쉽게 작업하는지에 따라 여러분들의 업무 효율성은 무서울 정도로 성장할 것이라고 생각합니다.

     

     

    반응형

    댓글