SESAME 참깨라는 음성 대화 AI 모델 (CSM, Conversational Speech Model) 데모. 데모라 그냥 지금 페이지 클릭하면 바로 마야 또는 마일즈 AI와 대화가 가능합니다.. (마일즈보다는 마야가 성격이 마음에 듬 ㅎㅎ) 아무튼 이 친구들 억양이 너무 자연스럽네요. 솔직히,,, 이정도면 AI 인거 모르고 통화했으면 사람인줄 알았을지도... 어떻게 이렇게 사람같지..
Crossing the uncanny valley of conversational voice
At Sesame, our goal is to achieve “voice presence”—the magical quality that makes spoken interactions feel real, understood, and valued.
유명하신 골빈해커님 (김진중님) 1인 개발로 출시한 AI 영어 회화 앱 '아미고' 를 소개합니다. 개인 개발 앱임에도 수백억 이상 투자받고 OpenAI 에서도 투자받은 '스픽' 앱과 비교해서 더 낫다고 하는 후기가 있을 정도.. (사실 이건 한두명의 개인이 그렇게 느낄 수 도 있는 후기이니 만큼 객관적인 건 아니지만..) 그런데 제가 잠깐 써보니 왜 그런 후기가 있는지 납득될 정도로, 정말 AI 친구와 대화하는데 실제 외국인과 대화하는 느낌이 정말 아주 잘 구현되어 있더라구요. 와.. 단순히 대화만 가능한게 아니고 개별 튜터 별 사람처럼 느껴지게 프로필 꾸며진 퀄리티하며 영상 역시 AI로 상당한 퀄리티로 영상 소개가 들어가 있어서 현재의 가장 앞서나가고 있는 AI 기술을 빠르게 서비스에 다 녹여냈다는 느낌을 받았습니다. 지금도 놀랍지만 분명 앞으로 계속 좋아질 것을 감안하면 앞으로가 더 기대되는 앱 입니다.
X의 골빈해커님(@golbin)
🚀 Ameego, 마침내 출시! 우여곡절 끝에 아미고를 출시합니다. 우선 iOS만 출시했습니다. (우선 한국 스토어만, 안드로이드는 2주 뒤에 출시 예정) https://t.co/SctBe3Oplg 영어 학습이 궁극의 목표는 아닙니다만, 다른…
유튜브에서 이제 자동 더빙 기능이 추가되네요. 한국어는 아직 지원 안하는군요. ㅠ
내가 쓴 글이 AI를 통해 팟캐스트로! 일레븐랩스에서 "GenFM" 이라는 기능을 발표했는데 내 글이 손쉽게 팟캐스트화 시킬 수 있다고 하네요. 그냥 오디오로 바꿔 주는 것이 아닌 호스트와 대화하는 형식이 되네요. 32개국어를 지원하구요. (한국어 포함!) 내 글 보다 팟캐스트 형식이 되어서 더 좋은것 같기도?! 넘 좋은데요? 와..

ElevenLabs — GenFM podcasts on ElevenReader | ElevenLabs
Tune in as AI co-hosts generate smart podcasts from any of your PDFs, articles, ebooks and more. Now available in the ElevenReader App.
괜찮은 AI 목소리 서비스가 나왔네요. 수퍼톤 플레이라는 서비스인데, 사용해보니까 꽤 자연스러워요. AI 보이스를 사용하면 AI구나 했는데, 앞으로는 사람 목소리와 구분이 어려워질 거 같은 느낌도 들어요~ ㄷㄷㄷ

꽤 괜찮은 AI 목소리 서비스가 나왔네요
수퍼톤 플레이 목소리로 쇼츠 만들어보기 | 고퀄리티 AI 목소리로 쇼츠 만들기(수퍼톤 사용법)by 스토리위너코치 AI 목소리를 활용해서 숏폼 영상을 만드는 분들이 많은데요. 저도 AI 활용법을 테스트해본다고 많이 쓰는 편인데, 퀄리티가 아쉬울…
Elevenlabs 에서 제 x.com @shalomeir 포스팅을 가지고 적당한 제 목소리를 생성했어요. 30대 남자 목소리로 예상했고 흔들리지 않는 기업가적 열정을 가지고 있다고 분석했군요.. ㅎㅎ 뭔가 그럴싸한거 같기도 하고... x.com 계정만 있으면 여기서 https://www.xtovoice.com/ 생성 가능합니다.

shalomeir | X to Voice | Elevenlabs
What would your X profile sound like?
메타 커넥트에서 이번에 시연한 목소리가 너무 허스키해서 '스칼렛 요한슨' 닮았네... (개인적으로는 지난 번 openAI 에서 시연한 목소리 보다 더... ) 하지만 그 목소리는 요즘 꽤 핫한 동양계 (아버지 중국인, 어머니 한국인) 미국인 배우 아콰피나 였군요. 그러고보니 목소리가 매력적이어서 애니메이션 등에서 성우로도 많이 활동하시더라구요. ㅎㅎ

메타, 인스타그램에 아콰피나 목소리 AI 비서 추가…네카오도 대격돌 준비
산업 > IT 뉴스: 페이스북과 인스타그램을 운영하는 메타 플랫폼이 자사의 인공지능(AI) 챗봇 ‘메타 AI’에 존 시나 등 유명 연예인의 목소리를 ...
이 연구는 AI 목소리와 가상 캐릭터 에 대한 연구 결과이지만, 게임에서 내 캐릭터 커스터마이징 + 보이스 설정이 게임 몰입도 향상에 도움이 된다는 연구 로 봐도 무방할 것 같네요.
가상현실에서 우리의 목소리는 어떤 역할을 할까요?
소리가 몰입에 미치는 영향
Text 를 음성으로 읽어주는 앱 'Reader' 가 나왔다고 합니다. 현재 관련 AI 인공지능 서비스로 가장 좋은 기술을 가진 스타트업으로 잘 알려진 '일레븐랩스' 에서 제공하는 앱 답게 저도 잠깐 사용해보니 매우 훌륭한 퀄리티! 게다가 영어만 잘 되는게 아니고 (분명 Voices 선택지나 앱은 한국어 언급이 전혀 없음에도) 한글도 매우 잘 읽어줘서 한글 콘텐츠를 듣는 용도로도 아주 좋아요. 한국어로 된 뉴스나 블로그 Link 를 넣어도 매우 잘 작동 하므로. 긴 한글 콘텐츠를 그냥 듣고 싶을 때 이용하고 싶을 때 추천합니다. 물론 영어 는 말할 것도 없이 잘 되므로 영어 듣기 공부하기에도 매우 좋을듯.

일레븐랩스 리더 (ElevenLabs Reader) - 어떤 텍스트든 읽어주는 AI 앱
일레븐랩스 리더 (ElevenLabs Reader) 일레븐랩스 리더(ElevenLabs Reader)는 텍스트를 자연스럽고 표현이 풍부한 음성으로 변환해주는 AI 기반 애플리케이션입니다. 기사, ePub, PDF, 뉴스레터 등의 텍스트 콘텐츠를…
eleven labs 에서도 reader 앱을 출시한다고.. 한국어도 지원할 예정이라니 기대됩니다! 읽을게 너무 많은 요즘 가볍게 듣는 방식으로! 텍스트 콘텐츠를 소비하기 쉬워질듯~

일레븐랩스, 텍스트 읽어주는 AI 앱 글로벌 출시...한국어도 지원
음성 인공지능(AI) 선두 스타트업 일레븐랩스가 텍스트 파일이나 웹 링크를 오디오 내레이션으로 변환하는 모바일 앱 ‘리더(Reader)’를 전 세계로 확대 출시한다.테크크런치는 19일(현지시간) 일레븐랩스가 32개 언어를 지원하는 리더 앱을 글로…
주디덴치 목소리라니.. 탐낼만한 목소리임이 분명.

'메타, AI 비서에 유명 배우 목소리 사용 추진
국제 > 기업 뉴스: 페이스북 모회사 메타 플랫폼이 유명 배우 및 인플루언서의 목소리를 자사의 인공지능(AI) 모델에 탑재하기 위한 협상을 진행 중...
드디어.. 이번달에는 보이스 기반 준 실시간 ChatGPT 가 나오나요? 싶었는데. 그런데 그 마저도. 소규모로 파트너 그룹에만 제공한다고..

오픈AI, 이달 말 GPT-4o의 ‘보이스 엔진’ 알파 공개
오픈AI가 지난 3월 공개한 텍스트-오디오 생성 AI ‘보이스 엔진(Voice Engine)’을 이달 말 알파 버전으로 공개한다는 소식이다.톰스가이드는 19일(현지시간) 샘 알트먼 오픈AI CEO가 X(트위터)를 통해 이달 말에 'GPT-4o'의…
캡컷에서 추천하는 AI 음성 생성 서비스 들 입니다. 엄청나게 많네요.. 은근..
상위 8개 AI 음성 생성기 유명인: 목소리를 기억하십시오
유명인의 소리로 보이스오버를 만들 수 있는 최고의 AI 음성 생성기 유명인 도구를 찾아보세요. 웹 및 PC 기반 AI 유명인 음성 생성기를 찾아보세요.
매우 관심있는 분야 입니다. Voice 에이전트가 과연 제대로 작동하는 세상은 언제 어디에서 부터 올지 말이죠.
a16z가 정리한 AI Voice 에이전트에 대한 모든 것 | GeekNews
생성형 AI 덕분에 앞으로 인간은 전화 통화를 할 필요가 없어짐인간은 전화 통화에 가치가 있을 때만 시간을 할애하게 될 것임기업에게 주는 혜택인간 발신자로 인한 시간과 인건비 절감수익 창출 증대를 위한 자원 재배치 가능성더 규격화되고 일관된 고객…
당신의 블로그에 Voice 나레이션을 탑재해보세요! 블로그에 ElevenLabs 에서 제공하는 임베디드 코드를 심으면 끝. 이 Audio Native 기능을 소개하는 ElevenLabs 블로그 페이지도 해당 기능이 제일 상위에 들어가 있네요.
ElevenLabs Audio Native
Add human-like narration to your blog or news site
우와 우와.. 일레븐랩스 사용자로서 정말 꿀팁이 많았어요. 대박.. 현재까지 제가 경험한 바로는 음성생성 수준. 확실히 일레븐랩스가 제일 뛰어나요. 더 놀라운건, 일레븐랩스는 한국어를 크게 고려하지 않은 외국 서비스임에도 한국어, 한국화된 유사 더빙 음성 생성 서비스들 보다 확실히 더 자연스럽게 만들어진다는것... 일레븐랩스는 딱히 생성된 결과를 가지고 뭔가 편집이나 변화를 주는 커스텀 작업이 불가능한 단점이 있는데.. 이게 단점같다고 느껴지기 보다, 그만큼 그냥 생성 버튼 누르고 끝. 완성된 결과가 즉시 쓸 수 있는 수준이 되었어요. 물론 생성된 음성에 대해 일일히 편집할 수 있고 커스터마이징 할 수 있는 기능 없는 것보다 있는게 좋긴 하겠지만요.
메타가 발표한 Seamless Communication 기술. 준실시간 번역이 포함된 Speech-to-Speech 등이 가능. 하나의 기술이 아닌 여러 기능이 통합적으로 작동하는데요. 말하는 분야에서 상당한 진보가 느껴집니다. 첨부한 페이지에서 바로 약간 시도해볼 수 있어요. (English...) 아래 크게 4개의 모델을 의미합니다. SeamlessExpressive: 내가 말하는 느낌과 억양을 최대한 살려줍니다. 영상 예시를 보면, '쉿, 조용히 해'라고 도서관에서 조용히 말해달라는 목소리로 말하면, 번역된 음성 역시 그 느낌을 그대로 살려줍니다. 엄청난 진보 중 하나. SeamlessStreaming: 말하는 순간 번역이 됩니다. (2초 딜레이) 굳이 말하고 기다리고 할 필요가 없어지는 기술. 이제 진짜 외국인 만나도 부담 없을듯 ㅎㅎ SeamlessM4T v2: 다국어 음성과 텍스트를 복합적으로 인지해서 자동으로 분류하고 처리하는 기술. 내가 어떤 다양한 언어를 섞어서 이야기해도 알아서 처리. SeamlessExpressive 와 SeamlessStreaming의 기반이 되는 모델 Seamless: SeamlessExpressive + SeamlessStreaming + SeamlessM4T 공식 페이지: https://ai.meta.com/research/seamless-communication/ DEMO TRY URL: https://seamless.metademolab.com/expressive

Seamless Expressive Translation Demo
Create translations that follow your speech style. Translate from nearly 100 input languages into 35 output languages. This is a translat…
영상 편집용 웹 도구인데 오디오에서 자동 자막도 생성됩니다. 여러가지로 가볍게 유튜브 시작하기에 상당히 괜찮은 툴 같네요.

Perfect For Your Next Project - Video Editing Made Simple
An online video suite for professionals. Record and edit your videos in the cloud. We help scale your brand, channel or vlog. Try it for…