Памятки

Bark

Bark - модель трансформации текста в аудио от Suno AI. Она генерирует реалистичную речь на разных языках, включая русский, с различными голосами. Кроме того, она создает разнообразные аудиофрагменты, включая музыку, фоновые шумы и звуковые эффекты. Модель также способна воспроизводить звуки, такие как смех, вздохи и плач.

Bark может быть запущен на компьютере с помощью инструкций на GitHub (https://github.com/suno-ai/bark) или протестирован через веб-приложение от сообщества Hugging Face (https://huggingface.co/spaces/suno/bark).
Список доступных звуков:
  • [laughter]
  • [laughs]
  • [sighs]
  • [music]
  • [gasps]
  • [clears throat]
  • — или … для пауз
  • ♪ для создания песни
  • Заглавные буквы для выделения слова
  • Так же можно указать определение роли говорящего, к примеру: NARRATOR, MAN, WOMAN и т.д. Стоит обратить внимание, что они не всегда соблюдаются.