Aby przesłać audiobooka z czytanego przez AI, autorzy muszą pobrać pakiet plików z ElevenLabs, a następnie odwiedzić Findaway Voices, usługę dystrybucji audiobooków Spotify. Nagranie musi następnie przejść proces recenzji, zanim będzie mogło zostać opublikowane. Spotify oznacza tytuły, które zostały opowiedziane przez sztuczną inteligencję.

Spotify współpracuje z ElevenLabs. Audiobooki czytane przez AI

ElevenLabs zostało założone przez Piotra Dąbkowskiego, byłego inżyniera Google i Mateusza Staniszewskiego, wcześniej pracującego w spółce Palantir. Dzięki ElevenLabs autorzy mogą między innymi nagrywać swoje audiobooki w 29 językach. Podczas gdy darmowa wersja pozwala tylko na 10 minut zamiany tekstu na mowę każdego miesiąca, plan Pro za 99 USD miesięcznie generuje do 500 minut.

Najnowsze partnerstwo ma miejsce dwa lata po tym, jak Spotify połączyło siły z Google Play Books, aby oferować audiobooki czytane przez AI. Spotify planuje nawiązać współpracę z kolejnymi firmami, aby rozszerzyć swoją bibliotekę audiobooków. Pojawienie się większej liczby audiobooków generowanych przez sztuczną inteligencję wywoła zapewne znaczną debatę w społeczności wydawców. Niektórzy specjaliści z branży twierdzą, że nagrania AI mogą pogorszyć ogólną jakość audiobooków dla słuchaczy.

Spotify to jedna z najpopularniejszych platform do słuchania muzyki i podcastów. A przynajmniej w tej właśnie formie znaliśmy aplikację do tej pory. Dzięki niedawnemu wprowadzeniu nowych funkcji takich jak interaktywne ankiety, Q&A oraz profile artystów z możliwością sprzedaży biletów na koncerty, aplikacja coraz bardziej przypomina sieć społecznościową skupioną wokół formatu audio. W połowie zeszłego roku na Spotify wprowadzono także opcję dodawania komentarzy pod opublikowanymi podcastami. Pozwala ona twórcom na bezpośrednią interakcję ze swoimi słuchaczami.

Pod koniec zeszłego roku pisaliśmy, że raport firmy Recorded Future, specjalizującej się w analizie zagrożeń, wskazuje na wykorzystanie technologii generowania głosu AI, w tym rozwiązań od polskiego ElevenLabs, w rosyjskich operacjach wpływu na opinię publiczną w Europie. Operacje te miały na celu podważenie wsparcia dla Ukrainy.

Warto zaznaczyć, że nad generowaniem mowy i klonowaniem głosu pracują także inni giganci – na przykład Microsoft. Firma z Redmond ogłosiła niedawno wprowadzenie nowej funkcji dla użytkowników platformy Teams, która ma umożliwiać klonowanie głosu podczas spotkań online w dziewięciu językach.