Kilka dni wcześniej polski internet obiegła wiadomość, że aż 17 utworów z listy „Polski Top 20” na Spotify powstało przy użyciu generatywnej sztucznej inteligencji. Nowe dane sugerują, że zwyczajnie nie jesteśmy w stanie odróżnić ludzkiej pracy od tworu algorytmów.
To prawdziwa muzyka, czy stworzona przez AI?
Badanie przeprowadzone przez Deezer i Ipsos objęło 9 tys. osób z ośmiu krajów. Zadanie wydawało się proste: wysłuchać trzech krótkich nagrań i określić, które z nich stworzyła AI. Rzeczywistość okazała się brutalna – niemal nikt nie wskazał poprawnie całego zestawu. Dodatkowo, 71 proc. badanych nie spodziewało się tak słabych rezultatów, a 52 proc. poczuło dyskomfort, uświadamiając sobie, że nie mogą ufać zmysłowi słuchu.
Choć rozpoznawalność muzyki stworzonej przez sztuczną inteligencję jest znikoma, nie oznacza to automatycznej niechęci słuchaczy do syntetycznych nagrań. Dane z badania pokazują ambiwalentne nastawienie odbiorców:
- Tylko 40 proc. deklaruje, że pominęłoby w pełni wygenerowany przez AI utwór,
- 66 proc. odsłuchałoby go przynajmniej raz – z czystej ciekawości,
- jednocześnie aż 80 proc. domaga się, by nagrania stworzone wyłącznie przez algorytmy były wyraźnie oznaczane.
Deezer zapewnia, że takie oznaczenia już stosuje – jako jedyna duża platforma korzysta z systemu wykrywania muzyki syntetycznej, automatycznie tagując nagrania generowane m.in. przez Suno i Udio. Firma wyklucza je też z algorytmicznych rekomendacji. Skala zjawiska rośnie jednak w zawrotnym tempie – codziennie do serwisu trafia ponad 50 tys. w pełni syntetycznych utworów, co stanowi ponad jedną trzecią wszystkich nowych zgłoszeń.
Środowisko muzyczne w strachu
Raport Deezer i Ipsos ujawnia także narastający niepokój w środowisku muzycznym. Aż 70 proc. odbiorców obawia się, że utwory tworzone przez AI mogą zagrozić zarobkom artystów, a 73 proc. nie akceptuje wykorzystywania chronionych nagrań do trenowania modeli generatywnych bez wyraźnej zgody ich twórców.
Eksperci twierdzą, że wyniki badań nie oddają w pełni złożoności testu. W badaniu wystarczyła jedna pomyłka przy trzech nagraniach, aby trafić do grupy „nieodróżniających”. Osoba, która poprawnie wskazała dwa utwory, również trafiała do tej kategorii – mimo skuteczności na poziomie 66 proc.
Dlatego gdy redakcja The Verge powtórzyła eksperyment na własną rękę, rezultaty wyglądały inaczej. W grupie 10 osób tylko jedna wskazała wszystkie utwory poprawnie, ale średnia trafność odpowiedzi wyniosła 43 proc.


