18 listopada 2017, 09:00:LiveChat Hackathon #3 - LiveChat Software, al. Dębowa 3, 53-134 Wrocław, Polska

System rozpoznawania mowy Microsoftu osiągnął „ludzki poziom”

Microsoft ogłosił, że ich system rozpoznawania mowy przekroczył kolejną granicę – poziom błędów spadł do 5,1% wobec 5,9% z zeszłego roku. Oznacza to, że sztuczna inteligencja giganta z Redmond dokonuje transkrypcji mowy na pismo praktycznie na tym samym poziomie co profesjonalni „żywi” transkryptorzy (którzy mają możliwość wielokrotnego odtwarzania danego nagrania).

Techcrunch podaje, że cudu tego dokonali naukowcy z Microsoft Research AI, która w dużym skrócie zajmuje się badaniami nad sztuczną inteligencją. Naukowcy usprawnili „neuronowe sieci akustyczne i językowe”, co pozwoliło im uzyskać wynik o 12% lepszy niż rok temu. Badania przeprowadzono na próbce 2400 rozmów telefonicznych pomiędzy 540 rozmówcami (łącznie 260 godzin nagrań), które zostały wykonane na początku lat 90-tych (oczywiście w USA i w j. angielskim). Próbka, na której pracowano i dokonywano transkrypcji pochodzi z Linguistic Data Consortium University of Pennsylvania.

Czytaj także: Microsoft rezygnuje z Painta

Najnowsze osiągnięcia pozwalają nie tylko dokonywać transkrypcji w sposób literalny, ale także dostosować ją do kontekstu (tematu rozmowy, oceny stopnia formalności, relacji rozmówców) oraz opisać, jakie rozmówcy wykonują czynności (np. pije napój, biegnie, prowadzi samochód).

Dlaczego jest to ważne?

Pomijając kwestie podsłuchów, spisywania taśm prawdy tudzież innych zastosowań wywiadowczych, efektywna transkrypcja w największym skrócie umożliwia swobodne prowadzenie rozmowy pomiędzy maszyną a człowiekiem. Tony Stark (Iron Man) miałby duży problem bez swojego komputerowego asystenta Jarvisa, który doskonale rozumie swojego właściciela (partnera?). Siri, Ok Google pomimo gigantycznego postępu to wciąż niedoskonali asystenci – ich stopień zrozumienia użytkownika jest niezadowalający. W zasadzie wciąż jest z tym więcej śmiechu niż pożytku.

Czytaj także: Siri w IOS 10 umożliwi płacenie za pomocą głosu

Zastąpić dłonie głosem lub myślą – to idea, która powoli się materializuje za sprawą właśnie takich osiągnięć, jakie prezentuje Microsoft Research AI. Nad podobnymi systemami pracują także Google, Apple i wiele innych technologicznych gigantów.

Czy praca dziennikarzy jest zagrożona?

Spisywanie wywiadów to niewdzięczna praca podczas, której można wykonać dziesiątki innych czynności. Otrzymanie spisanego tekstu może skrócić czas publikacji, pozwala poświęcić więcej czasu na jego redakcję, itp. Z pewnością jest to duże i pożądane ułatwienie (chociaż niektórzy dziennikarze zapewne będą mieli inne zdanie).

Czytaj także: Rozpoznawanie głosowe. Najgorętszy temat ostatnich lat

W customer service (chatboty, infolinia, email) spokojnie 80% pracy mogą wykonać programy komputerowe, pod warunkiem, że zrozumieją swoich rozmówców. Praca w telefonicznej obsłudze klienta na tzw. słuchawce za parę lat prawdopodobnie będzie wspomnieniem (Jarvis może wykonać 100 tys. telefonów do różnych osób w tym samym czasie). Z każdym się dogada, sprawdzi jego preferencje (facebooka) i dostosuje produkt do aktualnego nastroju rozmówcy. Przypomnijcie sobie jak długo ostatnio czekaliście na połączenie z konsultantem swojego operatora telekomunikacyjnego. Efektywny bot z elementami AI umożliwi natychmiastowe połączenie (i nie będzie wymagał podawania na klawiaturze numerów sekcji tematycznych).

O zaawansowaniu prac nad AI świadczą już nie tylko przełomowe osiągnięcia naukowców, ale także fakt, że światowi liderzy technologiczni i naukowi coraz częściej dostrzegają zagrożenia wynikające z jej powszechnego stosowania i domagają się wprowadzenia regulacji i ograniczeń zanim będzie za późno (i np. nie przegramy wojny z SkyNetem).

Ostatnio dręczy mnie jedna zagwozdka – czy gdybym posiadał technologię z funkcją pełnoprawnej świadomej sztucznej inteligencji, czy pochwaliłbym się tym publicznie, czy może przejął kontrolę nad światem?

Podziel się artykułem
Share on FacebookTweet about this on TwitterShare on Google+Email this to someone