Rory Bremner prieš kalbos atpažinimo programinę įrangą: dabar žinome, kas laimėtų

Rory Bremner prieš kalbos atpažinimo programinę įrangą: dabar žinome, kas laimėtų

Kokį Filmą Pamatyti?
 

Komikas ir impresionistas mėgdžioja žmones savo malonumui. Tačiau jis sako, kad kalbos atpažinimo mokslas yra mirtinai rimtas





xbox kibernetinio pirmadienio pasiūlymai

Viena iš mano mėgstamiausių teatro istorijų yra susijusi su aktore Edith Evans, geriausiai žinoma dėl perdėto tarimo (pagalvokite apie ją kaip ledi Bracknell, ištariančią frazę „rankinė?“). Kartą paklausta, ar pažįsta aktorių Kennethą Williamsą, ji jam būdingai ekscentriškai sušuko: O taip! Aš prisimenu! Labai savotiškas balsas!



Puodai ir virduliai, galima sakyti. Bet ar tikrai mūsų balsai unikalūs? Mano balsas – mano slaptažodis – tai sakinys, kurį pastaruoju metu girdite daug dažniau, kai bankai pradeda tobulinti balso atpažinimo programinę įrangą ir biometrinius duomenis. Tačiau ar tikrai galima sakyti, kad kiekvienas balsas yra unikalus? Žinoma, per visą istoriją buvo garsių kalbėjusių balsų – Winstonas Churchillis, Morganas Freemanas, Margaret Tečer, kad būtų galima paminėti keletą – bet ar jie yra visiškai išskirtiniai ir individualūs, kaip manome apie pirštų atspaudus ar DNR? Ar dabar galime kalbėti apie tai, kad žmonės turi unikalų balso atspaudą?

Man patinka manyti, kad turiu protingą klausą balsams. Mano, kaip impresionisto, karjera didžiąja dalimi grindžiama gebėjimu atskirti akcentus, balso tipus ir savybes. Aš linkęs manyti, kad šis gebėjimas yra instinktyvus; dovana, vakarėlio triukas, net. Tai buvo prieš susitikdamas su teismo medicinos fonetikais savo dokumentiniam filmui „Radio 4“.

Kriminalistai fonetikai yra lingvistai ir kalbos analitikai, kurių žmonių balsų tyrimas sukelia mano instinktyvią ausį gėdą, ypač dėl to, kad esu toks, gerai, teismo medicinos ekspertas. Nors mano įspūdžiai ir karikatūros (dėl to jie nėra tiksli reprodukcija) daromi siekiant komiško ar satyrinio efekto, profesionalų analizė, apimanti kalbėtojo atpažinimą ar profiliavimą, dažnai naudojama kaip įrodymas baudžiamosiose bylose. Kovos su terorizmu srityje balso analizė taip pat yra gyvybiškai svarbi priemonė, nes saugumo tarnybos analizuoja tūkstančių valandų trukmės kalbos įrašus.



Labiau žavi, nei įdomu, ar mano Donaldas Trumpas yra artimas originalui ir pakankamai juokingi (arba iš tikrųjų abu) yra klausimai, kurie formuoja fonetikų darbą: ar įtariamojo balsas yra toks pat, kaip ir to, kuris šnabžda grasinimą bombai. policijos įrašas? Iš kurios Velso dalies yra šantažuojantis asmuo? Ar prieš pat lėktuvo katastrofą pilotas buvo neblaivus, kalbėdamas su skrydžių vadovybe?

Kai tik baudžiamoji byla yra susijusi su žmogaus kalba ar bet kokio pobūdžio akustiniais įkalčiais, reikalinga teismo fonetiko patirtis. Su tokiais klausimais garsiakalbių atpažinimo ekspertas susiduria kiekvieną dieną. Tiesą sakant, Jungtinėje Karalystėje kasmet yra nuo 500 iki 600 baudžiamųjų bylų, kai su balsu susiję duomenys naudojami kaip įrodymai. Ir, kaip ir bet kurį kitą ekspertų įrodymą, jį reglamentuoja Vidaus reikalų ministerijos teismo ekspertizės reguliuotojas ir Parlamentas pripažįsta ekspertų sritimi.

Tai specializacija, apimanti labai įvairias sritis: garsiakalbių profiliavimą (kas yra šis pranešėjas? Kokią informaciją galime pasisemti iš balso?); balso palyginimai, kai žinomas balso pavyzdys lyginamas su įtariamojo balso pavyzdžiu (žinomas pamokslininko Abu Hamzos balso pavyzdys buvo lyginamas su slapta įrašytomis kitų rasinės neapykantos pamokslų kasetėmis, siekiant nustatyti, ar kalbėtojas buvo tas pats asmuo); kalbos stiprinimas; Juostos autentifikavimas; ir padėti policijai atlikti balsų rikiuotės: garsinis tapatybės parado atitikmuo.



butelio atidarymas be butelio atidarytuvo

Visas šis darbas atliekamas derinant apmokytų fonetikų įgūdžius su vis sudėtingesnėmis automatizuotomis garsiakalbių atpažinimo sistemomis (ASRS), kurios dabar turi galią analizuoti žmogaus balsą iki precedento neturinčio laipsnio.

atgal į Hogvartsą

Tačiau akivaizdu, kad vis dar yra žmogaus analitikas – individualus fonetikas – kurio kompetencija lemia viską. Iš tiesų, vienas žymiausių teismo fonetikos atvejų buvo tas, kai nebuvo naudojama jokia mašina. Dialektologas ir fonetikas Stanley Ellis puikiai išanalizavo „Wearside Jack“ juostą, kuri išmušė iš vėžių Jorkšyro Ripper tyrimą. Kruopščiai tyrinėdamas ir analizuodamas paprastų žmonių šiaurės Anglijoje kalbą, Elis sugebėjo tiksliai nustatyti apgaulės akcentą iki kelių mylių šiaurinėje Wear pusėje Sanderlande.

Britai vis dar laikosi šios nuostabios žmogiškosios patirties. Nors dauguma kitų Europos šalių pripažįsta teisinį automatinio garsiakalbių atpažinimo programinės įrangos galiojimą, JK tradicija visada buvo pasitelkti kvalifikuotą dialektiką, kuris po vieną analizuotų balsių garsą, balso kilimą ir kritimą, jo melodiją, per Tarptautinės fonetinės abėcėlės žymėjimo sistemą.

Tačiau tai nėra tikslusis mokslas – mokslo bendruomenė yra susiskaldžiusi dėl veiksmingiausio balsų atpažinimo metodo, naudojant automatizuotas sistemas ar fonetiko kompetenciją, arba, kaip atrodo dabartinė geriausia praktika, abu.

Be to, mūsų balsai skiriasi: jei peršalome; jei mes girti; jei nervinamės. Taigi balso analizė vis dar yra tik patvirtinanti, o ne įtikinama pati.

Bet kaip su impresionistais? Atrodo, kad kartais galime apgauti kai kuriuos žmones. Bet mes negalime apgauti įrangos. Smagiai praleidome programą lygindami mano įspūdį apie Trumpo balsą su originalu. Tai linksmina mokslininkus, bet nejuokina technologijos.

Ne todėl, kad technologija yra tobula. Anksčiau šiais metais BBC reporteriui pavyko apgauti HSBC saugos programinę įrangą ir priversti savo dvynį imituoti jo balsą. Tačiau jis iš to neuždirbo. Manau, teks pasilikti prie komedijos.

kaip pasakyti savo angelo numerį

Žmogaus balso pirštų atspaudų lenktynės vyks trečiadienį 21 val. „Radio 4“.