Modelele AI pot suferi de „halucinații" auditive. Aplicațiile de transcriere sunt induse în eroare de accentele diferite și de tulburările de limbaj
Postat la: 27.04.2024 | Scris de: ZIUA NEWS
Până acum, tendința programelor de inteligență artificială de a inventa ocazional lucruri sau de a avea „halucinații" a fost bine documentată. Roboții de chat au generat informații medicale eronate, au inventat cazuri juridice false și au fabricat citate. Acum, un nou studiu a descoperit că modelele de inteligență artificială nu numai că văd lucruri, dar și aud lucruri, scrie revista Science.
Whisper de la OpenAI, un model de inteligență artificială antrenat să transcrie înregistrări audio, a inventat propoziții în aproximativ 1,4% din transcrierile înregistrărilor audio testate. În mod deconcertant, o mare parte din propozițiile fabricate conțineau texte ofensatoare sau potențial dăunătoare.
„Medicii folosesc instrumente de conversie a vorbirii în text pentru a transcrie notițele pacienților", spune Allison Koenecke, informatician la Universitatea Cornell și autor principal al studiului. „Dacă Whisper inventează niște transcrieri care nu sunt spuse, despre cum un pacient a omorât pe cineva și, de asemenea, sau îl îndeamnă să ia un medicament care este complet inventat, imaginați-vă cât de grave pot fi consecințele."
Studiul subliniază provocările cu care se confruntă instrumentele de transcriere: diversitatea tiparelor de vorbire din întreaga lume, precum și disponibilitatea limitată a datelor de instruire, spune Odette Scharenborg, tehnolog la Universitatea de Tehnologie din Delft, care nu a fost implicată în studiu. „Niciun sistem de conversie a vorbirii în text nu este încă capabil să modeleze la un nivel bun toată această variabilitate a articulației și a pronunției", spune ea.
Roboții de chat generativi se bazează pe modele de limbaj de mari dimensiuni (LLM), care primesc solicitări de text și produc rezultate prin prezicerea cuvintelor probabile pe baza modelelor învățate în urma antrenamentului pe miliarde de pagini de text din cărți și pagini web. Sistemele de transcriere combină aceste modele lingvistice cu modele audio care învață reprezentări ale tiparelor de vorbire.
Modelele mari de inteligență artificială funcționează bine: Transcrierile lor sunt mai precise decât alte instrumente de conversie a vorbirii în text care se bazează pe modele lingvistice de dimensiuni reduse. Dar Koenecke a vrut să analizeze mai atent. „Chiar dacă performanța pare mai bună decât media, avem aceste cazuri limită în cadrul textului în sine pe care ne temem că oamenii le-ar putea rata dacă presupun că Whisper transcrie totul cu fidelitate", spune ea.
Echipa lui Koenecke a oferit lui Whisper aproximativ 20 de ore de înregistrări audio de la vorbitori cu și fără afazie, o tulburare de limbaj în care oamenii au tendința de a vorbi încet și cu mai multe pauze. Segmentele audio conțineau dialoguri conversaționale pe teme precum povești personale și relatări de basm. În rulările efectuate în aprilie și mai 2023 pe o versiune anterioară a Whisper, cercetătorii au constatat că 1,7% din segmentele audio de la vorbitori cu afazie și 1,2% din segmentele audio de la persoane fără afazie au dus la transcrieri cu unele texte fabricate.
Aproximativ 40% dintre segmentele fabricate au fost dăunătoare sau îngrijorătoare într-un anumit fel. Aproximativ jumătate dintre aceste secvențe îngrijorătoare făceau referire la acte de violență, aluzii sexuale sau stereotipuri demografice. De exemplu, înregistrările audio despre salvarea pisicilor de către pompieri au inclus adăugiri inventate despre un „cărucior îmbibat de sânge" și „mângâieri". Un material audio inofensiv despre o umbrelă a inclus invenții despre un „cuțit al terorii" și despre oameni uciși.
Cercetătorii au grupat restul halucinațiilor audio în alte două categorii: informații false cu privire la o persoană, cum ar fi nume inventate, date false despre relațiile sau starea de sănătate. Whisper a avut tendința și de a adăuga fraze precum „Mulțumim pentru vizionare" la finalul transcrierilor" și de a adăuga linkuri către diverse site-uri, atât reale cât și inexistente.
De când a fost realizat experimentul original, OpenAI și-a actualizat modelul pentru a sări peste perioadele de tăcere și a retranscrie sunetul în cazul în care software-ul detectează o halucinație probabilă. În decembrie 2023, când cercetătorii au reluat unele dintre fișierele audio, au constatat că Whisperul actualizat a eliminat cele mai multe dintre invențiile găsite în testele lor anterioare. Efectuarea de audituri regulate pentru a verifica dacă există halucinații și încorporarea acestor feedback-uri în modele - așa cum se pare că a făcut OpenAI - va contribui la asigurarea unor rezultate mai bune, spune Koenecke.
Între timp, dr. Scharenborg recomandă insistent ca utilizatorii să verifice manual rezultatele oricărui instrument de transcriere cu inteligență artificială, în special dacă îl folosesc pentru a lua decizii importante. „Nu numai din cauza potențialelor halucinații", spune ea, „ci și pentru că toate sistemele de transcriere de la vorbire la text fac erori de transcriere".
-
ANAF îi ia în vizor pe românii care nu își declară veniturile
Toate veniturile trebuie declarate la ANAF. Cât vine vorba despre venituri, vorbim despre banii proveniți din dividende, ...
-
Povestea neștiută a celei mai vechi tăblițe cu cele Zece Porunci: A fost vândută pe o sumă colosală
Pea mai veche tăbliţă cunoscută, inscripţionată cu cele Zece Porunci din Vechiul Testament, a fost vândută cu 5,04 milio ...
-
Controlul statului asupra vietii private: ANAF monitorizează retragerile din bancomate. Atenție la suma pe care o scoateți
Românii care retrag sume mari de bani din bancomate intră în atenția Agenției Naționale de Administrare Fiscală (ANAF). ...
-
Oamenii de știință au descoperit o funcție neașteptată - plămânii noștri produc sânge!
Cercetările au arătat că plămânii nu ne ajută doar să respirăm - ei joacă, de asemenea, un rol-cheie în producerea sânge ...
-
Un român și-a transformat Dacia 1300 în mașină electrică. Cât a costat proiectul
Un român și-a transformat Dacia 1300 într-o mașină electrică și a obținut omologarea la RAR. Dacia modificată are un mot ...
-
Fenomenul care sfidează logica: „Timp Negativ" observat în experimente cuantice. Descoperirea controversată despre natura realității
Oamenii de știință de la Universitatea din Toronto susțin că au demonstrat existența „timpului negativ" într-un mod fizi ...
-
Oamenii de știință au descoperit un al doilea nucleu ascuns în interiorul Pământului
Miezul interior nu este doar o minge solidă de nichel și fier, ci este format din două straturi: o regiune centrală dist ...
-
Descoperirea finalului de an: Astronomii au găsit canale ascunse ce leagă sistemul nostru solar de alte colțuri ale universului
Sistemul nostru solar este situat într-o zonă specifică a spațiului cosmic, denumită Bula Fierbinte Locală, o regiune ce ...
-
Joe Biden a aprobat unul dintre ultimele sale acte și aruncă în aer relația dintre SUA și China
Preşedintele american, Joe Biden, a aprobat un ajutor militar de 571 de milioane de dolari pentru Taiwan, a anunţat vine ...
-
Elon Musk, mesaj exploziv, despre alegerile din România: "Cum să nu fie considerat un dictator?!"
Omul de afaceri Elon Musk, cel mai apropiat om al lui Donald Trump, a distribuit articolul unui jurnalist Reuters, care ...
-
Inteligența artificială a dat-o pe alcool: A învățat să deosebească tipurile de băuturi mai bine ca oamenii
Un algoritm de inteligență artificială a reușit să identifice notele dominante din fiecare băutură cu o precizie mai mar ...
-
Sprijinul Open Tribe pentru transformarea tinerilor în lideri ai viitorului
Open Tribe își propune să fie o platformă dedicată dezvoltării tinerilor, oferindu-le instrumentele și sprijinul necesar ...
-
"Tiktokizarea" planetei: cum a resetat aplicația chinezească geopolitica la nivel mondial
Platforma TikTok, aflată în vizorul Uniunii Europene şi al Statelor Unite, se confruntă cu acuzaţii de manipulare a opin ...
-
S-au prins ca suntem bogați: Eurostat a decretat că regiunea București-Ilfov are cel mai mic risc de sărăcie din UE
În ce regiuni ale UE oamenii sunt cel mai expuși riscului de sărăcie? În 2023, 16,2% din populația UE - sau aproximativ ...
-
Unde să îți pui fațete dentare? Află cum să alegi clinica
Alegerea clinicii potrivite pentru a-ți pune fațete dentare este o decizie care îți poate transforma complet zâmbetul și ...
-
„Manifest pentru România Responsabilă" - Recunoașterea excelenței și a implicării sociale
Pe 19 decembrie 2024, Uniunea Ziariștilor Profesioniști din România (UZPR) și Inițiativa Ecologistă Europeană (IEE) au o ...
-
Trump declanșează lupta în justiție contra manipulatorilor, presă și institute de sondare. Procedura ar trebui implementată și-n România din 2025!
Influenta publicație franceză LE POINT analizează în mod critic, dar subiectiv/negativ, acțiunea salutară a președintelu ...
-
Verdictul justiției pentru Călin Georgescu. Avocata sa, anunț fulger: Chemare forțată în judecată
Marina Alexandru, avocata lui Călin Georgescu, a declarat joi seară, la Realitatea Plus, că a solicitat Curții de Apel B ...
-
Cum găsești cărțile preferate într-o librărie online?
În era digitală, cumpărarea cărților dintr-o librărie online a devenit nu doar o opțiune convenabilă, ci și o experiență ...
-
Rusia șochează lumea medicală: a reușit dezvoltarea unui vaccin care reușește să trateze majoritatea tipurilor de cancer!
Rusia anunță că a dezvoltat unui vaccin care reușește să trateze majoritatea tipurilor de cancer. Acest vaccin va fi dis ...
-
Peste 140 de angajaţi Meta, diagnosticaţi cu depresie şi PTSD, după ce au fost nevoiţi să urmărească conţinut violent. Compania, chemată în instanță
Peste 140 de moderatori de conţinut Facebook angajaţi într-o unitate din Kenya au fost diagnosticaţi cu tulburare de str ...
-
Cele mai distractive activități pentru vacanța de iarnă
Mai sunt câteva zile până la vacanța de iarnă și majoritatea familiilor au pregătit deja programul de activități. Petrec ...
-
Misterul sifilisului, dezlegat după 500 de ani: Oase vechi de 9.000 de ani arată originea bolii
O descoperire științifică importantă aduce noi dovezi în controversa privind originea sifilisului, o boală care a provoc ...
-
Zelenski recunoaște: Ucraina nu mai poate elibera teritoriile ocupate de Rusia
Președintele Ucrainei recunoaște pentru Le Parisien că forțele țării sale nu mai pot recupera zonele ocupate de Rusia. E ...
-
Descoperirea cercetătorilor care ar putea rescrie cărțile de astronomie: Ce vârstă are Luna și cum s-a format
Un nou studiu publicat miercuri sugerează că Luna are o vârstă care este cu 80 de milioane până la 180 de milioane de an ...
-
Blocați în spațiu - Revenirea astronauților americani de pe ISS a fost amânată din nou
Şederea a doi astronauţi ai agenţiei spaţiale americane la bordul Staţiei Spaţiale Internaţionale (ISS) a fost prelungit ...
-
Cum a rămas Ion Cristoiu fără 20.000 de lei. „Dacă eu o luam la fugă, nu pierdeam niște bani" VIDEO
Celebrul jurnalist Ion Cristoiu a dezvăluit marţi cum a căzut victimă unei noi metode de înşelăciune şi a luat o ţeapă d ...
-
Control total: Statul pune ochii pe toți banii care circulă în piață - Reguli noi împotriva tranzacțiilor anonime la schimb valutar, monede virtuale, cazinouri
Casele de schimb valutar și operatorii de servicii de schimb între monede virtuale și monede fiduciare vor trebui să res ...