Kaip automatiniai internetiniai teksto vertėjai keičia sveikatos informacijos prieinamumą pasaulyje

Kaip_automatiniai_in

Kalba kaip kliūtis medicinoje – problema, kuri egzistuoja jau seniai

Sveikatos informacijos prieinamumas visada buvo nevienodas. Žmogus, gimęs anglakalbėje šalyje ir turintis prieigą prie kokybiškai išverstų medicininių šaltinių, nuo pat pradžių yra kitoje padėtyje nei tas, kuris informacijos ieško mažiau paplitusia kalba. Ši nelygybė nėra nauja – ji egzistavo dar tada, kai medicina buvo perduodama ranka rašytais tekstais, ir išliko net po to, kai atsirado spauda, o vėliau – internetas.

Tačiau internetas situaciją pakeitė iš esmės, nors ir ne taip, kaip daugelis tikėjosi. Informacijos kiekis išaugo astronomiškai, tačiau jos pasiskirstymas pagal kalbas liko labai nevienodas. Remiantis įvairiais tyrimais, anglų kalba internete dominuoja neproporcingai – apie 55–60 procentų viso turinio yra anglų kalba, nors anglakalbiai sudaro tik maždaug 16 procentų pasaulio gyventojų. Medicininė informacija šiuo atžvilgiu nėra išimtis: didžioji dalis kokybiškų šaltinių, klinikinių rekomendacijų, pacientų edukacijos medžiagos yra anglų, vokiečių, prancūzų ar ispanų kalbomis.

Štai čia ir atsiranda automatinių vertėjų vaidmuo. Jie nėra tobuli, bet jie egzistuoja, jie yra nemokami ir prieinami kone bet kur, kur yra interneto ryšys. Ir tai jau savaime yra revoliucija.

Kaip veikia šiuolaikiniai mašininio vertimo įrankiai

Norint suprasti, ką automatiniai vertėjai gali ir ko negali, verta bent trumpai pažvelgti į tai, kaip jie iš tikrųjų veikia. Senesnės kartos vertimo sistemos – vadinamosios taisyklėmis grįstos sistemos – dirbo pagal iš anksto sudarytus gramatinius šablonus ir žodynus. Jos buvo lėtos, nelanksčios ir dažnai generuodavo tekstą, kuris buvo suprantamas tik iš dalies.

Šiuolaikiniai įrankiai, tokie kaip „Google Translate”, „DeepL” ar „Microsoft Translator”, veikia visiškai kitaip. Jie naudoja neuroninius tinklus ir giluminio mokymosi algoritmus, apmokomus ant milžiniškų tekstų korpusų. Sistema mokosi ne taisyklių, o dėsningumų – ji analizuoja, kaip žmonės iš tikrųjų vartoja kalbą, ir mokosi atkurti tuos pačius dėsningumus kitoje kalboje. Rezultatas yra žymiai natūralesnė, sklandesnė kalba, kuri daugeliu atvejų atrodo kaip žmogaus parašytas tekstas.

Tačiau yra svarbus niuansas: šios sistemos mokosi iš to, kas yra internete. O internete yra ir klaidų, ir šališkumo, ir netikslumų. Medicinos srityje tai ypač svarbu, nes terminija yra labai specifinė, kontekstas – kritiškai svarbus, o klaida gali turėti realių pasekmių žmogaus sveikatai. „DeepL” šiuo metu laikomas vienu tiksliausių vertėjų, ypač Europos kalbų porose, tačiau net ir jis susiduria su sunkumais verčiant retų ligų terminus, vietinės medicinos tradicijos sąvokas ar kontekstualiai sudėtingus nurodymus.

Realus poveikis – kas iš tikrųjų pasikeičia pacientams

Teoriniai svarstymai apie mašininį vertimą yra viena, bet konkretus poveikis žmonių gyvenimams – visai kitas dalykas. Ir čia verta kalbėti konkrečiai.

Pirmiausia – migrantai ir pabėgėliai. Žmogus, atvykęs į naują šalį ir dar nemokantis vietinės kalbos, susiduria su sveikatos sistema, kuri jam yra visiškai nepažįstama. Jis negali perskaityti vaistų instrukcijų, nesupranta gydytojo rekomendacijų, nežino, kaip interpretuoti tyrimo rezultatus. Automatinis vertėjas šioje situacijoje nėra tobulas sprendimas, bet jis yra kažkas – ir tas „kažkas” gali reikšti skirtumą tarp tinkamo ir netinkamo gydymo.

Antra – kaimo vietovių gyventojai besivystančiose šalyse. Daugelyje Afrikos, Azijos ar Lotynų Amerikos regionų medicininė informacija vietinėmis kalbomis yra labai ribota. Žmogus, kalbantis suahilių, jorubų ar quechua kalba, iki šiol turėjo labai mažai galimybių gauti kokybiškos sveikatos informacijos savo kalba. Šiuolaikiniai vertėjai, nors ir netobulai, šią spragą bent iš dalies užpildo.

Trečia – lėtinėmis ligomis sergantys žmonės, kurie aktyviai ieško informacijos apie savo būklę. Diabetu, vėžiu, autoimuninėmis ligomis sergantys pacientai dažnai yra labai motyvuoti ieškoti naujausių tyrimų, klinikinių bandymų, alternatyvių gydymo metodų. Jei šie tyrimai yra anglų kalba, o pacientas kalba lietuviškai ar rumuniškai, automatinis vertėjas tampa jo pagrindiniu tiltu į šią informaciją.

Kur sistema klumpa – medicinos vertimo spąstai

Būtų neatsakinga kalbėti apie automatinių vertėjų naudą, nepaminėjus jų trūkumų. O medicinos srityje šie trūkumai yra ypač svarbūs.

Viena didžiausių problemų – medicininė terminija. Medicinos kalba yra labai specifinė, ir daugelis terminų neturi tiesioginių atitikmenų kitose kalbose. Pavyzdžiui, angliškas terminas „breakthrough pain” lietuviškai turėtų būti verčiamas kaip „proveržio skausmas” arba „laikotarpio skausmas”, tačiau automatinis vertėjas gali išversti pažodžiui ir sukurti nesuprantamą ar klaidinantį tekstą. Dar sudėtingiau yra su farmakologiniais terminais, dozavimo instrukcijomis ar procedūrų aprašymais.

Antra problema – kultūrinis kontekstas. Sveikatos informacija nėra kultūriškai neutrali. Tai, kaip kalbama apie kūną, ligą, mirtį, skausmą – visa tai yra kultūriškai sąlygota. Automatinis vertėjas gali tiksliai išversti žodžius, bet prarasti kultūrinį kontekstą, kuris yra esminis norint, kad informacija būtų suprantama ir priimtina.

Trečia – nuorodos į sistemas ir institucijas. Medicininiai tekstai dažnai nurodo konkrečias institucijas, draudimo sistemas, receptų išrašymo procedūras. Šios nuorodos, išverstos į kitą kalbą, gali tapti visiškai beprasmės arba, dar blogiau, klaidinančios.

Ketvirta – klaidos, kurios atrodo teisingai. Tai galbūt pavojingiausia problema. Šiuolaikiniai vertėjai generuoja sklandų, natūraliai skambantį tekstą, kuris gali atrodyti patikimas net tada, kai yra klaidingas. Žmogus, skaitantis prastai išverstą tekstą, bent jau žino, kad kažkas negerai. Sklandžiai, bet klaidingai išverstas tekstas gali suklaidinti net ir kritiškai mąstantį skaitytoją.

Tyrimai kalba: ką rodo moksliniai duomenys

Akademinė bendruomenė šią temą tiria jau keletą metų, ir rezultatai yra nevienareikšmiai – tačiau tai ir yra tikroji situacija, o ne jos supaprastinimas.

2019 metais žurnale „JAMA Internal Medicine” publikuotas tyrimas analizavo „Google Translate” tikslumą verčiant pacientų išrašus iš anglų kalbos į ispanų, kinų, korėjiečių ir portugaliečių kalbas. Rezultatai parodė, kad kliniškai reikšmingų klaidų dažnis svyravo nuo 2 iki 8 procentų, priklausomai nuo kalbos poros. Tai gali skambėti nedaug, tačiau kontekste, kur klaida gali reikšti netinkamą vaistų dozę ar praleistą alergiją, net ir 2 procentai yra per daug.

Kita vertus, 2021 metais atliktas tyrimas, nagrinėjęs COVID-19 informacijos vertimą į kelias kalbas, parodė, kad „DeepL” ir „Google Translate” daugeliu atvejų perteikė esmines rekomendacijas teisingai, net jei stilistiškai tekstas nebuvo tobulas. Tyrėjai padarė išvadą, kad automatinis vertimas gali būti vertingas įrankis krizinės sveikatos komunikacijos metu, kai greitis ir prieinamumas yra svarbiau nei absoliutus tikslumas.

Svarbu ir tai, kad vertimo kokybė labai skiriasi priklausomai nuo kalbos poros. Anglų–prancūzų ar anglų–vokiečių vertimas yra žymiai tikslesnis nei, pavyzdžiui, anglų–suahilių ar anglų–jorubų. Tai reiškia, kad automatinio vertimo nauda nėra vienodai paskirstyta – ji labiau pasiekia tuos, kurie kalba didesnėmis, geriau reprezentuotomis kalbomis.

Sveikatos priežiūros sistemų atsakas – kaip institucijos reaguoja

Sveikatos priežiūros institucijos visame pasaulyje pamažu pradeda integruoti automatinį vertimą į savo darbo procesus, tačiau tai vyksta labai nevienodai.

Jungtinėse Valstijose kai kurios ligoninės jau naudoja automatinio vertimo sistemas kaip papildomą priemonę, kai nėra galimybės pasitelkti žmogaus vertėjo. Tačiau tai paprastai yra tik laikina priemonė – oficiali pozicija išlieka ta, kad kliniškai svarbūs pokalbiai turi vykti su sertifikuotu medicinos vertėju. Ši pozicija yra teisinga, tačiau ji ignoruoja realybę, kurioje sertifikuoti vertėjai yra brangūs, ne visada prieinami ir neegzistuoja daugeliui retesnių kalbų.

Pasaulio sveikatos organizacija (PSO) ir kitos tarptautinės institucijos vis aktyviau naudoja automatinį vertimą platindamos visuomenės sveikatos informaciją. COVID-19 pandemija šiuo atžvilgiu buvo savotiškas katalizatorius – poreikis greitai perduoti gyvybiškai svarbią informaciją daugeliu kalbų privertė institucijas pasitelkti automatinį vertimą kaip pagalbinę priemonę, net ir žinant jo ribotumą.

Lietuva šiame kontekste yra įdomi – kaip maža šalis su specifine kalba, ji yra ir automatinio vertimo naudotoja (lietuviai dažnai verčia informaciją iš didesnių kalbų), ir jo auka (informacija apie Lietuvos sveikatos sistemą kitomis kalbomis dažnai yra prastai išversta arba jos apskritai nėra). Lietuvos sveikatos apsaugos ministerija kol kas neturi aiškios strategijos šioje srityje, nors migrantų ir užsieniečių skaičius šalyje auga.

Praktinės rekomendacijos – kaip naudotis automatiniais vertėjais atsakingai

Kadangi automatiniai vertėjai yra realybė ir jie niekur nedings, svarbiau ne diskutuoti, ar juos naudoti, bet kaip juos naudoti atsakingai. Ir čia galima pateikti konkrečių, praktiškai naudingų rekomendacijų.

Pacientams ir informacijos ieškotojams:

Pirmiausia – niekada nepriimkite svarbių medicininių sprendimų remdamiesi tik automatiškai išverstu tekstu. Jei informacija yra kritiškai svarbi – apie vaistų dozavimą, chirurgines procedūras, alergines reakcijas – ieškokite patvirtinimo iš kito šaltinio arba pasitarkite su sveikatos priežiūros specialistu. Automatinis vertimas gali būti puikus pradinis žingsnis, bet ne galutinis atsakymas.

Antra – naudokite kelis vertėjus ir palyginkite rezultatus. Jei „Google Translate” ir „DeepL” pateikia skirtingus vertimus, tai yra signalas, kad tekstas yra sudėtingas arba dviprasmiškas. Tokiu atveju reikia papildomų šaltinių.

Trečia – atkreipkite dėmesį į skaičius. Dozavimas, laikas, dažnumas – šie elementai turi būti ypač atidžiai patikrinti, nes net ir nedidelė klaida čia gali turėti rimtų pasekmių.

Ketvirta – ieškokite vizualios informacijos. Medicininiai paveikslėliai, schemos, vaizdo įrašai dažnai perteikia informaciją geriau nei tekstas, ir jie nereikalauja vertimo.

Sveikatos priežiūros specialistams:

Automatinis vertimas gali būti naudingas pirminis kontaktas su pacientu, kuris nemoka jūsų kalbos – jis gali padėti suprasti pagrindinę problemą ir nustatyti, ar reikia profesionalaus vertėjo. Tačiau kliniškai svarbūs pokalbiai – apie diagnozę, gydymo planą, sutikimą dėl procedūrų – turi vykti su kvalifikuotu vertėju.

Taip pat verta žinoti, kad kai kurios platformos, pavyzdžiui, „DeepL Pro” ar specializuoti medicinos vertimo įrankiai, yra tikslesni nei bendrieji vartotojams skirti įrankiai. Jei jūsų institucija reguliariai dirba su daugiakalbiais pacientais, investicija į geresnį įrankį gali atsipirkti.

Politikos formuotojams:

Automatinis vertimas turėtų būti integruotas į platesnę sveikatos priežiūros prieinamumo strategiją, o ne traktuojamas kaip atskiras technologinis sprendimas. Tai reiškia: finansuoti profesionalų medicinos tekstų vertimą į dažniausiai vartojamas kalbas, naudoti automatinį vertimą kaip papildomą priemonę, o ne kaip pagrindą, ir reguliariai tikrinti automatiškai išverstų tekstų kokybę.

Ateitis, kurioje kalba nebėra kliūtis – ar tai įmanoma?

Technologijų raida šioje srityje yra greita. Dar prieš penkerius metus „Google Translate” kokybė buvo žymiai prastesnė nei šiandien. Dirbtinis intelektas, ypač didelių kalbų modeliai, atveria naujas galimybes – ne tik versti tekstą, bet ir adaptuoti jį kultūriškai, supaprastinti sudėtingą medicininę kalbą, pritaikyti prie skirtingų auditorijų.

Jau dabar kuriami specializuoti medicinos vertimo modeliai, apmokyti ant medicininių tekstų korpusų ir tikrinami medicinos specialistų. Tokios iniciatyvos kaip „BioNLP” bendruomenė ar specializuoti klinikiniai vertimo įrankiai rodo, kad sritis juda teisinga kryptimi. Tačiau iki to laiko, kai automatinis medicinos vertimas bus pakankamai patikimas, kad galėtume juo visiškai pasitikėti, praeis dar nemažai laiko.

Svarbiausia, ko neturėtume daryti – tai laukti tobulo sprendimo ir nieko nedaryti tuo tarpu. Automatiniai vertėjai jau dabar keičia sveikatos informacijos prieinamumą – kartais gerai, kartais ne taip gerai. Mūsų užduotis yra suprasti šiuos įrankius, naudoti juos atsakingai ir kartu dirbti ties tuo, kad jie taptų geresni. Nes pasaulyje, kuriame žmogus negali gauti gyvybiškai svarbios informacijos vien dėl to, kad gimė kalbantis kita kalba, kažkas yra iš esmės neteisinga – ir technologija, net ir netobula, yra viena iš priemonių šią neteisybę mažinti.