Vertimo atmintis VA angl translation memory TM duomenų bazės tipas naudojamas programinėje įrangoje padedančioje žmogui
Vertimo atmintis

Vertimo atmintis (VA) (angl. translation memory, TM) – duomenų bazės tipas, naudojamas programinėje įrangoje, padedančioje žmogui versti tekstus. Programos, naudojančios vertimo atmintį, yra žinomos kaip vertimo atminties sistemos (angl. translation memory systems, TMs).
Vertimo atmintis yra dažniausiai naudojama kartu su kita kompiuterio įranga bei ištekliais: su mašininio vertimo sistemomis, , daugiakalbiais žodynais, kokybės užtikrinimo sistemomis ir kt.
Vertimo atmintis sudaryta iš teksto segmentų originalo kalba ir jų vertimo į kelias kitas kalbas. Tie segmentai gali būti išdėstyti blokais, paragrafais, sakiniais arba frazėmis. Atskiri žodžiai yra terminų bazės dalis ir dėl to nepriklauso vertimo atminčiai.
Vertimo atmintis palengvina ir pagreitina darbą. Tyrimai parodė, kad didelė dalis profesionalių vertėjų naudoja vertimo atmintis.
Vertimo atminčių naudojimas
VA sistema originalo tekstą (t. y. tekstą, kuris bus verčiamas) suskaido į segmentus ir tada ieško tokių pačių arba panašių segmentų vertimo atmintyje. Sutampantys arba panašūs sakiniai yra pateikiami vertėjui kaip galimi vertimo vienetai. Vertėjas gali priimti siūlomą vertimo vienetą, pakeisti jį nauju vertimu ar modifikuoti jį taip, kad atitiktų originalą. Naujas arba pakeistas vertimas papildo vertimo atmintį.
Kai kurios VA sistemos ieško tik visiškų atitikimų (angl. exact match); tai reiškia, kad jos gali rasti tik tuos teksto segmentus, kurie tiksliai atitinka segmentus esančius duomenų bazėje. Kitos VA sistemos naudoja apytikslio atitikimo (angl. fuzzy match) algoritmus tam, kad rastų panašius segmentus, kurie pateikiami vertėjui su pažymėtais skirtumais.
Segmentus, kuriems nerastas atitikmuo, turės išversti pats vertėjas. Šie naujai išversti segmentai įkeliami į duomenų bazę, kur galės būti naudojami vertimams ateityje, taip pat ir to segmento pasikartojimams dabartiniame tekste.
Vertimo atmintys geriausiai veikia labai tekstuose, kuriuose yra daug pasikartojimų, pvz., techniniuose žinynuose. Taip pat jie naudingi verčiant pavienius segmentus seniau išverstame dokumente, pvz., verčiant šiek tiek pakeistą ataskaitos versiją.
Tradiciškai VA nelaikomos tinkamomis versti grožiniams tekstams dėl paprastos priežasties: juose yra mažai pasikartojimų. Vis dėlto, kiti įžvelgia VA naudą net ir tekstuose su mažai pasikartojimų, nes sukurti duomenų bazės resursai yra naudingi konkordanso paieškai, nustatant tinkamą terminų vartojimą, siekiant užtikrinti kokybę (kad neliktų tuščių segmentų) ir peržiūros procesui supaprastinti (originalo ir verčiamo teksto segmentai visada rodomi drauge).
Pagrindinė nauda
VA įrankiai tinkamiausi versti techninę dokumentaciją ir dokumentus, kuriuose yra specializuotos leksikos. Jų privalumai:
- Užtikrinama, kad dokumentas yra visiškai išverstas (vertimo atmintys nepriima tuščių verčiamų segmentų).
- Užtikrinama, jog išversti dokumentai yra nuoseklūs, įskaitant bendruosius apibrėžimus, formuluotes ir terminologiją. Tai svarbu, kai skirtingi vertėjai dirba prie vieno projekto.
- Leidžia vertėjams versti įvairių formatų dokumentus, neturint programinės įrangos, paprastai reikalingos tokiems formatams tvarkyti.
- Paspartina bendrą vertimo procesą; kadangi vertimo atmintys „prisimena“ anksčiau išverstą medžiagą, vertėjai turi ją išversti tik vieną kartą.
- Sumažina ilgalaikių vertimo projektų kainą; pavyzdžiui, instrukcijos, įspėjamieji pranešimai ar ataskaitos išverčiami tik vieną kartą ir gali būti naudojami kelis kartus.
- Dėl VA sistemos naudojimo (laiko ar pinigų) sąnaudų sumažėjimas verčiant didelius dokumentus gali būti akivaizdus net ir pirmame naujo projekto vertime, bet paprastai sąnaudų sumažėjimas pastebimas verčiant vėlesnes projekto versijas, kurios buvo prieš tai išverstos naudojant VA.
Pagrindinės problemos
Žemiau išvadinamos pagrindinės problemos, trukdančios plačiau naudoti VA įrankius:
- Sąvoka „vertimo atmintis“ yra grindžiama prielaida, kad sakiniai, pavartoti ankstesniuose vertimuose, gali būti „pakartotinai pavartoti“. Tačiau pagrindinis vertimo principas yra tas, kad vertėjas turi išversti teksto turinį, o ne jį sudarančius sakinius.
- VA įrankiai nelengvai atitinka esamus vertimo ar lokalizacijos procesus. Norint panaudoti VA technologiją, vertimo procesai turi būti pertvarkomi.
- VA įrankiai šiuo metu nepalaiko visų dokumentų formatų ir ne visuose failų tipuose egzistuoja filtrai.
- Darbo su VA sistemomis mokymosi pradžia būna sudėtinga.
- Tais atvejais, kai visas ar dalis vertimo proceso yra užsakomas arba tvarkomas laisvai samdomų vertėjų, jiems tenka suteikti programinę įrangą ir techninį palaikymą, kad jie galėtų dirbti su vertimo atminčių sistemomis.
- Daugelio VA sistemų pilnos versijos yra gana brangios. Vadinasi, norint jas naudoti gali prireikti nemažų investicijų. Vis dėlto, kai kurie gamintojai pateikia nemokamas arba nebrangias savo įrankių su ribotais funkcijų nustatymais versijas, kad pavieniai vertėjai galėtų jas naudoti. Yra nemokamų VA sistemų, tačiau nė viena iš jų dar neužėmė didesnės rinkos dalies.
- Vartotojo ankstesnių vertimų paruošimo, įtraukimo į VA duomenų bazę išlaidos, taip pat bet kokie kiti papildomi priedai gali reikalauti nemažų investicijų.
- VA duomenų bazių palaikymas vis dar dažniausiai yra techninis procesas, o nesugebėjimas išsaugoti VA gali lemti, kad VA bus mažiau naudojamos, o jų kokybė bus prastesnė.
- Kaip teigta anksčiau, VA įrankiai netinka tekstams, kuriuose nėra pasikartojimų. Techniniai tekstai paprastai geriausiai tinka vertimo atmintims, o rinkodaros ar grožiniai tekstai bus ne tokie tinkami.
Vertimo atmintys ir susiję standartai
TMX
Translation Memory eXchange (TMX) suteikia galimybę vertimų teikėjams keistis vertimo atmintimis. Vertėjų bendruomenėje TMX buvo priimtas kaip geriausias būdas importuoti ir eksportuoti vertimo atmintis. Dabartinė, 1.4b, versija leidžia originalo ir vertimo kalbos dokumentus atkurti iš TMX duomenų.
TBX
TermBase eXchange. Šis LISA standartas, peržiūrėtas ir perleistas kaip ISO 30042, leidžia keistis detalia terminologine ir leksine informacija. TBX struktūra paremta trimis ISO standartais: ISO 12620, ISO 12200 ir ISO 16642. ISO 12620 suteikia aiškų „informacinių kategorijų“ rinkinį su standartizuotais pavadinimais, kurie atlieka informacijos elementų tipų arba iš anksto nustatytų reikšmių funkciją. ISO 12200 (dar žinomas kaip MARTIF) suteikia pagrindą TBX šerdies sąrangai. ISO 16642 (taip pat angliškai vadinamas Terminological Markup Framework) apima struktūrinius terminologijos duomenų aprašymo kalbų metamodelius.
UTX
Universal Terminology exchange (UTX) standartas sukurtas specialiai automatinio vertimo žodynams, tačiau jį galima naudoti ir bendriems, visiems prieinamiems specializuotiems žodynams. Itin paprastomis ir praktinėmis specifikacijomis pasižyminčio UTX tikslas yra spartinti dalijimąsi žodynais ir jų pakartotinį naudojimą.
SRX
Segmentation Rules eXchange (SRX) skirtas patobulinti TMX standartą taip, kad būtų galima efektyviau naudoti tarp aplikacijų pasidalytais VA duomenimis. Gebėjimas tiksliai apibrėžti ankstesniame vertime naudotas segmentacijos taisykles gali padidinti pasiekiamą programos veiksmingumą.
GMX
GILT rodikliai (angl. GILT metrics). GILT (globalizacija, internacionalizacija, lokalizacija ir vertimas) rodikliai susideda iš trijų dalių: apimties rodikliams skirtos GMX-V, sudėtingumo rodikliams skirtos GMX-C, o kokybės rodiklius pateikia GMX-Q. Pasiūlyti GILT rodiklių standartai turi apskaičiuoti kiekvienos GILT užduoties darbo krūvį ir kokybės reikalavimus.
OLIF
Open Lexicon Interchange standartas. OLIF yra atvirojo kodo, su XML suderinamas standartas, skirtas keistis terminologiniais ir leksiniais duomenimis. Nors iš pradžių buvo sumanytas kaip priemonė keistis duomenimis tarp privačių automatinio vertimo leksikonų, bet vėliau jis išplėtotas kaip ne toks specializuotas terminologinių duomenų mainų standartas.
XLIFF
XML Localistion Interchange File Format (XLIFF) tikslas suteikti vieną pakeičiamą dokumentų standartą, kurį suprastų bet kuris lokalizacijos teikėjas. XLIFF yra vertimo industrijoje populiariausias XML formato duomenų apsikeitimo būdas.
TransWS
Translation Web paslaugos. TransWS tenkina poreikį naudoti interneto paslaugas su lokalizacijos projektais susijusių failų ir žinučių pateikimui bei paieškai. Tai yra detali dabartinių lokalizacijos procesų automatizavimo sistema, pasitelkianti internetines paslaugas.
xml:tm formatas
XML formato VA grindžiamos teksto atminties konceptu, apimančiu autoriaus ir vertimo atmintį. XML-INTL šį teksto atminties standartą perdavė Lisa OSCAR.
PO
Gettext Portable Object standartas. Nors dažnai nelaikomi VA standartu, Gettext PO dokumentai yra dvikalbiai ir lygiai taip pat naudojami vertimo atmintyse. PO paprastai susideda iš įvairių atskirų failų katalogo medžio struktūroje. Tarp įprastai šiuos failus apdorojančių įrankių yra GNU Gettext Tools ir Translate Toolkit. Taip pat egzistuoja dar kelios programos, kurios PO failus apdoroja tarsi jie būtų gryni originalo teksto failai.
Toliau žiūrėti
- Automatizuotas vertimas
- Lokalizacija
- Tekstynas
- Vertimas
Išnašos
- Elina Lagoudaki (2006), "Translation Memory systems: Enlightening users' perspective. Key finding of the TM Survey 2006 carried out during July and August 2006. (Imperial College London, Translation Memories Survey 2006), p.16 „Archived copy“ (PDF). Suarchyvuotas originalas (PDF) 2007-03-25. Nuoroda tikrinta 2007-03-25.
{{cite web}}
: CS1 priežiūra: archived copy as title (link)
Nuorodos
- DGT Translation Memory – laisvai prieinama ES dokumentų teisinės bazės (Acquis Communautaire) vertimo atmintis. Vertimo atmintis sudaryta 24 ES kalbų lygiagretūs tekstai.
Autorius: www.NiNa.Az
Išleidimo data:
vikipedija, wiki, lietuvos, knyga, knygos, biblioteka, straipsnis, skaityti, atsisiųsti, nemokamai atsisiųsti, mp3, video, mp4, 3gp, jpg, jpeg, gif, png, pictu, mobilusis, porn, telefonas, android, iOS, apple, mobile telefl, samsung, iPhone, xiomi, xiaomi, redmi, pornografija, honor, oppo, Nokia, Sonya, mi, pc, web, kompiuteris, Informacija apie Vertimo atmintis, Kas yra Vertimo atmintis? Ką reiškia Vertimo atmintis?
Vertimo atmintis VA angl translation memory TM duomenu bazes tipas naudojamas programineje įrangoje padedancioje zmogui versti tekstus Programos naudojancios vertimo atmintį yra zinomos kaip vertimo atminties sistemos angl translation memory systems TMs Vertimo atmintis yra dazniausiai naudojama kartu su kita kompiuterio įranga bei istekliais su masininio vertimo sistemomis daugiakalbiais zodynais kokybes uztikrinimo sistemomis ir kt Vertimo atmintis sudaryta is teksto segmentu originalo kalba ir ju vertimo į kelias kitas kalbas Tie segmentai gali buti isdestyti blokais paragrafais sakiniais arba frazemis Atskiri zodziai yra terminu bazes dalis ir del to nepriklauso vertimo atminciai Vertimo atmintis palengvina ir pagreitina darba Tyrimai parode kad didele dalis profesionaliu verteju naudoja vertimo atmintis Vertimo atminciu naudojimasVA sistema originalo teksta t y teksta kuris bus verciamas suskaido į segmentus ir tada iesko tokiu paciu arba panasiu segmentu vertimo atmintyje Sutampantys arba panasus sakiniai yra pateikiami vertejui kaip galimi vertimo vienetai Vertejas gali priimti siuloma vertimo vieneta pakeisti jį nauju vertimu ar modifikuoti jį taip kad atitiktu originala Naujas arba pakeistas vertimas papildo vertimo atmintį Kai kurios VA sistemos iesko tik visisku atitikimu angl exact match tai reiskia kad jos gali rasti tik tuos teksto segmentus kurie tiksliai atitinka segmentus esancius duomenu bazeje Kitos VA sistemos naudoja apytikslio atitikimo angl fuzzy match algoritmus tam kad rastu panasius segmentus kurie pateikiami vertejui su pazymetais skirtumais Segmentus kuriems nerastas atitikmuo tures isversti pats vertejas Sie naujai isversti segmentai įkeliami į duomenu baze kur gales buti naudojami vertimams ateityje taip pat ir to segmento pasikartojimams dabartiniame tekste Vertimo atmintys geriausiai veikia labai tekstuose kuriuose yra daug pasikartojimu pvz techniniuose zinynuose Taip pat jie naudingi verciant pavienius segmentus seniau isverstame dokumente pvz verciant siek tiek pakeista ataskaitos versija Tradiciskai VA nelaikomos tinkamomis versti groziniams tekstams del paprastos priezasties juose yra mazai pasikartojimu Vis delto kiti įzvelgia VA nauda net ir tekstuose su mazai pasikartojimu nes sukurti duomenu bazes resursai yra naudingi konkordanso paieskai nustatant tinkama terminu vartojima siekiant uztikrinti kokybe kad neliktu tusciu segmentu ir perziuros procesui supaprastinti originalo ir verciamo teksto segmentai visada rodomi drauge Pagrindine naudaVA įrankiai tinkamiausi versti technine dokumentacija ir dokumentus kuriuose yra specializuotos leksikos Ju privalumai Uztikrinama kad dokumentas yra visiskai isverstas vertimo atmintys nepriima tusciu verciamu segmentu Uztikrinama jog isversti dokumentai yra nuoseklus įskaitant bendruosius apibrezimus formuluotes ir terminologija Tai svarbu kai skirtingi vertejai dirba prie vieno projekto Leidzia vertejams versti įvairiu formatu dokumentus neturint programines įrangos paprastai reikalingos tokiems formatams tvarkyti Paspartina bendra vertimo procesa kadangi vertimo atmintys prisimena anksciau isversta medziaga vertejai turi ja isversti tik viena karta Sumazina ilgalaikiu vertimo projektu kaina pavyzdziui instrukcijos įspejamieji pranesimai ar ataskaitos isverciami tik viena karta ir gali buti naudojami kelis kartus Del VA sistemos naudojimo laiko ar pinigu sanaudu sumazejimas verciant didelius dokumentus gali buti akivaizdus net ir pirmame naujo projekto vertime bet paprastai sanaudu sumazejimas pastebimas verciant velesnes projekto versijas kurios buvo pries tai isverstos naudojant VA Pagrindines problemosZemiau isvadinamos pagrindines problemos trukdancios placiau naudoti VA įrankius Savoka vertimo atmintis yra grindziama prielaida kad sakiniai pavartoti ankstesniuose vertimuose gali buti pakartotinai pavartoti Taciau pagrindinis vertimo principas yra tas kad vertejas turi isversti teksto turinį o ne jį sudarancius sakinius VA įrankiai nelengvai atitinka esamus vertimo ar lokalizacijos procesus Norint panaudoti VA technologija vertimo procesai turi buti pertvarkomi VA įrankiai siuo metu nepalaiko visu dokumentu formatu ir ne visuose failu tipuose egzistuoja filtrai Darbo su VA sistemomis mokymosi pradzia buna sudetinga Tais atvejais kai visas ar dalis vertimo proceso yra uzsakomas arba tvarkomas laisvai samdomu verteju jiems tenka suteikti programine įranga ir techninį palaikyma kad jie galetu dirbti su vertimo atminciu sistemomis Daugelio VA sistemu pilnos versijos yra gana brangios Vadinasi norint jas naudoti gali prireikti nemazu investiciju Vis delto kai kurie gamintojai pateikia nemokamas arba nebrangias savo įrankiu su ribotais funkciju nustatymais versijas kad pavieniai vertejai galetu jas naudoti Yra nemokamu VA sistemu taciau ne viena is ju dar neuzeme didesnes rinkos dalies Vartotojo ankstesniu vertimu paruosimo įtraukimo į VA duomenu baze islaidos taip pat bet kokie kiti papildomi priedai gali reikalauti nemazu investiciju VA duomenu baziu palaikymas vis dar dazniausiai yra techninis procesas o nesugebejimas issaugoti VA gali lemti kad VA bus maziau naudojamos o ju kokybe bus prastesne Kaip teigta anksciau VA įrankiai netinka tekstams kuriuose nera pasikartojimu Techniniai tekstai paprastai geriausiai tinka vertimo atmintims o rinkodaros ar groziniai tekstai bus ne tokie tinkami Vertimo atmintys ir susije standartaiTMX Translation Memory eXchange TMX suteikia galimybe vertimu teikejams keistis vertimo atmintimis Verteju bendruomeneje TMX buvo priimtas kaip geriausias budas importuoti ir eksportuoti vertimo atmintis Dabartine 1 4b versija leidzia originalo ir vertimo kalbos dokumentus atkurti is TMX duomenu TBX TermBase eXchange Sis LISA standartas perziuretas ir perleistas kaip ISO 30042 leidzia keistis detalia terminologine ir leksine informacija TBX struktura paremta trimis ISO standartais ISO 12620 ISO 12200 ir ISO 16642 ISO 12620 suteikia aisku informaciniu kategoriju rinkinį su standartizuotais pavadinimais kurie atlieka informacijos elementu tipu arba is anksto nustatytu reiksmiu funkcija ISO 12200 dar zinomas kaip MARTIF suteikia pagrinda TBX serdies sarangai ISO 16642 taip pat angliskai vadinamas Terminological Markup Framework apima strukturinius terminologijos duomenu aprasymo kalbu metamodelius UTX Universal Terminology exchange UTX standartas sukurtas specialiai automatinio vertimo zodynams taciau jį galima naudoti ir bendriems visiems prieinamiems specializuotiems zodynams Itin paprastomis ir praktinemis specifikacijomis pasizymincio UTX tikslas yra spartinti dalijimasi zodynais ir ju pakartotinį naudojima SRX Segmentation Rules eXchange SRX skirtas patobulinti TMX standarta taip kad butu galima efektyviau naudoti tarp aplikaciju pasidalytais VA duomenimis Gebejimas tiksliai apibrezti ankstesniame vertime naudotas segmentacijos taisykles gali padidinti pasiekiama programos veiksminguma GMX GILT rodikliai angl GILT metrics GILT globalizacija internacionalizacija lokalizacija ir vertimas rodikliai susideda is triju daliu apimties rodikliams skirtos GMX V sudetingumo rodikliams skirtos GMX C o kokybes rodiklius pateikia GMX Q Pasiulyti GILT rodikliu standartai turi apskaiciuoti kiekvienos GILT uzduoties darbo kruvį ir kokybes reikalavimus OLIF Open Lexicon Interchange standartas OLIF yra atvirojo kodo su XML suderinamas standartas skirtas keistis terminologiniais ir leksiniais duomenimis Nors is pradziu buvo sumanytas kaip priemone keistis duomenimis tarp privaciu automatinio vertimo leksikonu bet veliau jis ispletotas kaip ne toks specializuotas terminologiniu duomenu mainu standartas XLIFF XML Localistion Interchange File Format XLIFF tikslas suteikti viena pakeiciama dokumentu standarta kurį suprastu bet kuris lokalizacijos teikejas XLIFF yra vertimo industrijoje populiariausias XML formato duomenu apsikeitimo budas TransWS Translation Web paslaugos TransWS tenkina poreikį naudoti interneto paslaugas su lokalizacijos projektais susijusiu failu ir zinuciu pateikimui bei paieskai Tai yra detali dabartiniu lokalizacijos procesu automatizavimo sistema pasitelkianti internetines paslaugas xml tm formatas XML formato VA grindziamos teksto atminties konceptu apimanciu autoriaus ir vertimo atmintį XML INTL sį teksto atminties standarta perdave Lisa OSCAR PO Gettext Portable Object standartas Nors daznai nelaikomi VA standartu Gettext PO dokumentai yra dvikalbiai ir lygiai taip pat naudojami vertimo atmintyse PO paprastai susideda is įvairiu atskiru failu katalogo medzio strukturoje Tarp įprastai siuos failus apdorojanciu įrankiu yra GNU Gettext Tools ir Translate Toolkit Taip pat egzistuoja dar kelios programos kurios PO failus apdoroja tarsi jie butu gryni originalo teksto failai Toliau ziuretiAutomatizuotas vertimas Lokalizacija Tekstynas VertimasIsnasosElina Lagoudaki 2006 Translation Memory systems Enlightening users perspective Key finding of the TM Survey 2006 carried out during July and August 2006 Imperial College London Translation Memories Survey 2006 p 16 Archived copy PDF Suarchyvuotas originalas PDF 2007 03 25 Nuoroda tikrinta 2007 03 25 a href wiki C5 A0ablonas Cite web title Sablonas Cite web cite web a CS1 prieziura archived copy as title link NuorodosDGT Translation Memory laisvai prieinama ES dokumentu teisines bazes Acquis Communautaire vertimo atmintis Vertimo atmintis sudaryta 24 ES kalbu lygiagretus tekstai