Natūraliosiosios kalbos apdorojimas Natural language processing lingvistikos ir informatikos sandūroje esanti disciplina
Natūralios kalbos apdorojimas

Natūraliosiosios kalbos apdorojimas (Natural language processing) – lingvistikos ir informatikos sandūroje esanti disciplina, tirianti informacinių technologijų ir kompiuterinių programų pritaikymo visoms natūraliosios kalbos naudojimo sritims galimybes. Tarp taikymo sričių yra:
- Teksto skaitymas (įgarsinimas)
- Automatinis vertimas
- automatinis teksto taisymas
- informacijos paieška
- automatinis tekstų kūrimas
- skaitomo teksto atpažinimas.
Pradinės sistemos kaip , dirbančios „ribotame pasaulyje“ su ribotu žodynu, dirbo puikiai, suteikdamos mokslininkams optimizmo, kuris buvo nuslopintas, kai sistemos buvo praplėstos iki realesnių bei sudėtingesnių gyvenimiškų situacijų.
Natūralios kalbos suvokimui priskiriamos labai sudėtingoms problemoms, kurias galėtų spręsti tik dirbtinio intelekto sistemos (), dėl to, kad natūralios kalbos atpažinimas reikalauja gilių žinių apie išorinį pasaulį ir galimybės juo manipuliuoti. „Suvokimo“ apibrėžimas yra viena iš esminių natūralios kalbos apdorojimo problemų.
Kelių problemų pavyzdžiai, su kuriais susiduria natūralios kalbos apdorojimo sistemos:
- Sakiniai Mes davėme beždžionėms kriaušių, nes jos buvo alkanos. ir Mes davėme beždžionėms kriaušių, nes jos buvo persirpusios. turi vienodą gramatinę struktūrą, tačiau pirmame sakinyje jos nurodo į beždžiones, o antrame jos nurodo į kriaušes, todėl sakinys negali būti suprastas teisingai nežinant kriaušių ir beždžionių savybių ir elgesio.
Problemos, darančios natūralios kalbos apdorojimą sudėtingu
- Žodžių ribų atpažinimas
- Kalbant, žodžiai dažnai nėra atskiriami vienas nuo kito; kur atskirti žodžius dažnai priklauso nuo to, kuris pasirinkimas tinka labiau gramatiškai ir pagal kontekstą
- Žodžių įvairiaprasmiškumas
- Daugelis žodžių turi daugiau kaip vieną reikšmę; mes turime pasirinkti tokią reikšmę, kuri labiausiai tinka pagal kontekstą.
- Sintaksinis įvairiaprasmiškumas
- Natūralios kalbos gramatika nėra vienareikšmiška. Tam tikram sakiniui gali būti sugeneruoti keli apdorojimo medžiai. Tinkamiausio pasirinkimas dažniausiai reikalauja semantinės bei kontekstinės informacijos.
- Klaidingas arba nenumatytas įvedimas
- Užsieniečio akcentas arba regioninė tarmė, spausdinimo arba gramatinės klaidos. klaidos.
- Reiškinių konstatavimas ir sakymų planai
- Dažnai sakinių reikšmė yra netiesioginė. Pavyzdžiui, normali reakcija į sakinį „Ar galite paduoti puoduką?“ yra paduoti puoduką, nekorektiška būtų tiesiog atsakyti „taip“, šiek tiek tinkamesnis yra paneigimas „ne“. Dar geriau paneigimą išreikšti sakiniu „Ne, deja, aš jo nematau.“
Statistinis natūralios kalbos apdorojimas
Statistinis natūralios kalbos apdorojimas naudoja , tikimybinį ir statistinį metodus sprendžiant aukščiau aprašytas problemas, ypač tas, kurios kyla apdorojant ilgus nevienareikšmiškus sakinius dėl ko apdorojimo kelių gali būti šimtai ar tūkstančiai. Tinkamiausiai reikšmei nusatyti dažnai naudojami (corpora) ir .
Statistinio natūralios kalbos apdorojimo technologija iš esmės išplaukia iš sistemos mokymosi ir (data mining), kurios abi yra dirbtinio intelekto sritys tiriančios mokymąsi.
Nuorodos
Angliškai
- A.L.I.C.E – bendravimo sistema
- Natūralios kalbos apdorojimas Archyvuota kopija 2005-11-10 iš Wayback Machine projekto.
Autorius: www.NiNa.Az
Išleidimo data:
vikipedija, wiki, lietuvos, knyga, knygos, biblioteka, straipsnis, skaityti, atsisiųsti, nemokamai atsisiųsti, mp3, video, mp4, 3gp, jpg, jpeg, gif, png, pictu, mobilusis, porn, telefonas, android, iOS, apple, mobile telefl, samsung, iPhone, xiomi, xiaomi, redmi, pornografija, honor, oppo, Nokia, Sonya, mi, pc, web, kompiuteris, Informacija apie Natūralios kalbos apdorojimas, Kas yra Natūralios kalbos apdorojimas? Ką reiškia Natūralios kalbos apdorojimas?
Naturaliosiosios kalbos apdorojimas Natural language processing lingvistikos ir informatikos sanduroje esanti disciplina tirianti informaciniu technologiju ir kompiuteriniu programu pritaikymo visoms naturaliosios kalbos naudojimo sritims galimybes Tarp taikymo sriciu yra Teksto skaitymas įgarsinimas Automatinis vertimas automatinis teksto taisymas informacijos paieska automatinis tekstu kurimas skaitomo teksto atpazinimas Pradines sistemos kaip dirbancios ribotame pasaulyje su ribotu zodynu dirbo puikiai suteikdamos mokslininkams optimizmo kuris buvo nuslopintas kai sistemos buvo praplestos iki realesniu bei sudetingesniu gyvenimisku situaciju Naturalios kalbos suvokimui priskiriamos labai sudetingoms problemoms kurias galetu spresti tik dirbtinio intelekto sistemos del to kad naturalios kalbos atpazinimas reikalauja giliu ziniu apie isorinį pasaulį ir galimybes juo manipuliuoti Suvokimo apibrezimas yra viena is esminiu naturalios kalbos apdorojimo problemu Keliu problemu pavyzdziai su kuriais susiduria naturalios kalbos apdorojimo sistemos Sakiniai Mes daveme bezdzionems kriausiu nes jos buvo alkanos ir Mes daveme bezdzionems kriausiu nes jos buvo persirpusios turi vienoda gramatine struktura taciau pirmame sakinyje jos nurodo į bezdziones o antrame jos nurodo į kriauses todel sakinys negali buti suprastas teisingai nezinant kriausiu ir bezdzioniu savybiu ir elgesio Problemos darancios naturalios kalbos apdorojima sudetinguZodziu ribu atpazinimas Kalbant zodziai daznai nera atskiriami vienas nuo kito kur atskirti zodzius daznai priklauso nuo to kuris pasirinkimas tinka labiau gramatiskai ir pagal kontekstaZodziu įvairiaprasmiskumas Daugelis zodziu turi daugiau kaip viena reiksme mes turime pasirinkti tokia reiksme kuri labiausiai tinka pagal konteksta Sintaksinis įvairiaprasmiskumas Naturalios kalbos gramatika nera vienareiksmiska Tam tikram sakiniui gali buti sugeneruoti keli apdorojimo medziai Tinkamiausio pasirinkimas dazniausiai reikalauja semantines bei kontekstines informacijos Klaidingas arba nenumatytas įvedimas Uzsieniecio akcentas arba regionine tarme spausdinimo arba gramatines klaidos klaidos Reiskiniu konstatavimas ir sakymu planai Daznai sakiniu reiksme yra netiesiogine Pavyzdziui normali reakcija į sakinį Ar galite paduoti puoduka yra paduoti puoduka nekorektiska butu tiesiog atsakyti taip siek tiek tinkamesnis yra paneigimas ne Dar geriau paneigima isreiksti sakiniu Ne deja as jo nematau Statistinis naturalios kalbos apdorojimasStatistinis naturalios kalbos apdorojimas naudoja tikimybinį ir statistinį metodus sprendziant auksciau aprasytas problemas ypac tas kurios kyla apdorojant ilgus nevienareiksmiskus sakinius del ko apdorojimo keliu gali buti simtai ar tukstanciai Tinkamiausiai reiksmei nusatyti daznai naudojami corpora ir Statistinio naturalios kalbos apdorojimo technologija is esmes isplaukia is sistemos mokymosi ir data mining kurios abi yra dirbtinio intelekto sritys tiriancios mokymasi NuorodosAngliskai A L I C E bendravimo sistema Naturalios kalbos apdorojimas Archyvuota kopija 2005 11 10 is Wayback Machine projekto