Azərbaycan  AzərbaycanDeutschland  DeutschlandLietuva  Lietuvaශ්‍රී ලංකාව  ශ්‍රී ලංකාවTürkiyə  Türkiyə
Pagalba
www.datawiki.lt-lt.nina.az
  • Pradžia

Blogo simbolio taisyklė arba Boyer Moore algoritmas teksto paieškos ilgoje eilutėje algoritmas Algoritmas ieško palygint

Blogo simbolio taisyklė

  • Pagrindinis puslapis
  • Blogo simbolio taisyklė
Blogo simbolio taisyklė
www.datawiki.lt-lt.nina.azhttps://www.datawiki.lt-lt.nina.az

Blogo simbolio taisyklė (arba Boyer-Moore algoritmas) – teksto paieškos ilgoje eilutėje algoritmas.

Algoritmas ieško palyginti trumpos eilutės kitoje (paprastai daug ilgesnėje) iš anksto nežinomoje eilutėje. Tuo jis skiriasi nuo priesagų medžius naudojančių algoritmų, kuriems ilgąja eilutę reikia žinoti iš anksto – medžiui sukurti.

Klasikinis Boyer-Moore algoritmas remiasi trimis paprastomis taisyklėmis:

  1. Trumpoji eilutė (kurios ieškoma) prieš paiešką analizuojama, sudarant lentelę. Kiekvienai eilutės padėčiai įsimenama, kiek toli į kairę nuo jos eilutėje yra kiekviena abėcėlei priklausanti raidė. Specialiu kodu pažymimi atvejai, kai tokios raidės į kairę nuo šios padėties ieškomoje eilutėje nėra.
  2. Nors pati paieška vyksta iš kairės į dešinę, simboliai lyginami iš dešines į kairę („atbulai“).
  3. Nustačius kad duotojoje padėtyje ieškomos eilutės nėra, pirmajame žingsnyje atliktos analizės rezultai panaudojami nustatyti, kur pradėti ieškoti iš naujo:
  • a) Jei nesutampančio ilgosios eilutės simbolio kairiojoje trumposios eilutės dalyje nėra, lyginimo rėmels patraukiamas tiek, kad šis simbolis į jį nebepatektų.
  • b) Jei šis simbolis trumpojoje eilutėje labiau į kairę yra, rėmelis patraukiamas tiek, kad šieji du simboliai atsidurtų vienas virš kito.

Pavyzdys

Blogo simbolio taisyklės taikymas ieškant žodžio LIULA frazėje LŪGNĖS LAPAI LIULA EŽERE.

  • a) Kažkuriame etape lyginant pastebima, kad U nesutampa su tarpu. Kadangi tarpo ieškomame žodyje nėra, rėmelis patraukiamas paliekant tarpą kairėje.
  • b) Patraukus nustatoma jog A nelygus I, tačiau I ieškomoje eilutėje sutinkamas už dviejų simbolių į kairę nuo lyginamos padėties. Rėmelis patraukiamas tris žingsius (vienu daugiau, kad simboliai atsidurtų vienas virš kito).
  • c) Ir vėl iš karto paaiškėja, jog I nelygus A. Pagal tą pačią informaciją patraukus rėmelį dar tris žingsnius…
  • d) …ieškoma eilutė randama.

Taigi skirtingai nuo naiviojo algoritmo, kuris paieškos rėmelį kiekvieną kartą patraukia tik per vieną simbolį, Boyer-Moore algoritmas paprastai rėmelį patraukia gerokai daugiau ir todėl yra pastebimai greitesnis. Jis gerai tinka ieškant teksto fragmentų žmonių kalboje arba baltymų sekose ir sunkiau pritaikomas DNR sekoms, kur abėcėle apribota keturiais simboliais.

Šaltiniai

  1. Gusfield, Dan (1999) [1997]. Algorithms on Strings, Trees and Sequences: Computer Science and Computational Biology. USA: Cambridge University Press. ISBN 0-521-58519-8.

Autorius: www.NiNa.Az

Išleidimo data: 24 Lie, 2025 / 22:14

vikipedija, wiki, lietuvos, knyga, knygos, biblioteka, straipsnis, skaityti, atsisiųsti, nemokamai atsisiųsti, mp3, video, mp4, 3gp, jpg, jpeg, gif, png, pictu, mobilusis, porn, telefonas, android, iOS, apple, mobile telefl, samsung, iPhone, xiomi, xiaomi, redmi, pornografija, honor, oppo, Nokia, Sonya, mi, pc, web, kompiuteris, Informacija apie Blogo simbolio taisyklė, Kas yra Blogo simbolio taisyklė? Ką reiškia Blogo simbolio taisyklė?

Blogo simbolio taisykle arba Boyer Moore algoritmas teksto paieskos ilgoje eiluteje algoritmas Algoritmas iesko palyginti trumpos eilutes kitoje paprastai daug ilgesneje is anksto nezinomoje eiluteje Tuo jis skiriasi nuo priesagu medzius naudojanciu algoritmu kuriems ilgaja eilute reikia zinoti is anksto medziui sukurti Klasikinis Boyer Moore algoritmas remiasi trimis paprastomis taisyklemis Trumpoji eilute kurios ieskoma pries paieska analizuojama sudarant lentele Kiekvienai eilutes padeciai įsimenama kiek toli į kaire nuo jos eiluteje yra kiekviena abecelei priklausanti raide Specialiu kodu pazymimi atvejai kai tokios raides į kaire nuo sios padeties ieskomoje eiluteje nera Nors pati paieska vyksta is kaires į desine simboliai lyginami is desines į kaire atbulai Nustacius kad duotojoje padetyje ieskomos eilutes nera pirmajame zingsnyje atliktos analizes rezultai panaudojami nustatyti kur pradeti ieskoti is naujo a Jei nesutampancio ilgosios eilutes simbolio kairiojoje trumposios eilutes dalyje nera lyginimo remels patraukiamas tiek kad sis simbolis į jį nebepatektu b Jei sis simbolis trumpojoje eiluteje labiau į kaire yra remelis patraukiamas tiek kad sieji du simboliai atsidurtu vienas virs kito PavyzdysBlogo simbolio taisykles taikymas ieskant zodzio LIULA frazeje LuGNĖS LAPAI LIULA EZERE a Kazkuriame etape lyginant pastebima kad U nesutampa su tarpu Kadangi tarpo ieskomame zodyje nera remelis patraukiamas paliekant tarpa kaireje b Patraukus nustatoma jog A nelygus I taciau I ieskomoje eiluteje sutinkamas uz dvieju simboliu į kaire nuo lyginamos padeties Remelis patraukiamas tris zingsius vienu daugiau kad simboliai atsidurtu vienas virs kito c Ir vel is karto paaiskeja jog I nelygus A Pagal ta pacia informacija patraukus remelį dar tris zingsnius d ieskoma eilute randama Taigi skirtingai nuo naiviojo algoritmo kuris paieskos remelį kiekviena karta patraukia tik per viena simbolį Boyer Moore algoritmas paprastai remelį patraukia gerokai daugiau ir todel yra pastebimai greitesnis Jis gerai tinka ieskant teksto fragmentu zmoniu kalboje arba baltymu sekose ir sunkiau pritaikomas DNR sekoms kur abecele apribota keturiais simboliais SaltiniaiGusfield Dan 1999 1997 Algorithms on Strings Trees and Sequences Computer Science and Computational Biology USA Cambridge University Press ISBN 0 521 58519 8

Naujausi straipsniai
  • Rugpjūtis 13, 2025

    Saulius Paliūnas

  • Rugpjūtis 12, 2025

    Saulažuvės

  • Rugpjūtis 12, 2025

    Saud Khariri

  • Rugpjūtis 11, 2025

    Satonas Koldfildas

  • Rugpjūtis 12, 2025

    Satellite FC

www.NiNa.Az - Studija

    Susisiekite
    Kalbos
    Susisiekite su mumis
    DMCA Sitemap
    © 2019 nina.az - Visos teisės saugomos.
    Autorių teisės: Dadash Mammadov
    Nemokama svetainė, kurioje galima dalytis duomenimis ir failais iš viso pasaulio.
    Viršuje