Пакет програм для обробки тексту

Пакет програм можна використовувати з наступними процедурами

програм

У програмі Delphi або Free Pascal за допомогою бібліотеки (блоку) Миснобол

Для цього використовуються такі файли: mysnobol.pas mystring.pas myintarray.pas

Бібліотеки тестували на Delphi6, Delphi10 та Lazarus або Freepascal.

Якщо немає доступного компілятора Pascal, ви можете використовувати інтерпретатор Pascal Pscript.

Шаблони також можна використовувати з додатком SnobolIDE. Тут ви можете ввести шаблон пошуку, який потім замінюється шаблоном заміни.

Всі необхідні файли та документація знаходяться у файлі snobol.zip

Цей файл доцільно розпакувати в каталог, до якого також можливий доступ для запису, наприклад \ appdata \ snobol

Описано методи розпізнавання та обробки тексту за допомогою класів зіставлення шаблонів на основі мови програмування SNOBOL. Класи частково змінені порівняно з моделлю SNOBOL для досягнення більшої ефективності.

SNOBOL 4 (С.триG Оскерований симboлік Л.номер мови 4-й) - це четверта і остання версія серії мов програмування з метою маніпулювання рядками. Ці мови були розроблені між 1962 і 1967 роками в лабораторіях AT & T's Bell Девідом Дж. Фарбером, Ральфом Е. Грісволдом та Іваном П. Полонським.

Ключовою відмінною рисою від мов програмування, що використовувались на той час, є існування шаблонів як типу даних "першого класу", тобто H. тип даних, значенням якого можна маніпулювати будь-яким способом, як в інших мовах програмування, а також операторами для ланцюжка та маніпулювання шаблонами. Рядки, що генеруються під час виконання, можуть розглядатися і виконуватися як програма. Шаблон у SNOBOL 4 може бути дуже простим, але також дуже складним. Простий шаблон - це, наприклад, Б. лише рядок типу "ABCD". Складний візерунок, навпаки, може бути великою структурою, яка, напр. Б. може описати повну граматику комп’ютерної мови. (Вікіпедія)

У 1970-х та 1980-х роках SNOBOL 4 широко використовувався як мова для маніпулювання текстом. Проте останніми роками його популярність знизилася, оскільки новіші та ефективніші мови, такі як Awk та Perl, стали більш популярними для маніпулювання рядками за допомогою регулярних виразів. На відміну від регулярного виразу в Perl, SNOBOL також дозволяє розпізнавати дужки, які неможливо описати за допомогою регулярних виразів.

(1) Відповідність шаблону

Під час узгодження зразків у текстах йдеться про визначення тестових зразків (зразків), які завдяки поєднанню можуть описати вільно зустрічаються тестові структури. Шаблони та їх комбінації повинні розпізнаватися за допомогою відповідних алгоритмів. Такі шаблони є частиною багатьох мов програмування та сценаріїв. Наприклад, мова JAVA знає клас маркер, де текст можна розбити на частини за допомогою роздільників. Мова сценаріїв PERL зі своїми регулярними виразами (регулярний вираз: регулярний вираз Perl) також має дуже потужний інструмент для опису та розпізнавання шаблонів. Однією з перших мов, спеціально спрямованих на цей тип обробки текстів, був SNOBOL. Описаний нижче підхід по суті використовує шаблони, визначені в SNOBOL. Однак він не визначає нову мову програмування або сценаріїв, але реалізація відбувається за допомогою класів та функцій, написаних існуючою мовою (PASCAL-DELPHI). Це дозволяє використовувати методологію в будь-якій програмі, написаній цими мовами. Можливе також реалізація, наприклад, на Java або C ++.

Моделі можуть включати:

Струни заданої довжини

всі рядки до спеціального символу

найдовший пробіг заготовок

будь-які повторення рядка

Рядки, збалансовані щодо заданих символів дужок