трусики женские украина

На головну

 Зв'язність текстової інформації - Логіка

Зв'язність є одним з важливих властивостей текстової інформації. Будь-яка інформація являє собою набір тих чи інших фактів, причому частина з них неодмінно пов'язана між собою. Очевидно, що при передачі цієї інформації в текстовому вигляді необхідно знайти спосіб зберегти зв'язки. Якщо цього не зробити, то ми не отримаємо адекватного уявлення про зовнішнє середовище, а тільки окремі її фрагменти, що не дають цілісної картини. Яким же чином реалізується зв'язність?

Найочевиднішим і логічним способом реалізації зв'язності текстової інформації представляється повтор. Суть його полягає в наступному: якщо пропозиція А пов'язано з пропозицією Б, то ці дві пропозиції містять деяку однакову частину, повторювану інформацію, яка і показує наявність зв'язку між А і Б. Таким чином, доводиться жертвувати одним з найважливіших принципів організації мовного матеріалу - відсутністю надмірності, але ця жертва необхідна для коректної передачі інформації про зовнішнє середовище.

Далі будемо виходити з того, що зв'язність тексту зберігається в межах одного абзацу.

Щоб зробити можливим виявлення зв'язків, кожне речення абзацу розбивається на дві частини: координати і власне інформацію. Координати - та сама загальна частина, що служить для зв'язку з іншими пропозиціями. Інша частина містить унікальну, нову інформацію, для передачі якій і служить в тексті цю пропозицію. Існує три типи зв'язності, що розрізняються схемами побудови координатних залежностей:

Kn

Опис «вглиб» (1). У цьому випадку зв'язність реалізується послідовної ланцюжком, то є пропозиція 1 пов'язано з 2, 2 з 3 і т. Д.

K1

K2

K3Опісаніе «вшир» (2). У цьому випадку зв'язність реалізується за паралельним принципом, коли всі пропозиції 2, 3 і т. Д. Пов'язані з пропозицією 1.

К1

К2

К3

Кn

К1

Кn

3. Комбінована схема (3). Являє собою змішаний варіант 1 і 2.

К2

К3

Лінгвістичний процесор може вирішувати два завдання, що мають відношення до зв'язності:

Завдання аналізу. У цьому випадку метою є виявлення всіх зв'язків між пропозиціями деякого тексту.

Завдання синтезу. Мета цього завдання - побудова тексту, що описує деякий фрагмент зовнішнього середовища із збереженням зв'язків між об'єктами.

Далі буде розглянуто алгоритм розв'язання задачі аналізу.

Перед тим як описувати алгоритм програмної реалізації задачі аналізу, необхідно зробити одне зауваження. Для якісного виконання завдання потрібно наявність досить великої бази даних, в якій зберігалися б відомості про різні морфологічних уявленнях слів, а також, для ще більш повної картини, відповідності між словами-синонімами. У даній роботі завдання реалізації такої бази даних не розглядається. Описуваний алгоритм визначає зв'язку в тексті тільки шляхом пошуку повторюваних слів.

Робота алгоритму відбувається в наступній послідовності:

Попередній аналіз тексту з метою розбиття його на окремі пропозиції. Пропозиція вважається закінченим, як тільки виявлена ??точка, причому за точкою слід або велика буква, або нічого, якщо кінець пропозиції одночасно є кінцем тексту.

Аналіз пропозицій з метою виділення окремих слів. Передбачається, що слова розділяються пробілами або іншими символами-роздільниками.

Створення двовимірного масиву, в якому одна координата визначає порядковий номер пропозиції, а інша - порядковий номер слова в цьому реченні.

Пошук зв'язків для кожного слова тексту. Цей пошук відбувається в циклі і складається з таких етапів:

читання наступного слова і його перевірка. Слова довжиною менше трьох символів не аналізуються, щоб виключити помилкові зв'язку з спілкам, приводами та т.п .;

пошук в тексті слів, у яких збігається з даними словом не менше 3 перших символів і не менше 3/4 від його довжини. Таким чином враховується можливість наявності у повторюваних слів різних закінчень. Можна також обмежувати глибину пошуку, т. Е. Кількість пропозицій після поточного, в яких необхідно шукати зв'язку. Якщо проводити пошук тільки в одному наступному реченні, то будуть знайдені тільки зв'язку за схемою (1);

запам'ятовування координат знайдених зв'язків у масиві. При цьому створюється таблиця, в якій вводиться запис для кожного набору координат. Якщо працювати тільки по схемі (1), то ці записи будуть являти собою пари.

По закінченні циклу може бути побудована схема, що демонструє всі зв'язки в тексті.

Можливо також зробити розбиття тексту на абзаци: початком нового абзацу вважається пропозиція, в якому немає жодної зв'язку з яким-небудь з слів попередній частині тексту.

Алгоритм не дає гарантії правильності отриманого результату. Зокрема, можливі такі помилки:

знаходження неіснуючих зв'язків по допоміжних частин мови;

знаходження неіснуючих зв'язків за схожими в написанні, але не однокорінним словами;

втрата зв'язків з коротким словами.

Уникнути цих помилок можна, як уже говорилося, тільки при доповненні програми базою да

Авіація і космонавтика
Автоматизація та управління
Архітектура
Астрологія
Астрономія
Банківська справа
Безпека життєдіяльності
Біографії
Біологія
Біологія і хімія
Біржова справа
Ботаніка та сільське господарство
Валютні відносини
Ветеринарія
Військова кафедра
Географія
Геодезія
Геологія
Діловодство
Гроші та кредит
Природознавство
Журналістика
Зарубіжна література
Зоологія
Видавнича справа та поліграфія
Інвестиції
Інформатика
Історія
Історія техніки
Комунікації і зв'язок
Косметологія
Короткий зміст творів
Криміналістика
Кримінологія
Криптологія
Кулінарія
Культура і мистецтво
Культурологія
Логіка
Логістика
Маркетинг
Математика
Медицина, здоров'я
Медичні науки
Менеджмент
Металургія
Музика
Наука і техніка
Нарисна геометрія
Фільми онлайн
Педагогіка
Підприємництво
Промисловість, виробництво
Психологія
Психологія, педагогіка
Радіоелектроніка
Реклама
Релігія і міфологія
Риторика
Різне
Сексологія
Соціологія
Статистика
Страхування
Будівельні науки
Будівництво
Схемотехніка
Теорія організації
Теплотехніка
Технологія
Товарознавство
Транспорт
Туризм
Управління
Керуючі науки
Фізика
Фізкультура і спорт
Філософія
Фінансові науки
Фінанси
Фотографія
Хімія
Цифрові пристрої
Екологія
Економіка
Економіко-математичне моделювання
Економічна географія
Економічна теорія
Етика

8ref.com

© 8ref.com - українські реферати


енциклопедія  бефстроганов  рагу  оселедець  солянка