Про репрезентативність колокацій у світі

Курсова робота (прогресивний семінар) 2015 р. 23 сторінки

колокацій Інтернеті

Зразок для читання

структура

1. Вступ - Про репрезентативність колокацій в Інтернеті
1.1. Що таке колокації?
1.2. Питання
1.3. Мережа як корпус
а) Корпусна лінгвістика як емпіричний метод дослідження
б) Переваги та недоліки Інтернету як корпусу
в) Дослідити колокації в Інтернеті

2. Власне корпусне лінгвістичне дослідження вибраних колокацій в Інтернеті
2.1. "Словник колокацій німецькою мовою" - вибір колокацій, що підлягають вивченню
2.2. Аналіз корпусу за допомогою WebCorp
2.3. Результати та порівняння з колокаційним словником

3. Інтерпретація та обговорення результатів
3.1. світогляд

1. Вступ - Про репрезентативність колокацій в Інтернеті

1.1. Що таке колокації?

У дослідженні фразеології термін колокація використовується для позначення фіксованих неідіоматичних словосполучень (пор. Редер 2006: 160). Колокації, таким чином, узагальнені в окремих мовах, певні поєднання слів міцно закріплені в одній мові і, отже, представляють фіксовані "одиниці мовної системи" (пор. Lehr 1996: 1). У лінгвістичних дослідженнях колокації часто трактуються як бінарні лексичні одиниці, як у згаданих вище прикладах. Однак існують також „зв’язки більш ніж із двох слів” (пор. Hollós 2010: 85), як у прикладі, який масово критикується (пор. Hausmann 2004: 316). Однак тут не слід ними займатись, оскільки вони виходять за рамки цієї роботи.

Підсумовуючи, я будую своє корпусно-лінгвістичне дослідження на наступному розумінні колокацій: Колокації - це статистично часті поєднання слів бінарного характеру, які характеризуються синтагматичною та семантичною залежностями колокатора від основи (пор. Hausmann 2001: 316, Reder 2006: 158). Ця робота буде зосереджена на вербальних та предметних колокаціях, оскільки їх легко визначити з лінгвістичної точки зору корпусу, а тому вони добре підходять для оцінки репрезентативності колокацій у веб-корпусі (пор. Брейдт 1995: 5). Різноманітність можливих колокативних словосполучень може призвести до неоднозначностей у пошуку та аналізі корпусів, саме тому необхідне чітке розмежування об’єкта, що підлягає дослідженню.

1.2. Питання

Перш ніж я піду в шанси та ризики Інтернету як корпусу для аналізу колокації в наступному розділі, я хотів би викласти цілеспрямоване питання цього розслідування на даний момент. Мета полягає в тому, щоб перевірити, чи "Всесвітня павутина" є репрезентативною для вживання дієслівних словосполучень і іменників Результати власного аналізу корпусу Інтернету слід порівняти із записами в «Словнику колокацій німецькою мовою» (Quasthoff 2011), щоб мати можливість оцінити репрезентативність фактичного використання мови в Інтернеті. Записи в словнику вже вказують на відповідно високу частоту відповідних розмов у німецькій мові (пор. Quasthoff 2011: XII). Оскільки кількісний аналіз можливий лише в обмеженій мірі у веб-корпусі 1, при оцінці даних корпусу також слід проводити якісний аналіз результатів.

1.3. Мережа як корпус

У наступному розділі будуть зроблені попередні міркування щодо придатності Інтернету як лінгвістичного корпусу, що втече в обговорення пізніших результатів аналізу колокації.

а) Корпусна лінгвістика як емпіричний метод дослідження

За допомогою корпусної лінгвістики емпірично можна дослідити використання різних мовних явищ однією мовою. Наприклад, використовуючи автентичний мовний матеріал, можна надати докази значення та використання конкретних розмов та визначити частоту їх появи. Тому їх можна проаналізувати якісно та кількісно (пор. Шерер 2006: 35с.). Тоді це може бути основою для створення словників, як у випадку з “Словником колекцій німецькою мовою”. Більшість корпусів - іншими словами, «збірники текстів або частини текстів, які (...) відібрані та класифіковані за певними лінгвістичними критеріями» (2006: 3) - зараз оцифровані і можуть бути проаналізовані за допомогою ПК. „Всесвітня павутина” забезпечує надзвичайно великий набір даних із письмової (і частково розмовної) мови та розширює можливості мовного аналізу корпусу. Однак є деякі недоліки або обмеження. Різні характеристики так званих “веб-корпусів” 2 будуть детальніше розглянуті нижче.

б) Переваги та недоліки Інтернету як корпусу

в) Дослідити колокації в Інтернеті

Незважаючи на обговорені вище обмеження, Інтернет може використовуватися для лексикографічних та мовних статистичних досліджень (Scherer 2006: 75, Diemer 2008: 36). Лінгвістичні дослідження корпусу Біккеля 3 чітко дають зрозуміти, що, незважаючи на значне зростання та постійний подальший розвиток веб-корпусу, результати пошуку “за своєю суттю є послідовними” і “відтворюваними” в певний час (Bickel 2006: 80). Дуже подібних результатів можна було досягти в різний час, що свідчить про певну стабільність тканого корпусу (пор. 2006: 78 і далі).

2. Власне корпусне лінгвістичне дослідження вибраних колокацій в Інтернеті

Для того, щоб перевірити, чи "Всесвітня павутина" є репрезентативною для використання словесних та предметних колокацій, я хотів би базувати свій аналіз корпусу на вибраних колокаціях з "Словника колекацій німецькою мовою" для порівняння.

2.1. "Словник колокацій німецькою мовою" - вибір колокацій, що підлягають вивченню

«Словник колокацій німецькою мовою» є першим словником колокації німецькою мовою (пор. Quasthoff 2011: XII). Оскільки він був задуманий на основі емпіричного, корпусно-лінгвістичного дослідження мовного корпусу Лейпцига, він відображає мовну реальність колокативних вживань (пор. Radzik 2013: 64, Quasthoff 2011: XII). Колокаційний словник Quasthoff збирає найпоширеніші співрозмовники на загальну кількість 3253 іменників, дієслів та прикметників, які вказані як основа двійкових словосполучень (2011: X). Радзік (2013: 71) розглядає створення на базі корпусу «Словника для розмов німецькою мовою» як «велике досягнення німецької лексикографії». Відповідні колокації ключового слова не структуровані відповідно до їх фактичної частоти зустрічальності у довідковому корпусі, а сортуються відповідно до синтаксичних та семантичних взаємозв’язків у так званих групах колокації 4 (пор. Quasthoff 2011: X).

Для незалежного аналізу корпусу аналізуються словесні розмови (іменник + дієслово), засновані на основному харчуванні. З іншого боку, слід розглянути іменникові колокації (прикметник + іменник) на основі зазначених вище. Колокаційний словник спочатку перелічує такі дієслова та прикметники як колокатори іменника харчування (пор. 2011: 150):

1 див. Розділ 1.3b).

2 “Веб-корпуси” - це мовно підготовлений мовний матеріал з Інтернету. Слід розрізняти ці "корпуси, доступні в Інтернеті", доступні в Інтернеті, але не оброблені лінгвістично (пор. Storrer 2011: 12).

3 Про структуру та реалізацію цього корпусного лінгвістичного дослідження див. Бікель (пор. 2006: 75 і далі). 6-й

4 Ці колокаційні групи перераховані, розділені крапкою з комою. На основі цієї структури я також представив результати цієї корпусної лінгвістичної роботи з пункту 2.3 (с. 10).