Вивчення та знання іноземної мови перестало бути просто ознакою хорошої освіченості чи розвитку людини, ставши невід’ємною частиною життя в сучасному суспільстві. Закономірно, що методика навчання іноземних мов, як наука, яка вивчає цілі, зміст, методи і засоби навчання, а також способи навчання і виховання на матеріалі іноземної мови, постійно удосконалюється та набуває все більш інтенсивного розвитку.
Важливою рисою сучасної методики викладання іноземних мов вважається застосування поряд з традиційними удосконалених інноваційних методів навчання, що надають багато нових переваг та можливостей. Зокрема, враховуючи швидкість та рівень розвитку комп’ютерного та інформаційного забезпечення, не важко визначити, що лінгвістика та методика викладання не лежать поза сферами їх впливу та застосування. Отже, внаслідок взаємодії комп’ютерних технологій з цими науками виникає поняття нового методу навчання іноземних мов, а саме «корпусного методу».
«Корпусний метод навчання мови» базується на здобутках однієї з галузей прикладної лінгвістики – корпусної лінгвістики. Сучасна корпусна лінгвістика – це наука, що спрямована переважно на розробку теоретичних основ побудови й опрацювання корпусів текстів, та користування ними; а також на практичне формування електронних корпусів текстів різних мов. Отже, предметом дослідження корпусної лінгвістики є процес створення, обробки та використання корпусів, а її об’єктом є корпуси мовленнєвого матеріалу мови та технології їх створення.
Корпуси текстів, їх переваги та можливості застосування у різних сферах та науках, зокрема у методиці викладання іноземних мов, досліджуються відносно незначною кількістю лінгвістів; серед них найбільш відомими є праці Демської-Кульчицької О. М., Сосніної Е.П. та Бук С. Н.
Недостатній рівень дослідження електронних корпусів текстів, упереджене ставлення частини лінгвістів до можливості їх практичного використання у різноманітних галузях та науках, штучне обмеження сфери застосування корпусів текстів до розв’язання окремих прикладних завдань та відсутність базових навичок користування корпусами у переважної частини лінгвістів зумовлюють актуальність статті.
Метою її написання є аналіз поняття електронних корпусів текстів загалом та учнівських корпусів зокрема; висвітлення їх переваг та можливостей застосування у методиці викладання іноземних мов; а також опис основних етапів роботи над створенням корпусу української англійської мови як частини українського підкорпусу міжнародного навчального англомовного корпусу есе студентів, відомого під назвою International Corpus of Learner English (ICLE).
Об’єктом дослідження, що стало основою написання статті, є електронні корпуси текстів, які завдяки швидкому розвитку комп’ютерних технологій та корпусної лінгвістики суттєво впливають на подальший розвиток більшості лінгвістичних дисциплін та становлять базу для розвитку корпусного методу навчання у методиці викладання іноземних мов. Предметом дослідження є аналіз учнівських корпусів текстів та переваг їх застосування у методиці викладання іноземних мов; а також практичне створення українського підкорпусу ICLE.
Корпус текстів – це не просто електронна бібліотека, зібрання текстів чи словників певної мови, це інформаційна система, яка містить в собі сформоване за певними вимогами зібрання спеціально відібраних та підготовлених усних чи письмових текстів (однієї мови, окремого діалекту або іншої підмножини мов) в електронному вигляді з додаванням спеціальної розмітки (анотування), що надає можливість їх подальшого детального вивчення та опрацювання.
Корпуси текстів слугують інформаційною базою для проведення трьох основних напрямів дослідження: 1) власне лінгвістичних синхронних та діахронних досліджень; 2) статистичних досліджень та 3) досліджень у сфері методики викладання мов [4]. Варто наголосити на зміцненні зв’язку між корпусною лінгвістикою та методикою викладання іноземних мов, що відображається у залучені різних видів корпусів, найчастіше учнівських, для розробки нових напрямків діяльності та методів навчання певної мови.
Учнівський корпус – це один з різновидів електронних корпусів текстів, якому, окрім загальних ознак кожного корпусу, притаманні також власні характерні особливості. Зокрема, основну інформацію для створення та поповнення бази учнівського корпусу (усні та письмові тексти) надають люди, які вивчають іноземну мову.
Вивчення мовлення учнів має власну традицію, наприклад, аналіз учнівських помилок у 60-70-х роках ХХ століття базувався на невеликих сукупностях текстів не електронного формату. Аналізовані тексти були здебільшого неоднорідними, що часто провокувало неоднозначні, а то й суперечливі висновки. До того ж, виписували тільки окремі помилки, в той час як решта матеріалу не розглядалася.
Учнівські корпуси текстів, натомість, мають низку суттєвих переваг: значно більший обсяг матеріалу, електронний формат, точні критерії збору матеріалу дають можливість не тільки фіксувати помилки, а й формувати враження про цілісне мовлення. Такі корпуси текстів дозволяють здійснити не лише якісний, а й кількісний аналіз мовленнєвих даних учня [1]. До того ж, спеціальна зовнішня розмітка (анотування) учнівського корпусу розширює межі можливих досліджень. Адже залежно від дослідницьких цілей створення, у ній можуть закодовуватися також дані про учня (вік; стать; освіта; рідна мова; іноземні мови, якими володіє; рівень володіння цією іноземною мовою / рік її вивчення тощо), про умови виконання завдання (наприклад, доступ до словників), про форму відповіді (усна, письмова), довжину, жанр, тему розповіді, тощо [6].
Основною метою створення учнівських корпусів текстів вважається можливість проведення їх аналізу для виявлення різноманітних засобів та методів покращення викладання та полегшення засвоєння іноземної мови. На основі учнівських корпусів, можна здійснювати формування списків активної лексики студентів. Крім того, корпуси текстів містять мовні одиниці в їх природному оточенні, що дозволяє здійснювати дослідження лексичної та граматичної структури мови, слідкувати за безперервними мовними змінами.
Подібні корпуси можуть також застосовуватися для лінгвістичного аналізу з метою виявлення основних лексичних та синтаксичних помилок мовців та труднощів, що виникають при вивченні іноземної мови. Це допомагає встановити частотність різних типів мовних помилок, види контекстів в яких вони найчастіше зустрічаються та розробити ефективні плани та методи покращення навчання іноземними мовами.
Електронні учнівські корпуси найбільш поширені в Азії та Європі. Одним з найвідоміших є міжнародний навчальний англомовний корпус есе студентів, що мають рівень володіння іноземною мовою «advanced», відомий під назвою International Corpus of Learner English (ICLE). Метою його створення вважається накопичення та опрацювання есе, написаних носіями різних мов світу, для яких англійська мова є іноземною, а не рідною.
Корпус нараховує підкорпуси англійського мовлення учнів, які є носіями рідної болгарської, бразильської (варіанта португальської), грецької, данської, китайської, італійської, іспанської, литовської, німецької, норвезької, польської, португальської, російської, турецької, фінської, французької, чеської, шведської мов [7]. Більшість лінгвістів схильні вважати ICLE прикладом ефективних напрацювань у галузі корпусної та прикладної лінгвістики.
На базі лексикографічної лабораторії LAXILAB НУ «Острозька академія» відбувається робота над створенням учнівського корпусу української англійської мови, що стане частиною українського підкорпусу міжнародного навчального англомовного корпусу есе студентів ICLE.
Робота над створенням корпусу текстів достатньо тривала та багато-етапна. Першим кроком є збір необхідної інформації, тобто есе студентів, що мають рівень володіння англійською мовою «advanced». За вимогами проекту кожен студент може надати лише одне есе обсягом від 500 до 1000 слів. Есе можуть бути двох типів: argumentative essay writing (есе, що виконуються студентами переважно вдома протягом тривалого періоду часу з використанням допоміжних засобів, наприклад словників чи граматик) та literature examination papers (есе, що виконуються як письмове завдання при проведенні перевірки знань та навичок студентів). Есе другого типу значно легше зібрати, проте їхня кількість обмежена і має становити не більше 25% всього національного підкорпусу. До того ж, за вимогами проекту жодне з відібраних есе не може бути написане з допомогою носіїв мови та не повине містити інформацію переписану з інших джерел [7].
Для створення повної бази данних необхідні не лише есе, але й певна інформація про автора, умови та вимоги до їх написання, тому другим етапом роботи над створенням підкорпусу є розробка анкети, яку заповнюють усі учасники проекту. Запитання анкети спрямовані на отримання інформації, яка в майбутньому надасть мовознавцям можливість здійснення різноманітних досліджень. Наприклад, загального аналізу есе студентів, що володіють англійською мовою на рівні «advanced», визначення найбільш частотних типів помилок, порівняння есе написаних учасниками чоловічої та жіночої статі або порівняння окремих підкорпусів.
Третім етапом роботи є перетворення звичайного зібрання електроних текстів у корпус, що здійснюється шляхом їх кодування з використанням чітко-визначеної розмітки (анотування). Зокрема, усі посилання в есе на будь-яких авторів замінюються знаком <R> (R for reference), довгі цитати – позначкою <*>, а помилки та слова, що становлять складність для читання, з обох боків виділяють знаком <?> [7]. Варто також зазначити, що назви книг, журналів, пісень тощо залишаються без змін, оскільки вони зазвичай є частиною речення і їхня заміна певним знаком може негативно вплинути на розуміння змісту всього твердження.
Останнім етапом роботи є створення бази данних, що містить основну інформацію про автора та есе. Для полегшення подальшої роботи з матеріалами бази данних, при її створенні також застосовується спеціальне зовнішнє анотування. Перш за все, кожний учасник проекту отримує власний номер. Наприклад, номер першого учасника UKOA0001, де UK – Ukraine, OA – Ostroh Academy, 0001 – порядковий номер.
Крім того, кожне есе внесене до бази даних також закодовується. Код есе складається з трьох символів:
1. W, що використовується для позначення writing;
2. показник кількості слів в есе, що може бути представлений числом 1 (для позначення есе обсягом до 500 слів), 2 (від 500 до 1000 слів) і 3 (понад 1000 слів);
3. визначає тип есе, номер 01 застосовується для argumentative essay writing, 02 для literature examination papers.
Впродовж проведення наукового проекту вдалося зібрати 65 есе, залучивши 59 студентів НУ «Острозька академія» для яких українська мова є рідною. У проекті взяли участь переважно студенти третього-четвертого курсів факультету романо-германських мов, оскільки їх рівень володіння англійською мовою відповідає вимогам проекту.
Розроблений корпус української англійської мови може стати повноцінною інформативною основою для застосування «корпусного методу» навчання іноземної мови та проведення різноманітних досліджень; а участь у міжнародному проекті лінгвістичного центру The Louvain Centre for English Corpus Linguistics забезпечить багато нових можливостей для розробки ефективних засобів навчання англійської мови та уможливить залучення до національних і міжнародних проектів.
Література:
-
Бук С. Учнівські корпуси в методиці викладання іноземної мови [Текст] / С. Бук // Теорія і практика викладання української мови як іноземної, 2007. – №2. – С. 19-23
-
Демська-Кульчицька О. Корпусні підходи в методиці мови [Текст] / О. Демська-Кульчицька // Теорія і практика викладання української мови як іноземної, 2006. – №1. – С. 22-27
-
Дерба С.М. Словник з української термінології прикладної (комп’ютерної) лінгвістики [Текст]. – К.: 2007. – 325 с.
-
Дідук-Ступ'як, Г. І. Лінгводидактичні можливості корпусної лінгвістики [Текст] / Г. І. Дідук-Ступ'як // Наукові записки ТНПУ ім. В. Гнатюка. Сер. Педагогіка. – Тернопіль, 2010. – № 1. – С. 105-109
-
Соснина Е.П. Корпусная лингвистика и корпусный подход в обучении иностранному языку // Ульян. гос. техн. ун-т. – Ульяновск [Електронний ресурс] // http://ling.ulstu.ru/linguistics/resourses/literature/articles/ corpus_ linguistics_language_teaching/
-
Granger S. Computer learner corpus research: current status and future prospects // Applied Corpus Linguistics: A Multidimensional Perspective / Ed. by U. Connor and T. Upton. – Amsterdam, 2004. – P. 123–145
-
The Louvain Centre for English Corpus Linguistics [Електронний ресурс] // http://www.uclouvain.be/en-cecl.html/
Науковий керівник:
кандидат філологічних наук, доцент Коцюк Леся Миколаївна