ОБЧИСЛЕННЯ ПОКАЗНИКА АСОЦІАЦІЇ MI LOG FREQ ЯК СТАТИСТИЧНИЙ МЕТОД ДОСЛІДЖЕННЯ СИНТАКСИЧНИХ ФРАЗЕОЛОГІЗМІВ
DOI:
https://doi.org/10.18372/2520-6818.34.11461Ключові слова:
конструкція, корпус текстів, синтаксичний фразеологізм, статистичний аналіз, показник асоціації, фразеологізоване речення.Анотація
Статтю присвячено статистичному аналізу синтаксичних фразеологізмів на матеріалі української мови. Здійснено обчислення показника асоціації MI log Freq, який є модифікованою формулою коефіцієнта МІ (mutual information) та дає змогу виявити ступінь невипадковості (статистично доведеної зв'язаності) поєднання словоформ, що входять до складу незмінного компонента моделі речення.
Подано результати виконаних обчислень для низки моделей синтаксичних фразеологізмів української мови за даними Українського національного лінгвістичного корпусуПосилання
Величко А. В. Синтаксическая фразеология для русских и иностранцев : Учебное пособие / А. В. Величко. – М. : Изд-во МГУ, 1996. – 96 с.
Всеволодова М. В., Лим Су Ён. Принципы лингвистического описания синтаксических фразеологизмов: На материале синтаксических фразеологизмов со значением оценки / М. В. Всеволодова, Ён Лим Су. – М. : МАКС Пресс, 2002. – 164 с.
Залесская В. В. Программа выявления в тексте двучленных статистически значимых осмысленных коллокаций (на материале русского языка) / В. В. Залесская // Технологии информационного общества в науке, образовании и культуре : сборник научных статей. Труды XVII Всероссийской объединенной конференции «Интернет и современное общество» (IMS-2014), Санкт-Петербург, 19 – 20 ноября 2014 г. – СПб : Университет ИТМО, 2014. – С. 283–289.
Русская грамматика: В 2-х т. – Т. 2. Синтаксис / Под ред. Н. Ю. Шведовой. – М. : Наука, 1980. – 709 с.
Ситар Г. В. Статус синтаксичних фразеологізмів у системі фразеологічних одиниць / Г. В. Ситар // Вісник Донецького національного університету. Серія Б. Гуманітарні науки. – Донецьк : ДонНУ, 2011. – № 2. – С. 66–74.
Ситар Г. В. Статистичні критерії аналізу синтаксичних фразеологізмів / Г. В. Ситар // Вісник Донецького національного університету. Серія Б. Гуманітарні науки. – Вінниця : ДонНУ,
– № 1-2. – у друці.
Хохлова М. В. Исследование лексико-синтаксической сочетаемости в русском языке с помощью статистических методов (на базе корпусов текстов) : автореф. дисс. на соискание ученой степени канд. филол. наук : спец. 10.02.21 «Прикладная и математическая лингвистика» / М. В. Хохлова / Санкт Петербургский государственный университет. – Санкт-Петербург, 2010. – 26 с.
Ягунова Е. В., Пивоварова Л. М. От коллокаций к конструкциям / Е. В. Ягунова, Л. М. Пивоварова // ACTA LINGUISTICA PETROPOLITANA. Труды Института лингвистических исследований РАН. Т. X. Ч. 2. Русский язык: грамматика конструкций и лексико-семантические подходы / Ред. тома С. С. Сай, М. А. Овсянникова, С. А. Оскольская. – СПб. : Наука, 2014. – С. 568–617.
Church K., Hanks P. Word association norms, mutual information, and lexicography / K. Church, P. Hanks // Computational Linguistics. – #16(1). – 1990. – P. 22–29.
Everitt B. S. The Cambridge Dictionary of Statistics. 2nd edition / B.S. Everitt. – Cambridge : Cambridge University Press, 2002. – 410 pp.
Evert S. The Statistics of Word Cooccurrences: Word Pairs and Collocations / S. Evert : PhD dissertation, IMS, University of Stuttgart, 2004 (Published in 2005). – 353 P. – Free PDF available from http://purl.org/stefan.evert/PUB/Evert2004phd.pdf
Evert S., Krenn B. Using small random samples for the manual evaluation of statistical association measures / S. Evert, B. Krenn // Computer Speech & Language. – 2005. – 19(4). – P. 450–466.
Fano Robert M. Transmission of Information: A Statistical Theory of Communications / Robert M. Fano. – New York : The Technology Press, M.I.T., and John Wiley & Sons, Inc., 1961. – 389 pp.
Pecina Pavel. Lexical Association Measures. Collocation Extraction. Volume 4 of Studies in Computational and Theoretical Linguistics / Pavel Pecina. – Prague: Institute of Formal and Applied Linguistics, 2009. – 143 pp.
Rychlэ Pavel. A Lexicographer-Friendly Association Score / Pavel Rychlэ // RASLAN 2008 Recent Advances in Slavonic Natural Language Processing. Second Workshop on Recent Advances in Slavonic Natural Language Processing, RASLAN 2008 Karlova Studбnka, Czech Republic, December 5–7, 2008 Proceedings. – Brno, 2008. – P. 6–9: https://nlp.fi.muni.cz/raslan/2008/papers/13.pdf
Seretan V. Syntax-Based Collocation Extraction / V. Seretan // Text Speech and Language Technology. Series Editors Nancy Ide, Jean Vйronis. – Volume 44. – Dordrecht – Heidelberg – London – New York : Springer, 2011. – 222 pp.
Stubbs M. Collocations and semantic profiles: On the cause of the trouble with quantitative studies / M. Stubbs // Functions of Language. – 1995. – 2, 1. – Pp. 23–55.