COMPUTATION OF MI LOG FREQ ASSOCIATION MEASURE AS A STATISTICAL METHOD OF SYNTACTIC IDIOMS RESEARCH

Authors

  • Ганна СИТАР

DOI:

https://doi.org/10.18372/2520-6818.34.11461

Keywords:

construction, text corpus, syntactic idiom, statistical analysis, association measure, sentence with phraseological structure

Abstract

The article is devoted to the statistical analysis of syntactic idioms based on the Ukrainian language. The computation of association measure of MI log Freq (mutual information logarithm frequency) was carried out, which is the modified formula of MI (mutual information) coefficient and allows us to determine the degree of randomness / non- randomness of word forms that are part of the permanent component of sentence model.

References

Величко А. В. Синтаксическая фразеология для русских и иностранцев : Учебное пособие / А. В. Величко. – М. : Изд-во МГУ, 1996. – 96 с.

Всеволодова М. В., Лим Су Ён. Принципы лингвистического описания синтаксических фразеологизмов: На материале синтаксических фразеологизмов со значением оценки / М. В. Всеволодова, Ён Лим Су. – М. : МАКС Пресс, 2002. – 164 с.

Залесская В. В. Программа выявления в тексте двучленных статистически значимых осмысленных коллокаций (на материале русского языка) / В. В. Залесская // Технологии информационного общества в науке, образовании и культуре : сборник научных статей. Труды XVII Всероссийской объединенной конференции «Интернет и современное общество» (IMS-2014), Санкт-Петербург, 19 – 20 ноября 2014 г. – СПб : Университет ИТМО, 2014. – С. 283–289.

Русская грамматика: В 2-х т. – Т. 2. Синтаксис / Под ред. Н. Ю. Шведовой. – М. : Наука, 1980. – 709 с.

Ситар Г. В. Статус синтаксичних фразеологізмів у системі фразеологічних одиниць / Г. В. Ситар // Вісник Донецького національного університету. Серія Б. Гуманітарні науки. – Донецьк : ДонНУ, 2011. – № 2. – С. 66–74.

Ситар Г. В. Статистичні критерії аналізу синтаксичних фразеологізмів / Г. В. Ситар // Вісник Донецького національного університету. Серія Б. Гуманітарні науки. – Вінниця : ДонНУ,

– № 1-2. – у друці.

Хохлова М. В. Исследование лексико-синтаксической сочетаемости в русском языке с помощью статистических методов (на базе корпусов текстов) : автореф. дисс. на соискание ученой степени канд. филол. наук : спец. 10.02.21 «Прикладная и математическая лингвистика» / М. В. Хохлова / Санкт Петербургский государственный университет. – Санкт-Петербург, 2010. – 26 с.

Ягунова Е. В., Пивоварова Л. М. От коллокаций к конструкциям / Е. В. Ягунова, Л. М. Пивоварова // ACTA LINGUISTICA PETROPOLITANA. Труды Института лингвистических исследований РАН. Т. X. Ч. 2. Русский язык: грамматика конструкций и лексико-семантические подходы / Ред. тома С. С. Сай, М. А. Овсянникова, С. А. Оскольская. – СПб. : Наука, 2014. – С. 568–617.

Church K., Hanks P. Word association norms, mutual information, and lexicography / K. Church, P. Hanks // Computational Linguistics. – #16(1). – 1990. – P. 22–29.

Everitt B. S. The Cambridge Dictionary of Statistics. 2nd edition / B.S. Everitt. – Cambridge : Cambridge University Press, 2002. – 410 pp.

Evert S. The Statistics of Word Cooccurrences: Word Pairs and Collocations / S. Evert : PhD dissertation, IMS, University of Stuttgart, 2004 (Published in 2005). – 353 P. – Free PDF available from http://purl.org/stefan.evert/PUB/Evert2004phd.pdf

Evert S., Krenn B. Using small random samples for the manual evaluation of statistical association measures / S. Evert, B. Krenn // Computer Speech & Language. – 2005. – 19(4). – P. 450–466.

Fano Robert M. Transmission of Information: A Statistical Theory of Communications / Robert M. Fano. – New York : The Technology Press, M.I.T., and John Wiley & Sons, Inc., 1961. – 389 pp.

Pecina Pavel. Lexical Association Measures. Collocation Extraction. Volume 4 of Studies in Computational and Theoretical Linguistics / Pavel Pecina. – Prague: Institute of Formal and Applied Linguistics, 2009. – 143 pp.

Rychlэ Pavel. A Lexicographer-Friendly Association Score / Pavel Rychlэ // RASLAN 2008 Recent Advances in Slavonic Natural Language Processing. Second Workshop on Recent Advances in Slavonic Natural Language Processing, RASLAN 2008 Karlova Studбnka, Czech Republic, December 5–7, 2008 Proceedings. – Brno, 2008. – P. 6–9: https://nlp.fi.muni.cz/raslan/2008/papers/13.pdf

Seretan V. Syntax-Based Collocation Extraction / V. Seretan // Text Speech and Language Technology. Series Editors Nancy Ide, Jean Vйronis. – Volume 44. – Dordrecht – Heidelberg – London – New York : Springer, 2011. – 222 pp.

Stubbs M. Collocations and semantic profiles: On the cause of the trouble with quantitative studies / M. Stubbs // Functions of Language. – 1995. – 2, 1. – Pp. 23–55.

Issue

Section

Language Studies. Translation Studies