Preview

Philosophical Problems of IT & Cyberspace (PhilIT&C)

Advanced search

METHOD OF THE SEMANTIC COMPARISON OF FUZZY INFORMATION ON TEXT PLAGIARISM

https://doi.org/10.17726/philIT.2015.10.2.004.89

Abstract

Famous systems of text analysis on the presence of plagiarism have been analyzed in the article. A new method of linguistic analysis has been proposed, which determines the latent and semantic associative dependencies in the set of documents; partially eliminates homonymy, polysemy and synonymy; corrects the words written with spelling and technical mistakes; takes into account the syntactic relations, logic of the term building in the context of the subjective area. The developed algorithm of the semantic comparison of fuzzy text information (the original text submitted for testing in natural language in any form, with text versions available in the local databases and content on the Internet) assumes automatic conversion of the original natural language text into the intra-system form, extraction of the text lexical units followed by the implementation of morphological, syntactic, semantic and pragmatic analysis. The use of the algorithm makes it possible to eliminate errors that may be in the source text (the wrong endings, unusual shortenings, etc.) to determine the source text belonging to a particular subject area, to identify the degree of semantic similarity of the source text, to form an overall assessment of the degree of similarity of texts by complex indicator. The usage of this approach will increase the conclusion’s reliability and validity on the presence of plagiarism in documents.

About the Authors

O. I. Komarnitskaya
The National Academy of the State Border Guard Service of Ukraine
Russian Federation


I. I. Komarnitskaya
The National Academy of the State Border Guard Service of Ukraine
Russian Federation


References

1. Шостак И.В., Груздо И.В. Компьютеризация процесса выявления плагиата в студенческих работах // Сборник научных трудов Военного института Киевского национального университета имени Тараса Шевченко. Киев, 2013. Вып. 41. - С. 99-109

2. Лупаренко Л.А. Данные сравнительного анализа инструментов поиска текстового плагиата (сравнительные таблицы) // Информационные технологии и средства обучения. 2014. Т. 40. № 2

3. Шарапов Р.В., Шарапова Е.В. Система проверки текстов на заимствования из других источников // Труды 13-й Всероссийской научной конференции «Электронные библиотеки: перспективные методы и технологии, электронные коллекции». - RCDL’2011, Воронеж, Россия, 2011. - С. 121-126

4. Резанова З.И., Романов А.С., Мещеряков Р.В. О выборе признаков текста, релевантных в автороведческой экспертной деятельности // Вестник Томского государственного университета. Филология. 2013. № 6(26). - С. 38-52

5. Ширяев М.А., Мустакимов В. Plagiatinform избавит от плагиата в научных работах // Educational Technology & Society. 2008. № 11(1). - С. 367-374. (

6. Неелова Н.В., Сычугов А.А. Сравнение результатов детектирования дублей методом шинглов и методом Джаккарда // Вестник РГРТУ. 2010. № 4. Вып. 34). - С. 72-78

7. Дягилев В.В., Цхай А.А., Бутаков С.В. Архитектура сервиса определения плагиата, исключающая возможность нарушения авторских прав // Вестник НГУ. Серия: Информационные технологии. Барнаул, 2011. Том 9. Вып. 3. - С. 26-29

8. Шахрай С.М., Аристер Н.И., Тедеев О.О. О плагиате в произведениях науки (диссертациях на соискание ученой степени): научно-методическое пособие. М.: МИИ, 2014. - 176 с

9. Broder A. On the resemblance and containment of documents // Compression and Complexity of Sequences (SEQUENCES’97). IEEE Computer Society, 1998. - P. 21-29. 10. Большой толковый словарь современного украинского языка. Киев: Ирпень; ВТФ «Перун», 2005. - С. 977

10. Stein B., Koppel M. Plagiarism Analysis, Authorship Identification, and Near-Duplicate Detection PAN’07 (англ.) // ACM SIGIR Forum. 2011. - Р. 68-71.

11. Мартыненко Г.Я. Основы стилеметрии. Л.: Изд-во ЛГУ, 1988. - 176 с.

12. Комарницкая О.И. Совершенствование алгоритма латентно-семантического анализа нечеткой текстовой информации // Современный научный вестник. 2014. № 29(225). Серия: Филологические науки. Белгород: Руснаучкнига, 2014. - С. 58-62

13. Катеринчук И.С., Кулик В.Н., Комарницкая О.И. Интеллектуальная автоматизированная система контроля знаний: лингвистическая подсистема // Информационные технологии в образовании: сборник научных трудов. Вып. 7. Херсон: Изд-во ХГУ, 2010. - С. 33-39


Review

For citations:


Komarnitskaya O.I., Komarnitskaya I.I. METHOD OF THE SEMANTIC COMPARISON OF FUZZY INFORMATION ON TEXT PLAGIARISM. Philosophical Problems of IT & Cyberspace (PhilIT&C). 2015;(2):127-139. (In Russ.) https://doi.org/10.17726/philIT.2015.10.2.004.89

Views: 128


Creative Commons License
This work is licensed under a Creative Commons Attribution 4.0 License.


ISSN 2305-3763 (Online)