Слово в техногенном многомерном пространстве
https://doi.org/10.17726/philIT.2022.1.2
Аннотация
Сегодня искусственный интеллект активно осваивает естественные языки, становясь собеседником и партнером человека в разных аспектах деятельности. Однако символьный подход, подразумевающий передачу правил и логики, потерпел фиаско, а количество правил и исключений языка не позволяет провести его формализацию, поэтому современное «глубокое обучение» искусственных нейронных сетей подразумевает самостоятельный поиск закономерностей в обширных базах данных. В ходе обучения искусственный интеллект ставит слово в предложение, чтобы синтагматические отношения были максимально приближенными к таковому у целевого слова в базе, учитывая как семантические связи слов, так и отношения между словами в последовательности изложения. «Язык» информационных технологий цифровой. При работе с естественным языком слова представляются в векторной форме как последовательность чисел. Идея представлять слова математически знакома людям и ассоциируется, как правило, с логической непротиворечивостью. Визуализация положения слов в многомерном пространстве, созданном искусственным интеллектом, демонстрирует ряд закономерностей, очевидных семантических и синтаксических взаимосвязей, однако суть других отношений между словами неочевидна. Математическое представление слов, созданное искусственным интеллектом, может позволить взглянуть на язык с новой, нечеловеческой точки зрения.
Об авторе
Д. С. БыльеваРоссия
Быльева Дарья Сергеевна - кандидат политических наук, доцент
Санкт-Петербург
Список литературы
1. Ullmann L. The quasi-other as a Sobject // Technology and Language. – 2022. – № 1(3). – P. 76-81. – URL: https://doi.org/10.48417/technolang.2022.01.08.
2. Bylieva D. Language of AI // Technology and Language. – 2022. – № 1(3). – P. 111-126. – URL: https://doi.org/10.48417/technolang.2022.01.11.
3. Chomsky N. Syntactic Structures. – Berlin: Mouton, 1957. – 116 p. – URL: https://doi.org/10.1515/9783112316009.
4. Crystal D. The lure of words // The Oxford handbook of the word. – Oxford: Oxford University Press, 2015. – P. 23-28.
5. Лебедев С. А. Математика и технические науки – основа целостности современного научного знания // Гуманитарный вестник. – 2018. – № 72(10). – С. 22-48.
6. Штейнгауз Г. Задачи и размышления. – М.: Мир, 1974. – 168 c.
7. Hähnle R. Program and Code // Technology and Language. – 2022. – № 3(2). – URL: https://doi.org/10.48417/technolang.2022.02.06.
8. Cambria E., White B. Jumping NLP Curves: A Review of Natural Language Processing Research [Review Article] // IEEE Computational Intelligence Magazine. – 2014. – № 2(9). – P. 48-57. – URL: https://doi.org/10.1109/MCI.2014.2307227.
9. Lake B. M., Ullman T.D., Tenenbaum J.B., Gershman S. J. Building machines that learn and think like people // Behavioral and Brain Sciences. 2017. – (40). – e253. – URL: https://doi.org/10.1017/S0140525X16001837.
10. Spelke E. S., Gutheil G. & Van de Walle G. The development of object perception // An invitation to cognitive science: vol. 2. Visual cognition. 2nd ed. Bradford, 1995. – P. 297-330.
11. Spelke E. S., Kinzler K.D. Core knowledge // Developmental Science. 2007. № 1(10). P. 89-96. – URL: https://doi.org/10.1111/j.1467-7687.2007.00569.x.
12. Capone L. Which Theory of Language for Deep Neural Networks? Speech and Cognition in Humans and Machines // Technology and Languag. – 2021. – № 4(2). – P. 29-60. – URL: https://doi.org/10.48417/technolang.2021.04.03.
13. Кузнецов В. Г. Интенсиональная силлогистика Г. В. Лейбница и ее роль в истории логики // Вестник Московского университета. Серия 7. Философия. – 2017. – № 4. – С. 3-18.
14. Лейбниц Г.В. Сочинения в четырех томах: Т. 3. – М.: Мысль, 1984. – 734 c.
15. Нордманн А. Языковое мышление и мышление языка у Георга Кристофа Лихтенберга: «где … любая погрешность против истины была бы также и грамматической» // Семиотические исследования. – 2021. – № 4. – С. 29-38. – URL: https://doi.org/10.18287/2782-2966-2021-1-4-29-38.
16. Fritz G. Theories of meaning change: An overview // Semantics – Typology, Diachrony and Processing. De Gruyter, 2019. – P. 113-146.
17. Faraj G. A.K. Semantic Field of Utterances in «‘Healthy Living Guide’» // International Journal on Humanities and Social Sciences. – 2022. – № 32. – P. 186-197. – URL: https://doi.org/10.33193/IJoHSS.32.2022.400.
18. Trier J. Der deutsche Wortschatz im Sinnbezirk des Verstandes. Von den Anfangen bis zum Beginn des. Jahrhunderts. – Heidelberg: Carl Winter Universitatsverlag, 1973.
19. Gärdenfors P. Conceptual spaces: The geometry of thought. – Cambridge, MA: MIT Press, 2009.
20. Gärdenfors P. Semantics Based on Conceptual Spaces // Logic and Its Applications. ICLA 2011. Lecture Notes in Computer Science, vol 6521. Cham: Springer, 2011. – P. 1-11. – URL: https://doi.org/10.1007/978-3-642-18026-2_1.
21. Gärdenfors P., Zenker F. Conceptual Spaces at Work // Applications of Conceptual Spaces, Synthese Library 359. – Cham: Springer, 2015. – P. 3-13. – URL: https://doi.org/10.1007/978-3-319-15021-5_1.
22. Banaee H., Loutfi A. Using Conceptual Spaces to Model Domain Knowledge in Data-to-Text Systems // Proceedings of the 8th International Natural Language Generation Conference (INLG). – Cham: Springer, 2014. – P. 11-15. URL: https://doi.org/10.3115/v1/W14-4403.
23. Mikolov T., Chen K., Corrado G., Dean J. Efficient estimation of word representations in vector space // 1st International Conference on Learning Representations, ICLR2013 – Workshop Track Proceedings. ICLR, 2013. – ArXiv ID: 1301.3781.
24. Prepare Your Data. – URL: https://developers.google.com/machinelearning/guides/text-classification/step-3.
25. Sundararaman D., Subramanian V., Wang G., Si S., Shen D., Wang D., Carin L. Syntax-Infused Transformer and BERT models for Machine Translation and Natural Language Understanding. 2019. – ArXiv ID: 1911.06156.
26. Mikolov T., Sutskever I., Chen K., Corrado G. S., Dean J. Distributed Representations of Words and Phrases and their Compositionality // Advances in Neural Information Processing Systems 26 (NIPS2013). Neurips, 2013. – P. 3111-3119. – URL: https://proceedings.neurips.cc/paper/2013/file/9aa42b31882ec039965f3c4923ce901b-Paper.pdf.
27. Alammar J. The Illustrated Word2vec. – 2019. – URL: https://jalammar.github.io/illustrated-word2vec.
28. Church K., Liberman M. The Future of Computational Linguistics: On Beyond Alchemy // Frontiers in Artificial Intelligence. – 2021. – Vol. 4. – URL: https://doi.org/10.3389/frai.2021.625341.
Рецензия
Для цитирования:
Быльева Д.С. Слово в техногенном многомерном пространстве. Философские проблемы информационных технологий и киберпространства. 2022;(1):18-33. https://doi.org/10.17726/philIT.2022.1.2
For citation:
Bylieva D.S. Word in technogenic multidimensional space. Philosophical Problems of IT & Cyberspace (PhilIT&C). 2022;(1):18-33. (In Russ.) https://doi.org/10.17726/philIT.2022.1.2