Слово в техногенном многомерном пространстве

Д. С. Быльева

doi:10.17726/philIT.2022.1.2

Слово в техногенном многомерном пространстве

Д. С. Быльева

https://doi.org/10.17726/philIT.2022.1.2

Полный текст:

PDF (Rus)

сгенерировать QR код

Аннотация

Сегодня искусственный интеллект активно осваивает естественные языки, становясь собеседником и партнером человека в разных аспектах деятельности. Однако символьный подход, подразумевающий передачу правил и логики, потерпел фиаско, а количество правил и исключений языка не позволяет провести его формализацию, поэтому современное «глубокое обучение» искусственных нейронных сетей подразумевает самостоятельный поиск закономерностей в обширных базах данных. В ходе обучения искусственный интеллект ставит слово в предложение, чтобы синтагматические отношения были максимально приближенными к таковому у целевого слова в базе, учитывая как семантические связи слов, так и отношения между словами в последовательности изложения. «Язык» информационных технологий цифровой. При работе с естественным языком слова представляются в векторной форме как последовательность чисел. Идея представлять слова математически знакома людям и ассоциируется, как правило, с логической непротиворечивостью. Визуализация положения слов в многомерном пространстве, созданном искусственным интеллектом, демонстрирует ряд закономерностей, очевидных семантических и синтаксических взаимосвязей, однако суть других отношений между словами неочевидна. Математическое представление слов, созданное искусственным интеллектом, может позволить взглянуть на язык с новой, нечеловеческой точки зрения.

Ключевые слова

искусственный интеллект, язык, машинный перевод, слово, word2vec

Об авторе

Д. С. Быльева

Санкт-Петербургский политехнический университет Петра Великого
Россия

Быльева Дарья Сергеевна - кандидат политических наук, доцент

Санкт-Петербург

Список литературы

1. Ullmann L. The quasi-other as a Sobject // Technology and Language. – 2022. – № 1(3). – P. 76-81. – URL: https://doi.org/10.48417/technolang.2022.01.08.

2. Bylieva D. Language of AI // Technology and Language. – 2022. – № 1(3). – P. 111-126. – URL: https://doi.org/10.48417/technolang.2022.01.11.

3. Chomsky N. Syntactic Structures. – Berlin: Mouton, 1957. – 116 p. – URL: https://doi.org/10.1515/9783112316009.

4. Crystal D. The lure of words // The Oxford handbook of the word. – Oxford: Oxford University Press, 2015. – P. 23-28.

5. Лебедев С. А. Математика и технические науки – основа целостности современного научного знания // Гуманитарный вестник. – 2018. – № 72(10). – С. 22-48.

6. Штейнгауз Г. Задачи и размышления. – М.: Мир, 1974. – 168 c.

7. Hähnle R. Program and Code // Technology and Language. – 2022. – № 3(2). – URL: https://doi.org/10.48417/technolang.2022.02.06.

8. Cambria E., White B. Jumping NLP Curves: A Review of Natural Language Processing Research [Review Article] // IEEE Computational Intelligence Magazine. – 2014. – № 2(9). – P. 48-57. – URL: https://doi.org/10.1109/MCI.2014.2307227.

9. Lake B. M., Ullman T.D., Tenenbaum J.B., Gershman S. J. Building machines that learn and think like people // Behavioral and Brain Sciences. 2017. – (40). – e253. – URL: https://doi.org/10.1017/S0140525X16001837.

10. Spelke E. S., Gutheil G. & Van de Walle G. The development of object perception // An invitation to cognitive science: vol. 2. Visual cognition. 2nd ed. Bradford, 1995. – P. 297-330.

11. Spelke E. S., Kinzler K.D. Core knowledge // Developmental Science. 2007. № 1(10). P. 89-96. – URL: https://doi.org/10.1111/j.1467-7687.2007.00569.x.

12. Capone L. Which Theory of Language for Deep Neural Networks? Speech and Cognition in Humans and Machines // Technology and Languag. – 2021. – № 4(2). – P. 29-60. – URL: https://doi.org/10.48417/technolang.2021.04.03.

13. Кузнецов В. Г. Интенсиональная силлогистика Г. В. Лейбница и ее роль в истории логики // Вестник Московского университета. Серия 7. Философия. – 2017. – № 4. – С. 3-18.

14. Лейбниц Г.В. Сочинения в четырех томах: Т. 3. – М.: Мысль, 1984. – 734 c.

15. Нордманн А. Языковое мышление и мышление языка у Георга Кристофа Лихтенберга: «где … любая погрешность против истины была бы также и грамматической» // Семиотические исследования. – 2021. – № 4. – С. 29-38. – URL: https://doi.org/10.18287/2782-2966-2021-1-4-29-38.

16. Fritz G. Theories of meaning change: An overview // Semantics – Typology, Diachrony and Processing. De Gruyter, 2019. – P. 113-146.

17. Faraj G. A.K. Semantic Field of Utterances in «‘Healthy Living Guide’» // International Journal on Humanities and Social Sciences. – 2022. – № 32. – P. 186-197. – URL: https://doi.org/10.33193/IJoHSS.32.2022.400.

18. Trier J. Der deutsche Wortschatz im Sinnbezirk des Verstandes. Von den Anfangen bis zum Beginn des. Jahrhunderts. – Heidelberg: Carl Winter Universitatsverlag, 1973.

19. Gärdenfors P. Conceptual spaces: The geometry of thought. – Cambridge, MA: MIT Press, 2009.

20. Gärdenfors P. Semantics Based on Conceptual Spaces // Logic and Its Applications. ICLA 2011. Lecture Notes in Computer Science, vol 6521. Cham: Springer, 2011. – P. 1-11. – URL: https://doi.org/10.1007/978-3-642-18026-2_1.

21. Gärdenfors P., Zenker F. Conceptual Spaces at Work // Applications of Conceptual Spaces, Synthese Library 359. – Cham: Springer, 2015. – P. 3-13. – URL: https://doi.org/10.1007/978-3-319-15021-5_1.

22. Banaee H., Loutfi A. Using Conceptual Spaces to Model Domain Knowledge in Data-to-Text Systems // Proceedings of the 8th International Natural Language Generation Conference (INLG). – Cham: Springer, 2014. – P. 11-15. URL: https://doi.org/10.3115/v1/W14-4403.

23. Mikolov T., Chen K., Corrado G., Dean J. Efficient estimation of word representations in vector space // 1st International Conference on Learning Representations, ICLR2013 – Workshop Track Proceedings. ICLR, 2013. – ArXiv ID: 1301.3781.

24. Prepare Your Data. – URL: https://developers.google.com/machinelearning/guides/text-classification/step-3.

25. Sundararaman D., Subramanian V., Wang G., Si S., Shen D., Wang D., Carin L. Syntax-Infused Transformer and BERT models for Machine Translation and Natural Language Understanding. 2019. – ArXiv ID: 1911.06156.

26. Mikolov T., Sutskever I., Chen K., Corrado G. S., Dean J. Distributed Representations of Words and Phrases and their Compositionality // Advances in Neural Information Processing Systems 26 (NIPS2013). Neurips, 2013. – P. 3111-3119. – URL: https://proceedings.neurips.cc/paper/2013/file/9aa42b31882ec039965f3c4923ce901b-Paper.pdf.

27. Alammar J. The Illustrated Word2vec. – 2019. – URL: https://jalammar.github.io/illustrated-word2vec.

28. Church K., Liberman M. The Future of Computational Linguistics: On Beyond Alchemy // Frontiers in Artificial Intelligence. – 2021. – Vol. 4. – URL: https://doi.org/10.3389/frai.2021.625341.

Рецензия

Для цитирования:

Быльева Д.С. Слово в техногенном многомерном пространстве. Философские проблемы информационных технологий и киберпространства. 2022;(1):18-33. https://doi.org/10.17726/philIT.2022.1.2

For citation:

Bylieva D.S. Word in technogenic multidimensional space. Philosophical Problems of IT & Cyberspace (PhilIT&C). 2022;(1):18-33. (In Russ.) https://doi.org/10.17726/philIT.2022.1.2

Контент доступен под лицензией Creative Commons Attribution 4.0 License.

ISSN 2305-3763 (Online)

Логин
Пароль
	Запомнить меня
Регистрация нового пользователя Забыли Ваш пароль?

Войти

Философские проблемы информационных технологий и киберпространства

Слово в техногенном многомерном пространстве

Полный текст:

Аннотация

Ключевые слова

Об авторе

Список литературы

Рецензия

Для цитирования:

For citation:

Использование куки-файлов