Большие языковые модели и их роль в современных научных открытиях
https://doi.org/10.17726/philIT.2024.1.3
Аннотация
Сегодня большие языковые модели являются очень мощным информационно‑аналитическим инструментом, значительно ускоряющим большинство существующих методов и методологий обработки информационных процессов. Особую значимость в этом качестве получает научная информация, в которую постепенно вовлекаются мощности больших языковых моделей. Такое взаимодействие науки и качественно новых возможностей работы с информацией приводит нас к новым, уникальным научным открытиям, их большому количественному многообразию. Происходит ускорение научного поиска, сокращение временных затрат на его осуществление – высвободившееся время можно потратить как на решение новых научных проблем, так и на научное творчество, которое хотя может и необязательно привести к конкретному решению того или иного научного вопроса, но способно продемонстрировать красоту науки в различных дисциплинарных направлениях. В результате взаимодействие больших языковых моделей и научной информации – это одновременно и поиск‑решение научных проблем, и научное творчество. Решение задач науки требует возможности эффективной обработки больших данных, что нельзя осуществить без эффективного метода. Одним из значимых методов стала архитектура Transformer, представленная в 2017 году и комплексно интегрированная в модель GPT‑3, которая, по состоянию на сентябрь 2020 года, являлась самой крупной и продвинутой языковой моделью в мире. Поэтому GPT‑3 можно назвать базисом большинства научных разработок, осуществляемых в контексте использования больших языковых моделей. Взаимодействие науки и больших языковых моделей стало фактором возникновения большого количества вопросов, среди которых можно выделить такие: является ли результат анализа данных новым знанием, каковы перспективы научного творчества в эпоху больших вычислений. В настоящее время эти вопросы крайне значимы, поскольку именно они позволяют выработать основы эффективного взаимодействия человека и компьютера. Поэтому в данном исследовании производится анализ представленных вопросов.
Об авторе
В. Ю. ФилимоновРоссия
Филимонов Владимир Юрьевич - аспирант Института подготовки кадров высшей квалификации.
Пятигорск
Список литературы
1. Romera‑Paredes, B., Barekatain, M., Novikov, A. et al. (2024) Mathematical discoveries from program search with large language models. Nature 625, P. 468‑475.
2. Trinh, T.H., Wu, Y., Le, Q.V. et al. (2024) Solving Olympiad geometry without human demonstrations. Nature 625, P. 476‑482.
3. Gonthier, G. et al. (2013) A Machine‑Checked Proof of the Odd Order Theorem. In: Blazy, S., Paulin‑Mohring, C., Pichardie, D. (eds) Interactive Theorem Proving. ITP 2013. Lecture Notes in Computer Science, vol. 7998. Springer, Berlin, Heidelberg.
4. Iten, R., Metger, T., Wilming, H., del Rio L., Renner R. (2020) Discovering Physical Concepts with Neural Networks. Phys. Rev. Lett. Vol. 124, P. 1‑6.
5. Fawzi, A., Balog, M., Huang, A. et al. (2022) Discovering faster matrix multiplication algorithms with reinforcement learning. Nature 610, P. 47‑53.
6. Melnikov, A. A. (2019) Predicting quantum advantage by quantum walk with convolutional neural networks. New Journal of Physics, Vol. 21, No. 12. P. 1‑11.
7. Liew, A. (2007) Understanding Data, Information, Knowledge And Their Inter‑Relationships. Journal of Knowledge Management Practice. Vol. 7, P. 1‑10.
8. Поручиков М. А. Data analysis. Samara: Izd‑vo Samarskogo universiteta, 2016. 88 с.
9. Data analysis technologies / Садовникова Н. П., Щербаков М. В. Volgograd: VolgGTU, 2021. 75 с.
10. Никифоров А. Л. Analysis of the concept of «knowledge»: approaches and problems // Epistemology & Philosophy of Science. 2009. № 3. С. 61‑73.
11. Касавин И. Т. Encyclopedia of Epistemology and Philosophy of Science. M.: «Kanon+», ROOI «Reabilitaciya», 2009. 1248 c.
12. Барышников П. Н. Metaforicheskie osnovaniya komp`yutacionalizma v kognitivny`x naukax i filosofii soznaniya // Filosofiya nauki i texniki. 2018. № 2. С. 61‑72.
13. Барышников П. Н. Filosofiya it, high‑hume i … mifologiya // Filosofskie problemy` informacionny`x texnologij i kiberprostranstva. 2012. № 1. С. 15‑23.
14. Digital Пётр – Распознавание рукописей Петра I с помощью компьютерного зрения // SberA I. https://fusionbrain.ai/digital-petr.
15. AlphaFold reveals the structure of the protein universe // Google DeepMind. https://deepmind.google/discover/blog/alphafold-reveals-the-structure-of-the-protein-universe.
16. Летние конференции Турнира городов // Международный математический Турнир Городов. https://turgor.ru/lktg.
17. Технология обработки сейсмических данных на основе асимптотических методов и методов машинного обучения для поиска и описания трещиноватых коллекторов // Российский научный фонд. https://www.rscf.ru/project/21-71-20002.
Рецензия
Для цитирования:
Филимонов В.Ю. Большие языковые модели и их роль в современных научных открытиях. Философские проблемы информационных технологий и киберпространства. 2024;(1):42-57. https://doi.org/10.17726/philIT.2024.1.3
For citation:
Filimonov V.Yu. Large language models and their role in modern scientific discoveries. Philosophical Problems of IT & Cyberspace (PhilIT&C). 2024;(1):42-57. (In Russ.) https://doi.org/10.17726/philIT.2024.1.3