ИСПОЛЬЗОВАНИЕ ЯЗЫКА PYTHON ДЛЯ ПРОВЕДЕНИЯ ИССЛЕДОВАНИЙ И ВИЗУАЛИЗАЦИИ ДАННЫХ

Опубликовано в журнале: Научный журнал «Интернаука» № 4(274)
Рубрика журнала: 3. Информационные технологии
DOI статьи: 10.32743/26870142.2023.4.274.352307
Библиографическое описание
Абдурахимов М.А., Лагунов А.Ю. ИСПОЛЬЗОВАНИЕ ЯЗЫКА PYTHON ДЛЯ ПРОВЕДЕНИЯ ИССЛЕДОВАНИЙ И ВИЗУАЛИЗАЦИИ ДАННЫХ // Интернаука: электрон. научн. журн. 2023. № 4(274). URL: https://internauka.org/journal/science/internauka/274 (дата обращения: 03.05.2024). DOI:10.32743/26870142.2023.4.274.352307

ИСПОЛЬЗОВАНИЕ ЯЗЫКА PYTHON ДЛЯ ПРОВЕДЕНИЯ ИССЛЕДОВАНИЙ И ВИЗУАЛИЗАЦИИ ДАННЫХ

Абдурахимов Муслимбек Абдулбоки угли

студент кафедры фундаментальной и прикладной физики, Высшая школа естественных наук и технологий Северного Арктического Федерального Университета,

РФ, г. Архангельск

Лагунов Алексей Юрьевич

доц. кафедры фундаментальной и прикладной физики, Высшая школа естественных наук и технологий Северного Арктического Федерального Университета,

РФ, г. Архангельск

 

USING PYTHON FOR RESEARCH AND DATA VISUALIZATION

Abdurakhimov M.A

Lagunov A.Yu

 

АННОТАЦИЯ

В последние годы инфекция COVID-19 считается одной из самых вредных проблем для человечества, так как она нанесла огромный ущерб мировой экономике. Помимо того, что это заболевание унесло миллионы людей, оно лишило многих людей качественного образования и активного образа жизни. Кроме того, из-за множества неясных и неполных источников распространение инфекции увеличивается, и из-за этого она наносит большой ущерб жизни и финансам людей. Таким образом, необходимо решить эту проблему, создав новые и эффективные системы для анализа, мониторинга уровня распространения и предотвращения распространения инфекции с использованием новейших технологий. В статье представлены результаты анализа имеющихся данных, определены дополнительные признаки, которые можно использовать для построения графической карты рассеяния инфекции, и разработаны методы интерактивной визуализации и прогнозирования динамики COVID-19.

ABSTRACT

In recent years, the COVID-19 infection has been considered one of the most harmful problems for humanity as it caused huge damage to the economy of the world. Apart from claiming millions of people, this disease has deprived many people of quality education and active lifestyle. In addition, due to many unclear and incomplete sources, the spread of infection is increasing, and because of this, it is causing great damage to people's lives and finances. Thus, it is mandatory to solve this problem, with creating new and effective systems to analyze, monitor the level of spread and prevent the spread of infection using the latest technologies. The article presents the results of an analysis of the available Worldwide COVID-19 data, identifies additional features that can be used to build a graphical scatter map of the infection, and develops methods for interactive visualization and forecasting of COVID-19 dynamics.

 

Ключевые слова: Визуализации данных, программный язык Python, Numpy, Pandas, Matplotlib, COVID-19.

Keywords: Data visualization, Python programming language, Numpy, Pandas, Matplotlib, COVID-19.

 

Введение

Во время пандемии COVID-2019 (SARS- CoV-2) глобальные и важные изменения, связанные с переоценкой образа человека. Коронавирусная болезнь 2019 года (COVID-19) быстро распространяется по Китаю, и по состоянию на 16 февраля 2020 года о ней сообщили в 26 странах мира [1]. Пандемия Всемирная пандемия COVID-2019 почти закончилась с ее запуском множество направлений деятельности. Роль и задачи человека в условиях пандемии высокая цена изменилась из-за изменившихся обстоятельств. Отчет панели В конце 2020 года Всемирный банк опубликовал статью «COVID-19 и народный капитал». Эта статья посвяшена на хронологию пандемии COVID-19 с точки зрения состояния и перспектив общественного здравоохранения и образование населения.

Таким образом, в настоящее время существует потребность в разработке специальные интеллектуальные подходы с использованием инструментов машинного обучения и в разработке новых современных методов для визуализации ежедневное обновление информации о заболеоваемости инфекции коронавирусом и изучения различные аспекты распространения эпидемии COVID-19 в их контексте воздействие на человеческий капитал на региональном уровне [2].

На сегодняшний день существует множество различных программ продукты, различающиеся техническими характеристиками, и другие параметры, такие как Matlab, Scilab, GNU Octave, ParaView, LabVIEW, SMath Studio, SciDAVis и т. д. [3].

Но с точки зрения скорости, точности, надежности и простоты python и его библиотеки являются одними из самых эффективных программ, и особенно при работе с очень большими данными занимающих большие объемы памяти они могут нам очень помочь.

Описание данных

Для построения моделей использовался официальные данные о распространении инфекции COVID-19, подтвержденные международными организациями. Такие панель инструментов, впервые опубликовано 22 января, показывает местонахождение и количество подтвержденных случаев COVID-19, смертей и выздоровлений во всех затронутых странах. Он был разработан, чтобы предоставить исследователям, органам общественного здравоохранения и широкой общественности удобный инструмент для отслеживания по мере ее развития [4]. В нашем датасете есть следующие данные: списки стран (country_region), их расположение (lat, long, location) и информация о днях, когда был зафиксирован COVID-19 (рис. 1).

 

Рисунок 1. Доступные данные

 

Проектирование и визуализация данных

Начинаем исследования набора данных. Чтобы было удобно и точно, мы добавляли количество людей с инфекцией за все дни в вышеприведенный набор данных и вычисляли сумму. Мы визуализировали окончательный вид созданной карты рассеяния (рис. 2). Для этого мы использовали python и его библиотеки, такие как:

  • pandas - для организации доступных данных;
  • NumPy - для работы с массивами; В нем реализовано множество возможностей, недоступных при работе с библиотекой простые списки. В Python любое изображение представлено массивом NumPy, определение пикселей на изображении [5].
  • pyplot express, PIL (PythonImageLibrary) для их визуализации.

 

Рисунок 2. Карта зарегистрированных случаев COVID-19

 

Цветная полоса, показанная на рисунке 2, означает степень заболевания корона вирусом во всем мире. На картинке видно, что больше всего людей с COVID- 19 в США, более 90 миллионов человек.

Заключение

В этой статье собраны и отображены разнородные сложные данные инфекции COVID-19 с использованием новых функций и методов визуализации данных. Благодаря этой карте у нас будет возможность увидеть уровень коронавируса в четкой и полной форме. Распространение инфекции можно отличить по цвету, и это очень удобно. Это позволяет избежать многих рисков, потому что может быть полезно, когда люди выбирают страну для путешествий или других целей. В дальнейшем можно продолжить работу по улучшению качества и собирать все данные в одном месте, чтобы повысить уровень точности и отслеживать уровень заражения COVID-19 в режиме реального времени, привязав его к онлайн-сервисам MAPBOX и Heroku.

 

Список литературы:

  1. Bo Xu., Moritz U., G. Kraemer “Open access epidemiological data from the COVID-19 outbreak”, THE LANCET Infectious Diseases, 2020; vol. 20, issue 5; 534.
  2. Каширина И.Л., Aзарнова Т.В., Бондаренко Й.В., “Анализ влияния пандемии COVID-19 на развитие человеческого капитала региона с помощью алгоритмов машинного обучения”, Воронежский государственный университет, 2022; 1(36); 10
  3. Полякова А.С., “Программное приложение для визуализации пространственных данных на языке python”, Сolloquium-journal, 2019; 14-2(38); 177-180.
  4. Ensheng Dong, Hongru Du, Lauren Gardner, “An interactive web-based dashboard to track COVID-19 in real time”, THE LANCET Infectious Diseases, 2020; vol. 20, issue 5; 533-534
  5. Красочкин С.Г., “Изображения и визуализация данных в python”, Компания Xpate, 2022; 2(64); 5-8.
  6. Gabriel H. A. Medeiros, Lina F. Soualmia, Cecilia Zanni-Merk, Ramiz Hagverdiyev, “Tracking and analyzing COVID-19 dissemination using knowledge graphs”, Procedia Computer Science, 2022; vol. 207; 2172-2181.
  7. Srikar Chintala, Ritvik Dutta, Doron Tadmor., “COVID-19 spatiotemporal research with workflow-based data analysis”