Розвідувальний аналіз та візуалізація набору даних на прикладі підприємства електронної торгівлі
DOI:
https://doi.org/10.18372/2073-4751.79.19385Ключові слова:
розвідувальний аналіз, візуалізація даних, часові ряди, кореляційний аналіз, кластерний аналіз, машинне навчанняАнотація
У цій статті представлений підхід до розвідувального аналізу та візуалізації набору даних на прикладі підприємства електронної торгівлі. В дослідженні розглядаються ключові етапи розвідувального аналізу даних: попередню обробку даних, візуалізацію, видалення аномалій, кореляційний та кластерний аналізи для підготовки даних до вирішення задач машинного навчання у майбутніх дослідженнях. До цих задач входять: оцінка моделі часового ряду, виявлення тренду, сезонних та циклічних складових часового ряду, кластеризація клієнтів, класифікація нових клієнтів, прогнозування кількості проданих одиниць по кластерам клієнтів. Розроблений підхід може бути використаний для аналізу інших наборів даних електронної торгівлі.
Посилання
Пінцак І. Використання машинного навчання та аналізу даних для прогнозування тенденцій у електронній комерції. Information Technology: Computer Science, Software Engineering and Cyber Security. 2024. № 1. С. 80–88. DOI: 10.32782/it/2024-1-10.
Про електронну комерцію: Закон України від 01.01.2024 № 675-VIII. URL: https://zakon.rada.gov.ua/laws/show/675-19#Text (дата звернення: 01.09.2024).
Що чекає на український e-commerce у 2024 році: розбираємо ключові тренди? URL: https://rau.ua/novyni/ukr-e-commerce-2024-trendi/ (дата звернення: 10.09.2024).
12 Best Machine Learning Strategies for E-commerce Businesses. URL: https://www.prefixbox.com/blog/machine-learning-for-ecommerce/ (дата звернення: 24.09.2024).
Apache Superset. The Apache Software Foundation. URL: https://superset.apache.org/ (дата зве-рнення: 01.10.2024).
Chen D., Sain S. L., Guo K. Data mining for the online retail industry: A case study of RFM model-based customer segmentation using data mining. Journal of Database Marketing & Customer Strategy Management. 2012. Vol. 19, no. 3. P. 197–208. URL: https://doi.org/10.1057/dbm.2012.17.
García-Aroca C. et al. An algorithm for automatic selection and combination of forecast models. Expert Systems with Applications. 2024. 121636. DOI: 10.1016/j.eswa.2023.121636.
How Ukrainian eCommerce Survived 2023. Annual Indicators & Forecast 2024. URL: https://www.promodo.com/research/ukrainian-ecommerce-2023#obsyag-ukrayinskogo-rinku-2023 (дата звернення: 11.09.2024).
Syakur M.A. et al. Integration K-Means Clustering Method and Elbow Method For Identification of The Best Customer Profile Cluster. IOP Conference Series: Materials Science and Engineering. 2018. Т. 336. 012017. DOI: 10.1088/1757-899x/336/1/012017.
Looker Studio Overview. URL: https://lookerstudio.google.com/ (дата звернення: 01.10.2024).
Matplotlib – Visualization with Python. URL: https://matplotlib.org/ (дата звернення: 02.10.2024).
NumPy. The fundamental package for scientific computing with Python. URL: https://numpy.org/ (дата звернення: 02.10.2024).
Pandas. Python Data Analysis Library. URL: https://pandas.pydata.org/ (дата звернення: 02.10.2024).
Power BI. Uncover powerful insights and turn them into impact. URL: https://www.microsoft.com/en-us/power-platform/products/power-bi (дата звернення: 01.10.2024).
Scikit-learn: machine learning in Python. URL: https://scikit-learn.org/stable/ (дата звернення: 03.10.2024).
Seaborn: statistical data visualization. URL: https://seaborn.pydata.org/ (дата звернення: 03.10.2024).
Sinaga K. P., Yang M.-S. Unsupervised K-Means Clustering Algorithm. IEEE Access. 2020. Т. 8. С. 80716–80727. DOI: 10.1109/access.2020.2988796.
Tableau: Business Intelligence and Analytics Software. URL: https://www.tableau.com/ (дата звер-нення: 01.10.2024).
Taylor S. J., Letham B. Forecasting at Scale. The American Statistician. 2018. Т. 72, № 1. С. 37–45. DOI: 10.1080/00031305.2017.1380080.
##submission.downloads##
Опубліковано
Номер
Розділ
Ліцензія
Автори, які публікуються у цьому журналі, погоджуються з наступними умовами:- Автори залишають за собою право на авторство своєї роботи та передають журналу право першої публікації цієї роботи на умовах ліцензії Creative Commons Attribution License, котра дозволяє іншим особам вільно розповсюджувати опубліковану роботу з обов'язковим посиланням на авторів оригінальної роботи та першу публікацію роботи у цьому журналі.
- Автори мають право укладати самостійні додаткові угоди щодо неексклюзивного розповсюдження роботи у тому вигляді, в якому вона була опублікована цим журналом (наприклад, розміщувати роботу в електронному сховищі установи або публікувати у складі монографії), за умови збереження посилання на першу публікацію роботи у цьому журналі.
- Політика журналу дозволяє і заохочує розміщення авторами в мережі Інтернет (наприклад, у сховищах установ або на особистих веб-сайтах) рукопису роботи, як до подання цього рукопису до редакції, так і під час його редакційного опрацювання, оскільки це сприяє виникненню продуктивної наукової дискусії та позитивно позначається на оперативності та динаміці цитування опублікованої роботи (див. The Effect of Open Access).