Технології Big Data аналітики в розподілених системах обчислень

Л. М. Олещенко

Анотація


Проаналізовані існуючі технології та програмні засоби Big Data аналітики, виділено їхпереваги та недоліки. Розглянуто інфраструктуру та статистичні методи аналізу Big Data.Проаналізовані технології розподіленої обробки, проблеми іденфікації та зберігання Big Data. На основі проведеного аналізу виділено основні проблеми Big Data аналітики, які у подальшому потребують вирішення

Ключові слова


Big Data; програмне забезпечення; розподілені обчислення; ІоT; Pandas; Python; статистична обробка даних; бази даних; ЦОД; Kafka; Cassandra; MapReduce; Hadoop; Spark

Посилання


BIG DATA: Інноваційні можливості підвищення прибутковості агробізнесу // [Електронний ресурс] – Режим доступу: http://www.agrobusiness.com.ua/ideii-i-trendy/8383-bigdata-innovatsiini-ozhlyvostipidvyschennia-prybutkovostiagrobiznesu.

html

Web Scraping Tools to Extract Online Data // [Електронний ресурс] – Режим доступу:https://www.hongkiat.com/blog/webscraping-

tools/

David Haertzen. ETL Tools // The Analytical Puzzle: Profitable Data Warehousing, Business Intelligence and Analytics. – Technics Publications, 2012. –

p.

ETL or ELT and the Use Case // [Електронний ресурс] – Режим доступу: https://www.linkedin.com/pulse/etl-elt-usecase-mich-talebzadeh-ph-d-/

What Is Apache Hadoop? // [Електронний ресурс] – Режим доступу: http://hadoop.apache.org/

Apache Kafka. А distributed streaming platform // [Електронний ресурс] – Режим доступу: https://kafka.apache.org/

Apache Cassandra // [Електронний ресурс] – Режим доступу: http://cassandra.apache.org/

Apache Spark. А fast and general engine for large-scale data processing // [Електронний ресурс] – Режим доступу: https://spark.apache.org/


Повний текст: PDF

Посилання

  • Поки немає зовнішніх посилань.


Ліцензія Creative Commons
Цей твір ліцензовано за ліцензією Creative Commons Із зазначенням авторства - Некомерційна - Без похідних творів 3.0 Неадаптована

ISSN 2073-4751