ОРГАНІЗАЦІЯ ВЕЛИКИХ ДАНИХ У РОЗПОДІЛЕНОМУ СЕРЕДОВИЩІ
Електронний архів E-archive DonNTU – (Electronic archive Donetsk National Technical University)
Переглянути архів ІнформаціяПоле | Співвідношення | |
Title |
ОРГАНІЗАЦІЯ ВЕЛИКИХ ДАНИХ У РОЗПОДІЛЕНОМУ СЕРЕДОВИЩІ
Организация Больших данных в распределенной среде Big data organizing in a distributed environment |
|
Creator |
Шаховська, Н.Б.
Болюбаш, Ю.Я. Верес, О.М. Shakhovska, N.B. Bolubash, Yu.Ya. Veres, O.M. |
|
Subject |
великі дані
інформаційний продукт простір даних большие данные информационный продукт пространство данных big data information products data space |
|
Description |
This paper introduced the concept of the term Big Data and analyzes the cause of its appearance. Big Data is a set of methods and tools for processing different types of structured and unstructured data in large amounts for their analysis and use of decision support. There is an alternative to traditional database management systems and solutions of Business Intelligence class. To this class belong the parallel data processing means (NoSQL, algorithms MapReduce, Hadoop). Defining characteristic for Big data is the amount (volume, in terms of volume size ), speed (velocity in terms of both growth rate and the need for high-speed processing and the results), diversity (variety, in terms of the possibility of simultaneous processing of different types of structured and semi-structured data). One of the technologies that should be used for large data region is the data space available. Data space is a block vector containing a set of information products divided into three categories: structured data (databases, data warehouses), semi-structured data (XML, spreadsheets) and unstructured data (text). Above this vector and its individual elements there are defined operations and predicates. A federated information model is posted that describes the data warehouse and its components. The features of non-relational NoSQL and other means of storage are described. We describe the data space as the technology of working with large data. The levels of physical model data space are given.
У статті уведено поняття терміну Великі дані та проаналізовано причину їх появи. Визначено причини використання NoSQL та інших нереляційних засобів зберігання даних. Описано простір даних як технологію роботи з Великими даними. В статье введено понятие срока Большие данные и проанализированы причины их появления. Подано информационную модель федеративного хранилища данных и описаны его составные элементы. Определены особенности использования NoSQL и других нереляционных средств хранения данных. Описано пространство данных как технология работы с Большими данными. Описаны уровни физической модели пространства данных. |
|
Date |
2014-08-29T18:23:52Z
2014-08-29T18:23:52Z 2014-06 |
|
Type |
Article
|
|
Identifier |
Наукові праці Донецького національного технічного університету. Серія: Обчислювальна техніка та автоматизація. Випуск 2(27). - Донецьк: ДонНТУ, 2014. - 229 с
2075-4272 http://ea.donntu.edu.ua/handle/123456789/27338 |
|
Relation |
Наукові праці Донецького національного технічного університету. Серія: Обчислювальна техніка та автоматизація. Випуск 2(27). - Донецьк: ДонНТУ, 2014. - С. 147-155.;
|
|
Publisher |
ДонНТУ
|
|