Запис Детальніше

ОРГАНІЗАЦІЯ ВЕЛИКИХ ДАНИХ У РОЗПОДІЛЕНОМУ СЕРЕДОВИЩІ

Електронний архів E-archive DonNTU – (Electronic archive Donetsk National Technical University)

Переглянути архів Інформація
 
 
Поле Співвідношення
 
Title ОРГАНІЗАЦІЯ ВЕЛИКИХ ДАНИХ У РОЗПОДІЛЕНОМУ СЕРЕДОВИЩІ
Организация Больших данных в распределенной среде
Big data organizing in a distributed environment
 
Creator Шаховська, Н.Б.
Болюбаш, Ю.Я.
Верес, О.М.
Shakhovska, N.B.
Bolubash, Yu.Ya.
Veres, O.M.
 
Subject великі дані
інформаційний продукт
простір даних
большие данные
информационный продукт
пространство данных
big data
information products
data space
 
Description This paper introduced the concept of the term Big Data and analyzes the cause of its appearance. Big Data is a set of methods and tools for processing different types of structured and unstructured data in large amounts for their analysis and use of decision support. There is an alternative to traditional database management systems and solutions of Business Intelligence class. To this class belong the parallel data processing means (NoSQL, algorithms MapReduce, Hadoop). Defining characteristic for Big data is the amount (volume, in terms of volume size ), speed (velocity in terms of both growth rate and the need for high-speed processing and the results), diversity (variety, in terms of the possibility of simultaneous processing of different types of structured and semi-structured data). One of the technologies that should be used for large data region is the data space available. Data space is a block vector containing a set of information products divided into three categories: structured data (databases, data warehouses), semi-structured data (XML, spreadsheets) and unstructured data (text). Above this vector and its individual elements there are defined operations and predicates. A federated information model is posted that describes the data warehouse and its components. The features of non-relational NoSQL and other means of storage are described. We describe the data space as the technology of working with large data. The levels of physical model data space are given.
У статті уведено поняття терміну Великі дані та проаналізовано причину їх появи. Визначено причини використання NoSQL та інших нереляційних засобів зберігання даних. Описано простір даних як технологію роботи з Великими даними.
В статье введено понятие срока Большие данные и проанализированы причины их появления. Подано информационную модель федеративного хранилища данных и описаны его составные элементы. Определены особенности использования NoSQL и других нереляционных средств хранения данных. Описано пространство данных как технология работы с Большими данными. Описаны уровни физической модели пространства данных.
 
Date 2014-08-29T18:23:52Z
2014-08-29T18:23:52Z
2014-06
 
Type Article
 
Identifier Наукові праці Донецького національного технічного університету. Серія: Обчислювальна техніка та автоматизація. Випуск 2(27). - Донецьк: ДонНТУ, 2014. - 229 с
2075-4272
http://ea.donntu.edu.ua/handle/123456789/27338
 
Relation Наукові праці Донецького національного технічного університету. Серія: Обчислювальна техніка та автоматизація. Випуск 2(27). - Донецьк: ДонНТУ, 2014. - С. 147-155.;
 
Publisher ДонНТУ