{"source":{"id":"100"}}

ГОСТ Р ИСО/МЭК 20546-2021 «Информационные технологии. Большие данные. Обзор и словарь» (предварительная версия)

08.05.2020
ПараграфЦитатаПунктПодтверждено
[1139]большие данные (big data): большие массивы данных (3.1.11), – главным образом, по таким характеристикам данных (3.1.5), как объем, разнообразие, скорость обработки и/или вариативность, – которые требуют использования технологии масштабирования для эффективного хранения, обработки, управления и анализа.п.3.1.2
[1288]облачные вычисления (cloud computing): парадигма для обеспечения сетевого доступа к масштабируемому и гибкому пулу совместно используемых физических или виртуальных ресурсов с системой самообслуживания и администрированием по требованию.п.3.1.3
[1289]данные (data): реинтерпретируемое представление информации в формализованном виде, пригодном для коммуникации, интерпретации или обработкип.3.1.5
[1290]аналитика данных (data analytics): составное понятие, состоящее из получения, сбора, проверки и обработки данных (3.1.9), включая их количественную оценку, визуализацию и интерпретацию.п.3.1.6
[1291]база данных (database): совокупность данных (3.1.5), организованная в соответствии с концептуальной структурой, которая описывает характеристики этих данных и взаимосвязи между их соответствующими объектами, обеспечивая одну или несколько областей применения.п.3.1.7
[1292]модель данных (data model): схема структурирования данных (3.1.5) в базе данных (3.1.7) в соответствии с формальными описаниями в ее информационной системе и требованиями используемой системы управления базой данных.п.3.1.8
[1293]обработка данных (data processing): систематическое выполнение операций с данными (3.1.5). Примечания 1 Пример: Арифметические или логические операции с данными, объединение или сортировка данных или такие операции с текстом, как редактирование, сортировка, объединение, хранение, извлечение, отображение или печать.п.3.1.9
[1294]наука о данных (data science): извлечение практических знаний из данных (3.1.5) посредством исследования или создания и проверки гипотез.п.3.1.10
[1295]массив данных (data set, dataset): идентифицируемая совокупность данных (3.1.5), к которой можно получить доступ или скачать в одном или нескольких форматах.п.3.1.11
[1296]тип данных (data type, datatype): определенный массив объектов данных (3.1.5) конкретной структуры данных и набор допустимых операций, в рамках которых эти объекты данных выступают в роли операндов при выполнении любой из этих операцийп.3.1.12
[1296]Пример: Целочисленный тип данных имеет очень простую структуру, каждый экземпляр которой, обычно называемый значением, представляет собой член заданного диапазона целых чисел, а допустимые действия включают в себя обычные арифметические операции над этими целыми числами.п.3.1.12
[1298]вариативность данных (data variability): изменения в скорости передачи, формате или структуре, семантике или качестве массива данных (3.1.11).п.3.1.13
[1299]разнообразие данных (data variety): диапазон форматов, логических моделей, временных шкал и семантики массива данных (3.1.11)п.3.1.14
[1300]скорость обработки данных (data velocity): скорость потока, с которой данные (3.1.5) создаются, передаются, хранятся, анализируются или визуализируютсяп.3.1.15
[1301]достоверность данных (data veracity): полнота и/или точность данных (3.1.5).п.3.1.16
[1301]Под достоверностью данных понимаются пояснительные данные и самоанализ объектов для поддержки принятия решений в режиме реального временип.3.1.16
[1302]изменчивость данных (data volatility): характеристика данных (3.1.5), относящаяся к скорости изменения этих данных с течением времени.п.3.1.17
[1303]объем данных (data volume): степень количества данных (3.1.5), оказывающая влияние на ресурсы для вычислений и хранения, а также на управление ими в процессе обработки данныхп.3.1.18
[1304]распределенная обработка данных (distributed data processing): обработка данных (3.1.9), в которой выполнение операций распределено между узлами компьютерной сети.п.3.1.19
[1305]метаданные (metadata): данные (3.1.5) о данных или элементах данных, которые могут включать в себя их описания, а также данные о владении данными, путях и правах доступа и об изменчивости данных (3.1.17).п.3.1.24
[1306]нереляционная база данных (non-relational database): база данных (3.1.7), не следующая реляционной моделип.3.1.25
[1307]нереляционная модель данных (non-relational model): логическая модель данных (3.1.10), не следующая реляционной модели (3.1.31) хранения и обработки данныхп.3.1.26
[1308]реляционная алгебра (relational algebra): алгебра для выражения и манипулирования отношениямип.3.1.29
[1309]реляционная база данных (relational database): база данных (3.1.7), данные в которой организованы по реляционной моделип.3.1.30
[1310]реляционная модель данных (relational model): модель данных (3.1.10), структура которой основана на реляционных отношенияхп.3.1.31
[1311]потоковые данные (streaming data): данные (3.1.5), передаваемые через интерфейс от непрерывно работающего источникап.3.1.34
[1312]структурированные данные (structured data): данные (3.1.5), организованные на основе предопределенного (применимого) наборап.3.1.35
[1313]частично структурированные данные (partially structured data): данные (3.1.5), имеющие некую структуру.п.3.1.28
[812]SQL: язык баз данных, описанный в Международном стандарте ISO/IEC (ИСО/МЭК) 9075п.3.1.36
[1314]неструктурированные данные (unstructured data): данные (3.1.5), характеризуемые отсутствием какой-либо структуры, кроме структуры на уровне записи или файла.п.3.1.37
[1307]Примерами моделей нереляционных баз данных являются столбец, разреженная таблица, ключ-значение, документ-ключ и графические модели.п.3.3.3.10