{"news":{"id":"659"}}

Что за Большие данные?

Утвержден ГОСТ Р ИСО/МЭК 20546-2021 «Информационные технологии. Большие данные. Обзор и словарь»


Говоря коротко и официально, данные (data) — это представление информации в формализованном виде. Их совокупность именуется массивом данных (data set). Большие по объему, разнообразию, скорости обработки и вариативности массивы данных называются уже большими данными (big data) и требуют использования технологий масштабирования для более эффективного хранения, обработки, управления и анализа. Данные при этом делят на структурированные, частично структурированные и неструктурированные.

Наука о данных (data science) — это извлечение практических знаний из данных посредством исследования или создания и проверки гипотез. В аналитику данных (data analytics) входит получение, сбор, проверка и обработка данных, включая их количественную оценку, визуализацию и интерпретацию. 

Похоже, что эти термины заменяют собой расхожее выражение data mining, под которым понимают совокупность методов обнаружения и извлечения паттернов (закономерностей) в данных в целях получения новых знаний. 

Это первый утвержденный нормативный документ в этой области. Кроме него существует добровольный «Кодекс этики использования данных» от Ассоциации больших данных, а единственный законопроект на эту тему №01/05/02-20/00099549 от 02.2020 «О внесении изменений в Федеральный закон „Об информации...“» был отозван в 2020 году. 

Стоит отметить, что применительно к большим данным выделяют такие классические методы их анализа, как ассоциативные правила, дерево принятия решений, кластеризация, регрессия и др. Основной технологией по работе с данными в настоящее время стало машинное обучение или применение искусственных нейронных сетей.

 

Новые термины добавлены в разделы Справочника кадастрового инженера «Цифровая трансформация» и «Базы данных».


Оригинал новости в журнале «Учет недвижимости»23.07.21
Войдите, чтобы оставить комментарий или задать вопрос.