Есть ли большая разница между наукой о данных, большими данными и базой данных?[закрыто]

datascience.stackexchange https://datascience.stackexchange.com/questions/13774

  •  16-10-2019
  •  | 
  •  

Вопрос

Есть ли большая разница между наукой о данных, большими данными и базой данных?я запутался в этих трёх, может ли кто-нибудь помочь мне выбраться из этой путаницы?

Это было полезно?

Решение

Ну, это совершенно разные вещи, но они каким-то образом связаны.Я пройдусь по каждому из них.

База данных

Подумайте о базе данных (в дальнейшем БД) как о компьютере, единственная цель которого — хранить данные, доступные для чтения.Под данными и фокусируясь только на SQL-подобных БД, я имею в виду в основном таблицы информации, такие как файлы Excel со столбцами и строками.Вы можете думать о базе данных SQL как об экосистеме таблиц Excel, которые имеют общее поле.Таким образом, по сути, БД — это аппаратная инфраструктура, которая позволяет записывать и читать внутри нее определенный объем информации (в самом начале это были простые компьютеры, конечно, с появлением специализированного оборудования в Интернете).Вы можете создать свою собственную БД на своем персональном компьютере.

Большие данные

«Разум, который в определенный момент познал бы все силы, приводящие природу в движение, и все положения всех предметов, из которых состоит природа…для такого интеллекта ничто не было бы неопределенным, и будущее, как и прошлое, было бы перед его глазами».

Лаплас не особо задумывался над этим, прежде чем сформулировать свое предложение, очевидно, если бы бог пришел к нему и дал то, что он хотел, рано или поздно он бы понял, что вся эта информация действительно бесполезна для него.Где он мог все это хранить?С чего ему начать читать?Что он может сделать с таким количеством информации, которую ему никогда не удастся вычислить?Если он мог прочитать все, что ему следует посчитать в первую очередь?

На все эти вопросы Big Data пытается ответить и найти решение.Большие данные появились вместе с появлением в Интернете огромных веб-сайтов, таких как Amazon или Google.В какой-то момент им нужно будет хранить так много информации, что ее невозможно будет хранить на одном компьютере, даже на большом, поэтому им придется использовать набор компьютеров, для которых предыдущие стандартные технологии БД больше не работали.Этот факт также послужил основой для создания базы данных No-SQL.

Подробнее о больших данных и не-sql здесь:http://www.kdnuggets.com/2016/07/seven-steps-understanding-nosql-databases.html

Наука о данных

Наконец, наука о данных — это статистическая наука, целью которой является извлечение порядка из хаоса, как и любая другая наука, однако в то же время остальные науки сосредоточены на одной «узкой» области знаний, такой как биология, химия и т. д.;Наука о данных, с другой стороны, является междисциплинарной наукой, которая может столкнуться с проблемами более широкого происхождения.Примерами могут быть маркетинг или бизнес-ориентация, космология и т. д.

Таким образом, наука о данных использует математические и компьютерные алгоритмы для получения некоторой полезной информации из неупорядоченного набора данных.И вот тут-то и возникает связь с большими данными, собственно, в заданном ранее вопросе:Что он может сделать с таким количеством информации, которую ему никогда не удастся вычислить?Таким образом, наука о данных и большие данные в настоящее время являются обычным явлением в большинстве ИТ-компаний, а также в более конкретных областях изо дня в день.Но наука о данных — это применение к данным набора математических алгоритмов (например, применение вычислений в файле Excel для создания новой строки), а большие данные — это технология, позволяющая иметь огромное количество файлов Excel (я использую слово «файлы Excel». "здесь просто для облегчения понимания).

Лицензировано под: CC-BY-SA с атрибуция
Не связан с datascience.stackexchange
scroll top