Наука о данных: учебный курс
Что такое наука о данных? Подобно любой новой области, она еще не определена полностью, но вы уже знаете о ней достаточно, чтобы заинтересоваться, иначе вы не читали бы эту книгу. Я считаю науку о данных местом на пересечении информатики, статистики и независимых областей применения. От информатики исходит машинное обучение и технологии высокопроизводительных вычислений, чтобы справляться с масштабом. От статистики исходит давняя традиция исследовательского анализа данных, проверка достоверности и визуализация. От областей применения в бизнесе и науках исходят задачи, стоящие сломанных копий, а также стандарты вычислений, позволяющие оценить, когда победа будет окончательно достигнута.
Но все эти области уже хорошо известны. Почему наука о данных, и почему теперь? Я вижу три причины для этого внезапного пика активности:
- Новая технология позволяет уловить, аннотировать и сохранить обширные объемы данных из социальных сетей, регистрируя также данные сенсоров. После того как вы накопили все эти данные, вы начинаете задаваться вопросом, что с ними можно сделать.
- Компьютерные достижения позволяют анализировать данные новыми способами и в невиданных ранее масштабах. Архитектуры сетевой вычислительной среды предоставляют некоторый доступ к своей огромной мощи даже простым парням, когда они нуждаются в ней. Новые подходы к машинному обучению приводят к удивительным достижениям в решении давнишних проблем, подобных компьютерному зрению и обработке текстов на естественном языке.
- Ведущие технологические компании (такие как Google и Facebook) и многомиллиардные фонды (такие как Renaissance Technologies и TwoSigma) уже доказали мощь современной аналитики данных.
Во-первых, я попытаюсь объяснять, как думают хорошие аналитики данных и чем их мышление отличается от такового у традиционных программистов и программных разработчиков. Во-вторых, мы рассмотрим наборы данных с точки зрения их потенциала для практического применения и научимся задавать более общие вопросы, на которые они способны давать ответы. И наконец, я представлю наборы задач по анализу данных, которые будут использоваться повсюду в этой книге в качестве мотивации примеров.
Название: Наука о данных: учебный курс
Автор: Стивен С. Скиена
Издательство: Диалектика
Год: 2020
Страниц: 546
Язык: русский
Формат: pdf
Размер: 63.5 MB
Скачать Наука о данных: учебный курс
Но все эти области уже хорошо известны. Почему наука о данных, и почему теперь? Я вижу три причины для этого внезапного пика активности:
- Новая технология позволяет уловить, аннотировать и сохранить обширные объемы данных из социальных сетей, регистрируя также данные сенсоров. После того как вы накопили все эти данные, вы начинаете задаваться вопросом, что с ними можно сделать.
- Компьютерные достижения позволяют анализировать данные новыми способами и в невиданных ранее масштабах. Архитектуры сетевой вычислительной среды предоставляют некоторый доступ к своей огромной мощи даже простым парням, когда они нуждаются в ней. Новые подходы к машинному обучению приводят к удивительным достижениям в решении давнишних проблем, подобных компьютерному зрению и обработке текстов на естественном языке.
- Ведущие технологические компании (такие как Google и Facebook) и многомиллиардные фонды (такие как Renaissance Technologies и TwoSigma) уже доказали мощь современной аналитики данных.
Во-первых, я попытаюсь объяснять, как думают хорошие аналитики данных и чем их мышление отличается от такового у традиционных программистов и программных разработчиков. Во-вторых, мы рассмотрим наборы данных с точки зрения их потенциала для практического применения и научимся задавать более общие вопросы, на которые они способны давать ответы. И наконец, я представлю наборы задач по анализу данных, которые будут использоваться повсюду в этой книге в качестве мотивации примеров.
Название: Наука о данных: учебный курс
Автор: Стивен С. Скиена
Издательство: Диалектика
Год: 2020
Страниц: 546
Язык: русский
Формат: pdf
Размер: 63.5 MB
Скачать Наука о данных: учебный курс
Внимание! У Вас нет прав для просмотра скрытого текста.
Посетители, находящиеся в группе Гости, не могут оставлять комментарии к данной публикации.