Закреплена за кафедрой | Кафедра информатики |
---|---|
Направление подготовки | 09.04.01. Информатика и вычислительная техника |
Профиль | Инженерия искусственного интеллекта |
Форма обучения | Очная |
Общая трудоемкость | 6 ЗЕТ |
Учебный план | 09_04_01_Информатика и вычислительная техника_ИИИ-2022 |
|
|
Распределение часов по семестрам
Курс (семестр) | 1 (2) | 2 (3) | Итого | |||
---|---|---|---|---|---|---|
Недель | 18 | 18 | ||||
Вид занятий | УП | РПД | УП | РПД | УП | РПД |
Лекции | 18 | 18 | 18 | 18 | 36 | 36 |
Практические | 18 | 18 | 18 | 18 | 36 | 36 |
Сам. работа | 72 | 72 | 72 | 72 | 144 | 144 |
Итого | 108 | 108 | 108 | 108 | 216 | 216 |
Визирование РПД для исполнения в очередном учебном году
Рабочая программа пересмотрена, обсуждена и одобрена для
исполнения в 2023-2024 учебном году на заседании
кафедры
Кафедра информатики
Протокол от 29.06.2022 г. № 11
Заведующий кафедрой Козлов Денис Юрьевич
1.1. | Цель освоения дисциплины «Спортивный анализ данных» ознакомить студентов с современной платформой для проведения соревнований "Kaggle .com". Студенты узнают, как использовать различные алгоритмы и методы анализа данных для решения конкретных прикладных задач. На практике рассматриваются все типы задач анализа данных: анализ табличных данных, анализ временных рядов, обработка естественного языка, обработка изображений. В курсе рассматриваются методы анализа базовых обученных моделей, выбора и проверки новых возможностей, оптимальные методы поиска лучшего алгоритма решения задачи. |
---|
Цикл (раздел) ООП: Б1.В.1 |
ОПК-3 | Способен анализировать профессиональную информацию, выделять в ней главное, структурировать, оформлять и представлять в виде аналитических обзоров с обоснованными выводами и рекомендациями; |
ПК-6 | Способен руководить проектами по созданию комплексных систем на основе аналитики больших данных в различных отраслях |
В результате освоения дисциплины обучающийся должен | |
3.1. | Знать: |
---|---|
3.1.1. | ОПК-3.1. Знать: принципы, методы и средства анализа и структурирования профессиональной информации. ПК-6.1. З-1. Знает методологию и принципы руководства проектом по созданию, поддержке и использованию комплексных систем на основе аналитики больших данных ПК-6.1. З-2. Знает специфику сфер и отраслей, для которых реализуется проект по аналитике больших данных |
3.2. | Уметь: |
3.2.1. | ОПК-3.2. Уметь: анализировать профессиональную информацию, выделять в ней главное, структурировать, оформлять и представлять в виде аналитических обзоров. ПК-6.1. У-1. Умеет решать задачи по руководству коллективной проектной деятельностью для создания, поддержки и использования комплексных систем на основе аналитики больших данных ПК-6.1. У-2. Умеет сосредотачивать внимание на целях, достижение которых обеспечивает большую отдачу и сильное воздействие ПК-6.1. У-3. Умеет формировать матрицу приоритетов, включая критерии отбора проектов для реализации |
3.3. | Иметь навыки и (или) опыт деятельности (владеть): |
3.3.1. | ОПК-3.3. Владеть: методами подготовки научных докладов, публикаций и аналитических обзоров с обоснованными выводами и рекомендациями. |
Код занятия | Наименование разделов и тем | Вид занятия | Семестр | Часов | Компетенции | Литература |
---|---|---|---|---|---|---|
Раздел 1. Спортивный анализ данных (1 часть) | ||||||
1.1. | Обзор инструментов применяемых для анализа данных и машинного обучения Обзор библиотеки Numpy Работа с библиотекой Pandas (Matplotlib, seaborn) Модели машинного обучения для решения задач классификации Модели машинного обучения для решения задач регрессии Метрики качества при решении задач классификации и регрессии Предварительная обработка данных при решении задач анализа данных Преобразование и создание новых признаков для решения задач анализа данных Методы выбора лучших признаков для решения задач классификации и регрессии Методы выбора лучших моделей и алгоритмов для решения поставленных задач анализа данных Методы подбора гипер параметров моделей машинного обучения и построения конвейеров автоматизации решения задач анализа данных Работа с временными рядами Задачи обучения без учителя: понижение размерности Задачи обучения без учителя: кластеризация Задачи обучения без учителя: поиск аномалий | Лекции | 2 | 18 | ОПК-3, ПК-6 | Л1.1, Л2.1, Л1.2, Л1.3, Л2.2 |
1.2. | Знакомство с инструментами: jupyter notebook, google colaboratory, kaggle kernel. Базовый функционал и приемы работы. Основные понятия Data Science и Machine Learning Применение библиотеки numpy для операция над тензорами и решения задач линейной алгебры и генерации тензоров различной размерности по заданным правилам Библиотека для работы с табличными данными pandas: чтение и запись файлов, методы просмотра данных, индексация, срезы, фильтрация, агрегация и сортировка данных, визуализация данных, разведывательный анализ данных, базовые статистики. Постановка задачи классификации. Изучение алгоритмов классификации в машинном обучении: логистическая регрессия, машины опорных векторов, наивный Байес, К ближайших соседей, деревья решений, ансамблевые модели Постановка задачи регрессии. Изучение алгоритмов регрессии в машинном обучении: линейная регрессия, машины опорных векторов, К ближайших соседей, деревья решений, ансамблевые модели. Регуляризация моделей машинного обучения Изучение метрик качества моделей машинного обучения для классификации и регрессии. Рассмотрение сильных и слабых сторон различных метрик для различных задач. Применение изученных метрик Методы предварительной обработки: заполнение пропусков в данных, обработка выбросов в данных. Изменение непрерывных типов данных: логарифмирование, построение полиномов, дискретизация данных, стандартизация и нормализация данных. Различные методы преобразование категориальных данных. Методы отбора лучших для решения поставленной задачи признаков в задачах классификации и регрессии: на основе статистических подходов и методов машинного обучения Приемы отбора лучших моделей для решения поставленных задач. Различные методики разбиения выборок для более стабильной и правдоподобной оценки Инструменты построения конвейеров обработки данных в машинном обучении. Методы и инструменты автоматического подбора гипер параметров моделей машинного обучения, а также подбора самих моделей и методов предварительной обработки Понятие временного ряда и его составляющие элементы. Методы прогнозирования на основе эконометрических подходов. Методы прогнозирования на основе регрессионного подхода и моделей машинного обучения. Генерация новых временных признаков для временного ряда. Обзор задач обучения без учителя и их применимость на практике. Методы понижения размерности и их практические приложения Обзор методов кластеризации и их сравнительные характеристики. Методы оценки оптимального числа кластеров. Кластеризация для сегментации и анализа. Кластеризация, как метод сжатия информации и снижения размерности. Постановка задачи поиска аномалий и выявления новизны. Методы поиска аномалий на основе подходов машинного обучения. | Практические | 2 | 18 | ОПК-3, ПК-6 | Л1.1, Л2.1, Л1.2, Л1.3, Л2.2 |
1.3. | Знакомство с инструментами: jupyter notebook, google colaboratory, kaggle kernel. Базовый функционал и приемы работы. Основные понятия Data Science и Machine Learning Применение библиотеки numpy для операция над тензорами и решения задач линейной алгебры и генерации тензоров различной размерности по заданным правилам Библиотека для работы с табличными данными pandas: чтение и запись файлов, методы просмотра данных, индексация, срезы, фильтрация, агрегация и сортировка данных, визуализация данных, разведывательный анализ данных, базовые статистики. Постановка задачи классификации. Изучение алгоритмов классификации в машинном обучении: логистическая регрессия, машины опорных векторов, наивный Байес, К ближайших соседей, деревья решений, ансамблевые модели Постановка задачи регрессии. Изучение алгоритмов регрессии в машинном обучении: линейная регрессия, машины опорных векторов, К ближайших соседей, деревья решений, ансамблевые модели. Регуляризация моделей машинного обучения Изучение метрик качества моделей машинного обучения для классификации и регрессии. Рассмотрение сильных и слабых сторон различных метрик для различных задач. Применение изученных метрик Методы предварительной обработки: заполнение пропусков в данных, обработка выбросов в данных. Изменение непрерывных типов данных: логарифмирование, построение полиномов, дискретизация данных, стандартизация и нормализация данных. Различные методы преобразование категориальных данных. Методы отбора лучших для решения поставленной задачи признаков в задачах классификации и регрессии: на основе статистических подходов и методов машинного обучения Приемы отбора лучших моделей для решения поставленных задач. Различные методики разбиения выборок для более стабильной и правдоподобной оценки Инструменты построения конвейеров обработки данных в машинном обучении. Методы и инструменты автоматического подбора гипер параметров моделей машинного обучения, а также подбора самих моделей и методов предварительной обработки Понятие временного ряда и его составляющие элементы. Методы прогнозирования на основе эконометрических подходов. Методы прогнозирования на основе регрессионного подхода и моделей машинного обучения. Генерация новых временных признаков для временного ряда. Обзор задач обучения без учителя и их применимость на практике. Методы понижения размерности и их практические приложения Обзор методов кластеризации и их сравнительные характеристики. Методы оценки оптимального числа кластеров. Кластеризация для сегментации и анализа. Кластеризация, как метод сжатия информации и снижения размерности. Постановка задачи поиска аномалий и выявления новизны. Методы поиска аномалий на основе подходов машинного обучения. | Сам. работа | 2 | 72 | ОПК-3, ПК-6 | Л1.1, Л2.1, Л1.2, Л1.3, Л2.2 |
Раздел 2. Спортивный анализ данных (2 часть) | ||||||
2.1. | Обработка естественного языка: предварительная обработка Обработка естественного языка: векторные модели Обработка естественного языка: типы решаемых задач Введение в нейронные сети Нейронные сети для решения задач регрессии Нейронные сети для решения задач классификации Нейронные сети для решения задач обработки изображений Нейронные сети для решения задач обработки изображений: современные архитектуры Нейронные сети для решения задач обработки естественного языка Нейронные сети для решения задач обработки естественного языка: современные архитектуры Нейронные сети для решения задач предсказания временных рядов | Лекции | 3 | 18 | ОПК-3, ПК-6 | Л1.1, Л2.1, Л1.2, Л1.3, Л2.2 |
2.2. | Знакомство с задачами обработки естественного языка.: Методы первичной предварительной обработки текстов: очистка, токенизация, лемматизация, стемминг. Преобразование текста в векторное пространство. Статистические методы построения векторных моделей: мешок слов, OHE, tf-idf. Тематическое моделирование: латентное размещение Дирихле (LDA), латентный семантический анализ (LSA). Нейросетевые модели: word2vec, fastText, GloVe. Рассмотрение спектра задач обработки естественного языка: моделирование языка, классификация, поиск именованных сущностей, суммаризация, генерация. Базовые понятия нейронных сетей: нейрон, обучение нейрона, нейронная сеть, обучение нейронной сети. Функции потерь и метрики качества. Применение нейронных сетей для решения задач регрессии. Специфические для регрессии функции активации нейронов и метрики качества. Методы предварительной обработки данных. Применение нейронных сетей для решения задач классификации. Специфические для классии функции активации нейронов и метрики качества. Методы предварительной обработки данных. Знакомство с задачами обработки изображений. Изучение сверточных нейронных сетей. Понятие ядра, свертки и подвыборки. Изучение современных архитектур нейронных сетей для решения задач обработки изображений: VGG-16, VGG-19, ResNet, Inception, Xception, DenseNet, MobileNet, EfficientNet. Архитектуры нейронных сетей для решения задач обработки естественного языка: одномерные сверточные сети, рекуррентные нейронные сети. Обзор современных модификаций нейронных сетей для решения задач обработки естественного языка: трансформеры, механизм внимания, BERT Применение нейронных сетей для решения задачи прогнозирования временных рядов: одномерные сверточные нейронные сети, рекуррентные нейронные сети. WaveNet для прогнозирование | Практические | 3 | 18 | ОПК-3, ПК-6 | Л1.1, Л2.1, Л1.2, Л1.3, Л2.2 |
2.3. | Знакомство с задачами обработки естественного языка.: Методы первичной предварительной обработки текстов: очистка, токенизация, лемматизация, стемминг. Преобразование текста в векторное пространство. Статистические методы построения векторных моделей: мешок слов, OHE, tf-idf. Тематическое моделирование: латентное размещение Дирихле (LDA), латентный семантический анализ (LSA). Нейросетевые модели: word2vec, fastText, GloVe. Рассмотрение спектра задач обработки естественного языка: моделирование языка, классификация, поиск именованных сущностей, суммаризация, генерация. Базовые понятия нейронных сетей: нейрон, обучение нейрона, нейронная сеть, обучение нейронной сети. Функции потерь и метрики качества. Применение нейронных сетей для решения задач регрессии. Специфические для регрессии функции активации нейронов и метрики качества. Методы предварительной обработки данных. Применение нейронных сетей для решения задач классификации. Специфические для классии функции активации нейронов и метрики качества. Методы предварительной обработки данных. Знакомство с задачами обработки изображений. Изучение сверточных нейронных сетей. Понятие ядра, свертки и подвыборки. Изучение современных архитектур нейронных сетей для решения задач обработки изображений: VGG-16, VGG-19, ResNet, Inception, Xception, DenseNet, MobileNet, EfficientNet. Архитектуры нейронных сетей для решения задач обработки естественного языка: одномерные сверточные сети, рекуррентные нейронные сети. Обзор современных модификаций нейронных сетей для решения задач обработки естественного языка: трансформеры, механизм внимания, BERT Применение нейронных сетей для решения задачи прогнозирования временных рядов: одномерные сверточные нейронные сети, рекуррентные нейронные сети. WaveNet для прогнозирование | Сам. работа | 3 | 72 | ОПК-3, ПК-6 | Л1.1, Л2.1, Л1.2, Л1.3, Л2.2 |
5.1. Контрольные вопросы и задания для проведения текущего контроля и промежуточной аттестации по итогам освоения дисциплины |
в приложении |
5.2. Темы письменных работ для проведения текущего контроля (эссе, рефераты, курсовые работы и др.) |
в приложении |
5.3. Фонд оценочных средств для проведения промежуточной аттестации |
в приложении |
Приложения |
Приложение 1.
ФОС Спортивный анализ данных.docx
|
6.1. Рекомендуемая литература | ||||
6.1.1. Основная литература | ||||
Авторы | Заглавие | Издательство, год | Эл. адрес | |
Л1.1 | Флах П. | Машинное обучение. Наука и искусство построения алгоритмов, которые извлекают знания из данных: | Издательство "ДМК Пресс", 2015 | e.lanbook.com |
Л1.2 | Шарден Б., Массарон Л., Боскетти А. | Крупномасштабное машинное обучение вместе с Python: Учебные пособия | Издательство "ДМК Пресс", 2018 //ЭБС издательства «Лань» | e.lanbook.com |
Л1.3 | Кудрявцев Н. Г., Фролов И. Н. | Практика применения компьютерного зрения и элементов машинного обучения в учебных проектах: учебное пособие : | , 2022 | e.lanbook.com |
6.1.2. Дополнительная литература | ||||
Авторы | Заглавие | Издательство, год | Эл. адрес | |
Л2.1 | Ян Эрик Солем | Программирование компьютерного зрения на языке Python: Самоучители и руководства | Издательство "ДМК Пресс", 2016 | e.lanbook.com |
Л2.2 | Матвеев А. И. | Цифровая обработка изображений в OpenCv. Практикум: Учебное пособие для вузов: | Издательство "Лань", 2022 | e.lanbook.com |
6.2. Перечень ресурсов информационно-телекоммуникационной сети "Интернет" | ||||
Название | Эл. адрес | |||
Э1 | Хливненко, Л. В. Практика нейросетевого моделирования : учебное пособие для вузов / Л. В. Хливненко, Ф. А. Пятакович. — 2-е изд., стер. — Санкт-Петербург : Лань, 2021. — 200 с. — ISBN 978-5-8114-8264-1. — Текст : электронный // Лань : электронно-библиотечная система. | e.lanbook.com | ||
Э2 | Клетте, Р. Компьютерное зрение. Теория и алгоритмы : учебник / Р. Клетте ; перевод с английского А. А. Слинкина. — Москва : ДМК Пресс, 2019. — 506 с. — Текст : электронный // Лань : электронно-библиотечная система. | e.lanbook.com | ||
Э3 | Тарасов, И. Е. Статистический анализ данных в информационных системах : учебно- методическое пособие / И. Е. Тарасов. — Москва : РТУ МИРЭА, 2020. — 96 с. — Текст : электронный // Лань : электронно-библиотечная система | e.lanbook.com | ||
Э4 | Ростовцев, В. С. Искусственные нейронные сети : учебник / В. С. Ростовцев. — Санкт- Петербург : Лань, 2019. — 216 с. — ISBN 978-5-8114-3768-9. — Текст : электронный // Лань : электронно-библиотечная система | e.lanbook.com | ||
Э5 | Курс "Спортивный анализ данных" в Moodle | portal.edu.asu.ru | ||
6.3. Перечень программного обеспечения | ||||
Пакет приложений Microsoft Office (Word, Power Point); Приложения для работы с PDF-документами (Adobe Acrobat Reader); Браузер (Google Chrome, Mozilia Firefox) Microsoft Office 2010 (Office 2010 Professional, № 4065231 от 08.12.2010), (бессрочно); Microsoft Windows 7 (Windows 7 Professional, № 61834699 от 22.04.2013), (бессрочно); Chrome (http://www.chromium.org/chromium-os/licenses), (бессрочно); 7-Zip (http://www.7-zip.org/license.txt), (бессрочно); AcrobatReader (http://wwwimages.adobe.com/content/dam/Adobe/en/legal/servicetou/Acrobat_com_Additional_TOU-en_US-20140618_1200.pdf), (бессрочно); ASTRA LINUX SPECIAL EDITION (https://astralinux.ru/products/astra-linux-special-edition/), (бессрочно); LibreOffice (https://ru.libreoffice.org/), (бессрочно); Веб-браузер Chromium (https://www.chromium.org/Home/), (бессрочно); Антивирус Касперский (https://www.kaspersky.ru/), (до 23 июня 2024); Архиватор Ark (https://apps.kde.org/ark/), (бессрочно); Okular (https://okular.kde.org/ru/download/), (бессрочно); Редактор изображений Gimp (https://www.gimp.org/), (бессрочно) | ||||
6.4. Перечень информационных справочных систем | ||||
Профессиональные базы данных, информационно-справочные системы 1. Цифровая библиотека научно-технических изданий Института инженеров по электротехнике и радиоэлектронике (Institute of Electrical and Electronic Engineers (IEEE)) на английском языке – http://www.ieee.org/ieeexplore 2. Oxford University Press – http://www.oxfordjournals.org/en/ 3. Архив препринтов с открытым доступом – https://arxiv.org/ Материалы для лиц с ОВЗ Весь контент ЭБС представлен в виде файлов специального формата для воспроизведения синтезатором речи, а также в тестовом виде, пригодном для прочтения с использованием экранной лупы и настройкой контрастности. Базы данных, информационно-справочные и поисковые системы 1. Academic Search Ultimate EBSCO publishing – http://search.ebscohost.com 2. eBook Collections Springer Nature – https://link.springer.com/ 3. Гугл Академия – https://scholar.google.ru/ 4. СПС КонсультантПлюс (инсталлированный ресурс АлтГУ или http://www.consultant.ru/). 5. Электронная база данных «Scopus» (http://www.scopus.com); 6. Электронная библиотечная система Алтайского государственного университета (http://elibrary.asu.ru/) 7. Электронный научный архив УрФУ https://elar.urfu.ru/ 8. Зональная научная библиотека (УрФУ) - http://lib.urfu.ru/ 9. Портал информационно-образовательных ресурсов УрФУ https://study.urfu.ru/ 10. Электронно-библиотечная система «Лань» – https://e.lanbook.com/ 11. Университетская библиотека ONLINE – https://biblioclub.ru/ 12. Электронно-библиотечная система "Библиокомплектатор" (IPRbooks) http://www.bibliocomplectator.ru/available 13. Электронные информационные ресурсы Российской государственной библиотеки https://www.rsl.ru/ 14. Научная электронная библиотека «КиберЛенинка» https://cyberleninka.ru/ |
Аудитория | Назначение | Оборудование |
---|---|---|
107Л | лаборатория информационных технологий - компьютерный класс - учебная аудитория для проведения занятий семинарского типа (лабораторных и(или) практических); проведения групповых и индивидуальных консультаций, текущего контроля и промежуточной аттестации | Учебная мебель на 18 посадочных мест; компьютеры: марка HP, модель ProOne 400 - 18 единиц; проектор: марка SMART, модель UF70 - 1 единица; интерактивная доска: марка SMART Board модель SMB680 - 1 единица |
205Л | лаборатория информационных технологий - компьютерный класс - учебная аудитория для проведения занятий семинарского типа (лабораторных и(или) практических); проведения групповых и индивидуальных консультаций, текущего контроля и промежуточной аттестации | Учебная мебель на 9 посадочных мест; компьютеры: марка КламаС Офис, мониторы: марка ACER модель V223HQL - 8 единиц; доска интерактивная Triumph MULTI TOUCH 78 + проектор NEC UM280X в комплекте |
204Л | лаборатория информационных технологий - компьютерный класс - учебная аудитория для проведения занятий семинарского типа (лабораторных и(или) практических); проведения групповых и индивидуальных консультаций, текущего контроля и промежуточной аттестации | Учебная мебель на 14 посадочных мест; компьютеры: марка DEPO модель Neos 260 - 14 единиц; Интерактивная доска Smart board 680 IV со встроенным проектором v25 |
Учебная аудитория | для проведения занятий лекционного типа, занятий семинарского типа (лабораторных и(или) практических), групповых и индивидуальных консультаций, текущего контроля и промежуточной аттестации, курсового проектирования (выполнения курсовых работ), проведения практик | Стандартное оборудование (учебная мебель для обучающихся, рабочее место преподавателя, доска, мультимедийное оборудование стационарное или переносное) |
Изучение дисциплины завершается зачетом. Успешное изучение дисциплины требует посещения лекций, активной работы на лабораторных работах, выполнения всех практических заданий преподавателя, ознакомления с основной и дополнительной литературой. Во время лекции студент должен вести краткий конспект. При этом обучающийся должен стараться найти ответы на затруднительные вопросы, используя рекомендуемую литературу или общедоступные ресурсы. Если ему самостоятельно не удалось разобраться в материале, необходимо сформулировать вопросы и обратится за помощью к преподавателю на консультации или ближайшей лекции. Выполнение студентами практических заданий направлено на: - обобщение, систематизацию, углубление, закрепление полученных теоретических знаний по конкретным темам дисциплин; - формирование необходимых профессиональных умений и навыков. Помимо собственно выполнения практических заданий для каждого задания предусмотрена процедура защиты, в ходе которой преподаватель проводит устный или письменный опрос студентов для контроля понимания выполненных ими действий по теме занятия. Самостоятельная работа. - При изучении дисциплины не все вопросы рассматриваются на занятиях, часть вопросов рекомендуется преподавателем для самостоятельного изучения. - Поиск ответов на вопросы и выполнение заданий для самостоятельной работы позволит вам расширить и углубить свои знания по курсу, применить теоретические знания в решении задач практического содержания, закрепить изученное ранее. - Эти задания следует выполнять не «наскоком», а постепенно, планомерно, следуя порядку изучения тем курса. - При возникновении вопросов обратитесь к преподавателю в день консультаций на кафедру. - Выполнив их, проанализируйте качество их выполнения. Это поможет вам развивать умения самоконтроля и оценочные компетенции. При подготовке к зачету в дополнение к изучению конспектов лекций, учебно-методических материалов и слайдов, необходимо пользоваться учебной литературой, рекомендованной настоящей программой. При подготовке к зачету нужно изучить определения всех понятий и теоретические подходы до состояния понимания материала, а также выполнить все практические задания в курсе. |