МИНОБРНАУКИ РОССИИ
федеральное государственное бюджетное образовательное учреждение высшего образования
«Алтайский государственный университет»

Наука о данных в биологии и медицине

рабочая программа дисциплины
Закреплена за кафедройКафедра теоретической кибернетики и прикладной математики
Направление подготовки01.04.02. Прикладная математика и информатика
ПрофильНаука о данных и компьютерные технологии в биологии и медицине
Форма обученияОчная
Общая трудоемкость5 ЗЕТ
Учебный план01_04_02_Прикладная математика и информатика_НДиКТБМ-2022
Часов по учебному плану 180
в том числе:
аудиторные занятия 54
самостоятельная работа 99
контроль 27
Виды контроля по семестрам
экзамены: 4

Распределение часов по семестрам

Курс (семестр) 2 (4) Итого
Недель 6
Вид занятий УПРПДУПРПД
Лекции 18 18 18 18
Лабораторные 36 36 36 36
Сам. работа 99 99 99 99
Часы на контроль 27 27 27 27
Итого 180 180 180 180

Программу составил(и):
Препод., Кротова О.С.

Рецензент(ы):

Рабочая программа дисциплины
Наука о данных в биологии и медицине

разработана в соответствии с ФГОС:
Федеральный государственный образовательный стандарт высшего образования - магистратура по направлению подготовки 01.04.02 Прикладная математика и информатика (приказ Минобрнауки России от 10.01.2018 г. № 13)

составлена на основании учебного плана:
01.04.02 Прикладная математика и информатика
утвержденного учёным советом вуза от 29.10.2021 протокол № 1/1.

Рабочая программа одобрена на заседании кафедры
Кафедра теоретической кибернетики и прикладной математики

Протокол от г. №
Срок действия программы: уч. г.

Заведующий кафедрой
Понькина Елена Владимировна


Визирование РПД для исполнения в очередном учебном году

Рабочая программа пересмотрена, обсуждена и одобрена для
исполнения в 2023-2024 учебном году на заседании кафедры

Кафедра теоретической кибернетики и прикладной математики

Протокол от г. №
Заведующий кафедрой Понькина Елена Владимировна


1. Цели освоения дисциплины

1.1.Целями освоения дисциплины являются:
- изучение методов и алгоритмов по обработке данных различного объёма, статистических методов, методов интеллектуального анализа данных и машинного обучения для работы с данными;
- применение полученных знаний для решения прикладных задач из областей биологии и медицины.

2. Место дисциплины в структуре ООП

Цикл (раздел) ООП: Б1.О.03

3. Компетенции обучающегося, формируемые в результате освоения дисциплины

ПК-2 Способен разрабатывать и применять новые инструменты, методы, модели, алгоритмы и технологии для работы с большими данными
В результате освоения дисциплины обучающийся должен
3.1.Знать:
3.1.1.Алгоритмы, методы и подходы для извлечения знаний из данных.
3.2.Уметь:
3.2.1.Строить автоматизированные модели анализа и обработки данных, выполнять интерпретацию результатов.
3.3.Иметь навыки и (или) опыт деятельности (владеть):
3.3.1.Методами и алгоритмами для обработки данных различного объёма, статистическими методов, методами интеллектуального анализа данных и машинного обучения для решения прикладных задач в биологии и медицине.

4. Структура и содержание дисциплины

Код занятия Наименование разделов и тем Вид занятия Семестр Часов Компетенции Литература
Раздел 1. Введение в науку о данных
1.1. Основные понятия и определения. Процесс Data Science. Актуальные примеры применения Data Science в биологии и медицине. Структурированные, неструктурированные и полуструктурированные данные. Источники получения данных. Лекции 4 2 ПК-2 Л1.2, Л2.3, Л2.1, Л2.2, Л1.1
1.2. Введение в науку о данных. Установка сред разработки Лабораторные 4 2 ПК-2 Л1.2, Л2.3, Л2.1, Л2.2, Л1.1
1.3. Введение в науку о данных. Установка сред разработки Сам. работа 4 4 ПК-2 Л1.2, Л2.3, Л2.1, Л2.2, Л1.1
Раздел 2. Обработка, преобразование и визуализация данных
2.1. Библиотека pandas. Структуры данных в pandas. Основные функции и методы обработки структурированных данных в pandas. Лекции 4 2 ПК-2 Л1.2, Л2.3, Л2.1, Л2.2, Л1.1
2.2. Работа с данными в pandas Лабораторные 4 2 ПК-2 Л1.2, Л2.3, Л2.1, Л2.2, Л1.1
2.3. Обработка медицинских данных с помощью pandas Лабораторные 4 2 ПК-2 Л1.2, Л2.3, Л2.1, Л2.2, Л1.1
2.4. Работа с библиотекой pandas Сам. работа 4 6 ПК-2 Л1.2, Л2.3, Л2.1, Л2.2, Л1.1
2.5. Визуализация данных с помощью matplotlib и seaborn. Разведочный анализ данных с помощью графических методов. Лекции 4 4 ПК-2 Л1.2, Л2.3, Л2.1, Л2.2, Л1.1
2.6. Визуализация данных инструментами matplotlib и seaborn Лабораторные 4 2 ПК-2 Л1.2, Л2.3, Л2.1, Л2.2, Л1.1
2.7. Визуализация данных c помощью matplotlib и seaborn Сам. работа 4 10 ПК-2 Л1.2, Л2.3, Л2.1, Л2.2, Л1.1
Раздел 3. Основы теории вероятностей и математической статистики (выравнивающий модуль)
3.1. Основы теории вероятностей: вероятность, условная вероятность, случайные величины, распределение вероятностей, теорема Байеса, проверка статистических гипотез. Сам. работа 4 10 ПК-2 Л1.2, Л2.3, Л2.1, Л2.2, Л1.1
3.2. Описательная статистика: меры центральной тенденции, меры разброса данных, диаграммы размаха. Сам. работа 4 10 ПК-2 Л1.2, Л2.3, Л2.1, Л2.2, Л1.1
3.3. Корреляционный анализ. Сам. работа 4 10 ПК-2 Л1.2, Л2.3, Л2.1, Л2.2, Л1.1
Раздел 4. Методы машинного обучения
4.1. Задачи машинного обучения. Обучение с учителем и без учителя. Библиотека scikit-learn. Лекции 4 2 ПК-2 Л1.2, Л2.3, Л2.1, Л2.2, Л1.1
4.2. Задачи машинного обучения. Обучение с учителем и без учителя. Библиотека scikit-learn. Сам. работа 4 13 ПК-2 Л1.2, Л2.3, Л2.1, Л2.2, Л1.1
4.3. Обучение с учителем: алгоритмы машинного обучения для решения задач классификации и регрессии и их тонкая настройка, метрики оценки качества, переобучение и недообучение. Лекции 4 4 ПК-2 Л1.2, Л2.3, Л2.1, Л2.2, Л1.1
4.4. Задача регрессии. Линейная регрессия, полиномиальная регрессия. Прогнозирование динамики роста с помошью регресионой модели. Лабораторные 4 2 ПК-2 Л1.2, Л2.3, Л2.1, Л2.2, Л1.1
4.5. Задача классификации. Линейный классификатор. Логистическая регрессия. Метод k-ближайших соседей. Постановка диагноза как задача классификации. Лабораторные 4 4 ПК-2 Л1.2, Л2.3, Л2.1, Л2.2, Л1.1
4.6. Метод опорных векторов, деревья решений, ансамблевые методы машинного обучения для решения задач классификации и регрессии. Оптимизация моделей. Лабораторные 4 2 ПК-2 Л1.2, Л2.3, Л2.1, Л2.2, Л1.1
4.7. Обучение с учителем Сам. работа 4 18 ПК-2 Л1.2, Л2.3, Л2.1, Л2.2, Л1.1
4.8. Обучение без учителя: алгоритмы кластеризация и снижения размерности данных. Лекции 4 4 ПК-2 Л1.2, Л2.3, Л2.1, Л2.2, Л1.1
4.9. Алгоритмы кластеризации: k-средних, иерархическая кластеризация, DBSCAN. Кластерный анализ для решения задачи оценки растительных ресурсов. Лабораторные 4 2 ПК-2 Л1.2, Л2.3, Л2.1, Л2.2, Л1.1
4.10. Обучение без учителя Сам. работа 4 18 ПК-2 Л1.2, Л2.3, Л2.1, Л2.2, Л1.1
Раздел 5. Современные исследования в области применения искусственного интеллекта в биологи и медицине
5.1. Обзор современных исследований в области применения машинного обучения и технологий искусственного интеллекта в биологии и медицине Лабораторные 4 8 ПК-2 Л1.2, Л2.3, Л2.1, Л2.2, Л1.1
Раздел 6. Кейс-задания
6.1. Решение кейсов: актуальные задачи из биологии и медицины Лабораторные 4 10 ПК-2 Л1.2, Л2.3, Л2.1, Л2.2, Л1.1

5. Фонд оценочных средств

5.1. Контрольные вопросы и задания для проведения текущего контроля и промежуточной аттестации по итогам освоения дисциплины
См. приложение
5.2. Темы письменных работ для проведения текущего контроля (эссе, рефераты, курсовые работы и др.)
См. приложение
5.3. Фонд оценочных средств для проведения промежуточной аттестации
См. приложение

6. Учебно-методическое и информационное обеспечение дисциплины

6.1. Рекомендуемая литература
6.1.1. Основная литература
Авторы Заглавие Издательство, год Эл. адрес
Л1.1 ВандерПлас Дж. Python для сложных задач. Наука о данных и машинное обучение. : “Питер”, 2017
Л1.2 П. Флах Машинное обучение. Наука и искусство построения алгоритмов, которые извлекают знания из данных: Учебник ДМК Пресс, 2015//ЭБС издательства «Лань» e.lanbook.com
6.1.2. Дополнительная литература
Авторы Заглавие Издательство, год Эл. адрес
Л2.1 Джоши, Пратик. Искусственный интеллект с примерами на Python. : Пер. с англ. - 448 с.: СПб. : ООО "Диалектика", 2019
Л2.2 Мюллер А., Гвидо С. Введение в машинное обучение с помощью Python.: Руководство для специалистов по работе с данными , 2017
Л2.3 Маккинни У. Python и анализ данных: Москва: ДМК Пресс, 2020 https://e.lanbook.com/book/131721
6.2. Перечень ресурсов информационно-телекоммуникационной сети "Интернет"
Название Эл. адрес
Э1 Наука о данных в биологии и медицине portal.edu.asu.ru
6.3. Перечень программного обеспечения
Дистрибутив Anaconda
Microsoft Office 2010 (Office 2010 Professional, № 4065231 от 08.12.2010), (бессрочно);
Microsoft Windows 7 (Windows 7 Professional, № 61834699 от 22.04.2013), (бессрочно);
Chrome (http://www.chromium.org/chromium-os/licenses), (бессрочно); 7-Zip (http://www.7-zip.org/license.txt), (бессрочно);
AcrobatReader (http://wwwimages.adobe.com/content/dam/Adobe/en/legal/servicetou/Acrobat_com_Additional_TOU-en_US-20140618_1200.pdf), (бессрочно);
ASTRA LINUX SPECIAL EDITION (https://astralinux.ru/products/astra-linux-special-edition/), (бессрочно);
LibreOffice (https://ru.libreoffice.org/), (бессрочно);
Веб-браузер Chromium (https://www.chromium.org/Home/), (бессрочно);
Антивирус Касперский (https://www.kaspersky.ru/), (до 23 июня 2024);
Архиватор Ark (https://apps.kde.org/ark/), (бессрочно);
Okular (https://okular.kde.org/ru/download/), (бессрочно);
Редактор изображений Gimp (https://www.gimp.org/), (бессрочно)
6.4. Перечень информационных справочных систем
1. Издательство «Лань» - электронно-библиотечная система [Электронный
ресурс]: http://e.lanbook.com
2. Издательство МЦНМО. Свободно распространяемые книги издательства
Московского центра непрерывного математического образования
[Электронный ресурс]: www.mccme.ru/free-books
3. Электронная библиотечная система Алтайского государственного
университета [Электронный ресурс]: http://elibrary.asu.ru
4. Global Biodiversity Information Facility [Электронный ресурс]: https://www.gbif.org/ru/
5. Medical Information Mart for Intensive Care [Электронный ресурс]: https://mimic.mit.edu/

7. Материально-техническое обеспечение дисциплины

Аудитория Назначение Оборудование
408Л лаборатория математического моделирования - учебная аудитория для проведения занятий семинарского типа (лабораторных и(или) практических); проведения групповых и индивидуальных консультаций, текущего контроля и промежуточной аттестации Учебная мебель на 15 посадочных мест; рабочее место преподавателя; доска меловая 1 шт.; компьютер Depo - 10 шт., 5 шт. с мониторами LG и 5 шт. с мониторами Philips; мультимедиа-проектор Sony - 1 шт.; МФУ Canon - 1 шт.; стационарный экран: марка Digis Optima C - 1 шт.
320Л медиатека, читальный зал – помещение для самостоятельной работы Учебная мебель на 15 посадочных мест; персональные компьютеры с выходом в информационно-телекоммуникационную сеть Интернет и электронную информационно-образовательную среду;
Учебная аудитория для проведения занятий лекционного типа, занятий семинарского типа (лабораторных и(или) практических), групповых и индивидуальных консультаций, текущего контроля и промежуточной аттестации, курсового проектирования (выполнения курсовых работ), проведения практик Стандартное оборудование (учебная мебель для обучающихся, рабочее место преподавателя, доска, мультимедийное оборудование стационарное или переносное)

8. Методические указания для обучающихся по освоению дисциплины

Для успешного освоения дисциплины студент должен посещать все занятия, вовремя выполнять лабораторные задания, пользоваться основной и дополнительной литературой, рекомендованной настоящей программой. Во время лекционных занятий рекомендуется вести краткий конспект.
Для выполнения лабораторных заданий каждому студенту необходимо:
- скачать документ с описанием задания с образовательного портала АлтГУ;
- внимательно прочитать задание. Вопросы, возникающие в процессе выполнения заданий, необходимо грамотно сформулировать и обратиться за помощью к преподавателю на консультации или ближайшем занятии;
- разработать, отладить и оттестировать программы, решающие поставленные задачи.
Для каждого задания предусмотрена процедура защиты, в ходе которой преподаватель проводит устный опрос студентов для контроля понимания выполненных ими заданий.
При подготовке к экзамену в дополнение к изучению конспектов лекций и учебной литературы, рекомендуется посещать консультации и пользоваться свободными Интернет-ресурсами.