Показать сообщение отдельно
  #3  
Старый 15.02.2022, 04:51
Denis Mosko
Guest
 
Сообщений: n/a
По умолчанию Re: Почта России

Denis Mosko написал(а) к Valentin Kuznetsov в Feb 22 03:44:20 по местному времени:

Привет, Valentin!

Блок 1: Введение в Python
Обзор Python как языка для научных исследований. Jupyter Notebook. Простейшие типы данных и действия с ними. Что можно сделать с минимальными знаниями языка.

Форматирование выдачи - f-strings. Обращение f-strings - модуль parse. Условные операторы, циклы. Примеры из реальной жизни.

Коллекции: списки, множества, словари, кортежи. Модуль collections. Когда и зачем использовать тот или иной тип данных. Автоматизируем рутинные задачи. Случайные числа в Python. Делаем простую симуляцию.

Работа с текстовыми файлами. JSON. Бинарные файлы. Модуль pathlib. Примеры форматов файлов из реальной науки и того, как осуществлять работу с ними. Пишем конвертеры форматов.

Блок 2: Linux, командная строка и работа на сервере
Введение в Linux. Что такое сервер. SSН. Подключение к серверу, основы работы в shell. Базовые команды. scp. Работа со сжатыми файлами. Права.

sudo. Редактирование файлов на удаленном сервере. Пайплайны. grep, egrep, sed. Исполняемые файлы и как запустить свой скрипт на сервере. Основы работы на кластере. Очередь.

Работа со сторонними CLI-программами в bash. Как запустить скрипт на сервере так, чтобы он продолжал работать после выхода с сервера - nohup, tmux, etc. Как (почти) не зная Git, использовать пакеты и программы, размещенные только на Github. Переменные в Bash. Написание простых скриптов на Bash и когда это нужно, а когда лучше обратиться к Python. Файлы настроек.

export и переменные окружения. Простые способы запустить параллельные вычисления в Bash. Проброс портов. Как запустить Jupyter на сервере и работать с ним с локального компьютера. Просмотр занятых ресурсов и запущенных процессов на сервере.

Блок 3: Необходимый инструментарий в Python
Pip. Conda. Функции в Python и принцип DRY. Исключения. Типичные ошибки работы с исключениями. With-конструкция. sys, os, glob, shutil, requests. Работа с информацией из онлайн баз данных.

Введение в ООП. Зачем оно и как облегчает работу с научными данными. dataclasses.

Итераторы. Модуль itertools. Генераторы и их необходимость при работе с большими данными. argparse. tqdm. typer.

Блок 4: Анализ данных в Python
Matplotlib. NumPy и почему это быстро. SciPy. Базовый анализ данных. Культура кода в научных исследованиях. Как сделать свой код воспроизводимым.

Pandas. Seaborn. Plotly. Обработка больших табличных данных. Агрегация данных, создание сводных таблиц. Создание интерактивных визуализаций для научных статей.

Statsmodels. Статистика. Базовые тесты и как их считать. Необходимость визуализации данных для правильной трактовки результатов. Корреляция и ее аналоги.

Как ускорить ваши вычисления. subprocess. concurrent.futures. GIL. Сython. Numba. prefect. PyTorch как GPU-ускорение NumPy-кота, оставшегося дома. Ты пpогаешь?

С уважением - Denis
--- GoldED+/W32-MINGW 1.1.5-b20120519 (Kubik 3.0)
Ответить с цитированием