Jupyter Notebook — веб-приложение с открытым исходным кодом. Каждый разработчик может разбить в нём код на куски и работать над ними в произвольном порядке: писать и проверять функции, загружать файл в память и обрабатывать содержимое. Рассказываем, как написать свой первый код уже сегодня.
Что такое Jupyter Notebook и где он применяется
Jupyter-ноутбук — интерактивная среда разработки с «живым» кодом. Если разработчик хочет посмотреть на график или формулу, он пишет нужную команду в соответствующей ячейке. Такой подход экономит время и помогает избежать ошибок.
Чаще всего jupyter-ноутбуки применяют в машинном обучении, например, при подготовке нейросетей. Еще их используют дата-сайентисты и начинающие программисты на Python.
Научитесь писать чистый и стабильный код на Python на курсе «Python-разработчик» от онлайн-университета Skypro. У вас будет 400 часов теории и практики, 4 проекта в портфолио. Смотрите 40-минутные видеолекции в любое удобное время и выполняйте практические задания с реальными инструментами разработчика. На вопросы ответит наставник — в чате или на еженедельных вебинарах. В конце получите диплом о переподготовке и пожизненный доступ к курсу.
Какие языки поддерживаются
Jupyter — преемник проекта IPython Notebook. Сегодня jupyter-ноутбуки умеют работать не только с Python. Появились ядра и для других языков, например:
- Ruby,
- Julia,
- Perl,
- Matlab,
- R.
У каждого ядра есть отдельная инструкция по установке. Для запуска кода на другом языке используют специальные magic-команды. Они расширяют функции Python.
Виды Jupyter Notebook
Jupyter-ноутбук запускают на любом сервере с доступом по ssh или http.
Запуск на компьютере. Для работы с ноутбуком нужен Python с загруженной библиотекой Jupyter. Чтобы установить программу, введите в окно терминала следующую команду:
1
pip3 install jupyter
Это активирует установочную утилиту — pip. Ее задачи — распаковывать, устанавливать и обновлять пакеты программ.
Другой способ запустить на компьютере — загрузить Anaconda. Это архивированный набор файлов с полезным софтом: Python, Jupyter, NumPy, Pandas, Matplotlib.
Запуск в облаке. Если хотите написать код здесь и сейчас, запустите ноутбук в облаке. С сервисами по типу Google Colab пишут на Python в любом браузере. Никаких специальных настроек не нужно — следуйте указаниям и пишите код.

Сервис Google Colab
Минус такого подхода: программы на локальном сервере работают быстрее облачных. Кроме того, у последних ограниченный набор библиотек. Если понадобятся дополнительные ресурсы, весь проект пойдет насмарку.
Как установить приложение
Создайте новый блокнот — так называется проект в Jupyter.
Запуск Jupyter. Используйте команду: Jupyter notebook. Она откроет новую вкладку в браузере и запустит программу. URL-адрес приложения будет выглядеть так: https://localhost:8888/tree.
Интерфейс Notebook. Все блокноты в каталоге помечены иконкой записной книжки. Чтобы создать новый, выберите в верхнем меню команды «New» → «Python 3». Рядом с логотипом Jupyter появится надпись Untitled. Это название блокнота.

Команда «New» → «Python 3»
Каждый блокнот использует новую вкладку — открывайте хоть сотню проектов одновременно. Чтобы найти все рабочие блокноты, нажмите вкладку «Running». У запущенных в работу проектов будет зеленая иконка, у нерабочих — серая.
Python для начинающих аналитиков | Урок 1 | Jupyter Notebook, методы, функции, аргументы
Ячейки (Cell). Откройте новый блокнот. Поле с зеленым контуром и надписью In [ ] — это ячейка со строкой ввода. Зеленый контур означает, что ячейка в режиме редактирования.

Как редактировать ячейку в Jupyter Notebook
Ячейки — это ДНК ноутбука. Они делятся на кодовые и markdown.
Напишите выражение вывода, используйте синтаксис Python 3. Нажмите «Run». Поздравляем, вы только что создали свой первый фрагмент кода!

Ячейки в Jupyter Notebook
Изучайте Python на онлайн-курсе от Skypro «Python-разработчик». Программа рассчитана на новичков без опыта программирования и технического образования. Курс проходит в формате записанных коротких видеолекций. Будет много проверочных заданий и мастер-классов. В конце каждой недели — живая встреча с экспертами в разработке для ответов на вопросы и разбора домашек.
Обратите внимание: In [ ] преобразовалось в In [1]. Это порядковый номер запуска ячейки. Синий контур означает командный режим. Первая ячейка в блокноте всегда кодовая.
Чтобы создать новую ячейку, нажмите «+» на панели инструментов. Вырезайте, копируйте, удаляйте и редактируйте ячейки с помощью вкладки Edit.
Горячие клавиши. Полный список хоткеев — в разделе Help → Keyboard Shortcuts.

Горячие клавиши в Jupyter Notebook
Markdown. Это язык разметки текстов. Его используют для комментариев, заголовков и списков. А еще для конвертации текстов в формат HTML. Чтобы перейти в ячейку Markdown, нажмите раздел Code и выберите команду Markdown.

Ячейка Markdown
Заголовки создают с помощью символа «#». Один такой символ сделает крупный заголовок верхнего уровня, два — заголовок поменьше. Вот так:
#
<h1>##
</h1>
<h2>###
</h2>
<h3>####
</h3>
<h4>#####
</h4>
<h5>######
</h5>
Cимвол «*» с двух сторон текста нужен для курсива. Два таких символа — для полужирного выделения. Списки создают при помощи тире и пробела для каждого пункта.

Разметка текстов Markdown
Ядра (Kernel). Ядро — вычислительный движок, который выполняет записанный код. Этот механизм контролирует все вычисления. Когда открываете новый блокнот и запускаете ячейку с кодом, ядро отображает вывод на экран. Каждый язык программирования использует отдельное ядро. Например, код Python — ipython.

Возможности вкладки «Ячейки»
Чтобы увидеть основные команды для ядра, зайдите во вкладку Kernel:
- Interrupt останавливает работу конкретной ячейки;
- Restart перезапускает ядро;
- Restart & Clear Output перезапускает ядро и сбрасывает данные текущих ячеек;
- Restart & Run All перезапускает ядро, сбрасывает данные текущих ячеек и снова запускает их в указанном порядке;
- Reconnect нужен для повторного подключения к ядру;
- Shutdown выключает ядро.
Как работать с Jupyter Notebook
Название. Сначала дайте проекту имя. Поскольку это тренировка, назовите блокнот Test. Для этого зайдите во вкладку «File» и выберите команду «Rename». Либо дважды щелкните по самому заголовку.

Команда Rename в Jupyter Notebook
Настройка. Первой настройте ячейку для импорта. Если хотите загрузить новые файлы, добавьте их в режиме редактирования и перезапустите ячейку. Введите следующие команды:
1
import pandas as pd import matplotlib.pyplot as plt %pylab inline
Это импорт Pandas для анализа данных и matplotlib для визуализаций. Команда %pylab inline нужна, чтобы дать ядру отмашку на использование графиков.
Jupyter Notebook Python применяют в своей работе аналитики данных. Визуализация — важная часть их задач. Потому что нужно не только обработать информацию и сделать выводы — важно наглядно представить результаты коллегам из других отделов или руководству. Этому можно научиться на курсе Skypro «Аналитик данных».
Визуализации результатов анализа там посвящен отдельный блок. Научитесь делать это с помощью языка Python, чтобы цифры в графиках и диаграммах автоматически подтягивались из нужных таблиц и обновлялись.
Контрольная точка. Посмотрите на панель инструментов:
…
Верхняя левая иконка — команда «Сохранить контрольную точку» (Ctrl + S). Контрольная точка — текстовый файл. В нём — содержимое блокнота в формате JSON. Данные обновляются при каждом новом сохранении. То есть контрольная точка — это резервное хранилище на случай форс-мажоров. Например, если по клавиатуре внезапно пробежит кот.
Изучение набора данных. Создайте новый проект на основе реальных данных — показаний космического телескопа «Хаббл». Ячейка для импорта уже настроена. Осталось загрузить таблицу.
1
data = pd.read_csv(“hubble_data.csv”) data.head()
Прочесть файл csv можно с помощью одной команды: read_csv(). Следующая — head() выводит данные на экран. По умолчанию функция head() показывает только первые пять строк. Нужно больше. Поэтому преобразуйте команду в head(25), где 25 — искомое число.
Pandas — умная библиотека. Она распознает заголовки и отображает эти данные в ячейке. Если заголовков нет, пропишите их в коде
1
headers = [“dist”,”rec_vel”] data_no_headers = pd.read_csv(“hubble_data_no_headers.csv”, names=headers)
— пишите код в одну строчку.
1
data_no_headers.head()
Headers — собственные заголовки. Команда names=headers сообщает Pandas, что нужно использовать именно их.
Jupyter Notebook на практике
После установки у нас получилась следующая таблица:
Графики. Теперь всё готово, чтобы построить график. Первым делом избавьтесь от индексов в первой колонке:
1
data.set_index(“distance”, inplace=True) data.head()
Теперь данные легко представить в виде соотношений осей x и y. Задайте необходимые команды:
1
data.plot() plt.show()
Вот как должен выглядеть результат:
Коротко о Jupyter Notebook
- Jupyter Notebook — это веб-приложение, которое помогает смотреть отдельные фрагменты, когда пишете код.
- Чаще всего jupyter-ноутбуки применяют для визуализации данных в big data и data science. Они поддерживают большинство современных языков программирования. Но быстрее всего работают на Python.
- Запускают Jupyter Notebook в облаке или на компьютере. Первый способ проще, но второй — эффективнее.
Добавить комментарий