Тесты Пообщаться с GPT Протестировать код
Программирование Аналитика Дизайн Маркетинг Управление проектами
24 Июл 2023
7 мин
14877

Jupyter Notebook: что это такое и как им пользоваться

Пройдите тест, узнайте какой профессии подходите

Jupyter-ноутбуки применяют для визуализации данных в big data и data science.

Jupyter Notebook — веб-приложение с открытым исходным кодом. Каждый разработчик может разбить в нём код на куски и работать над ними в произвольном порядке: писать и проверять функции, загружать файл в память и обрабатывать содержимое. Рассказываем, как написать свой первый код уже сегодня.

Что такое Jupyter Notebook и где он применяется

Jupyter-ноутбук — интерактивная среда разработки с «живым» кодом. Если разработчик хочет посмотреть на график или формулу, он пишет нужную команду в соответствующей ячейке. Такой подход экономит время и помогает избежать ошибок.

jupyter

Чаще всего jupyter-ноутбуки применяют в машинном обучении, например, при подготовке нейросетей. Еще их используют дата-сайентисты и начинающие программисты на Python.

Научитесь писать чистый и стабильный код на Python на курсе «Python-разработчик» от онлайн-университета Skypro. У вас будет 400 часов теории и практики, 4 проекта в портфолио. Смотрите 40-минутные видеолекции в любое удобное время и выполняйте практические задания с реальными инструментами разработчика. На вопросы ответит наставник — в чате или на еженедельных вебинарах. В конце получите диплом о переподготовке и пожизненный доступ к курсу.

Какие языки поддерживаются

Jupyter — преемник проекта IPython Notebook. Сегодня jupyter-ноутбуки умеют работать не только с Python. Появились ядра и для других языков, например:

  • Ruby,
  • Julia,
  • Perl,
  • Matlab,
  • R.
    Ruby, Julia, Perl, Matlab, R.

У каждого ядра есть отдельная инструкция по установке. Для запуска кода на другом языке используют специальные magic-команды. Они расширяют функции Python.

Виды Jupyter Notebook

Jupyter-ноутбук запускают на любом сервере с доступом по ssh или http.

Запуск на компьютере. Для работы с ноутбуком нужен Python с загруженной библиотекой Jupyter. Чтобы установить программу, введите в окно терминала следующую команду:

1
pip3 install jupyter

Это активирует установочную утилиту — pip. Ее задачи — распаковывать, устанавливать и обновлять пакеты программ.

Другой способ запустить на компьютере — загрузить Anaconda. Это архивированный набор файлов с полезным софтом: Python, Jupyter, NumPy, Pandas, Matplotlib.

Запуск в облаке. Если хотите написать код здесь и сейчас, запустите ноутбук в облаке. С сервисами по типу Google Colab пишут на Python в любом браузере. Никаких специальных настроек не нужно — следуйте указаниям и пишите код.

открыть блокнот

Сервис Google Colab

Минус такого подхода: программы на локальном сервере работают быстрее облачных. Кроме того, у последних ограниченный набор библиотек. Если понадобятся дополнительные ресурсы, весь проект пойдет насмарку.

Как установить приложение

Создайте новый блокнот — так называется проект в Jupyter.

Запуск Jupyter. Используйте команду: Jupyter notebook. Она откроет новую вкладку в браузере и запустит программу. URL-адрес приложения будет выглядеть так: https://localhost:8888/tree.

Интерфейс Notebook. Все блокноты в каталоге помечены иконкой записной книжки. Чтобы создать новый, выберите в верхнем меню команды «New» → «Python 3». Рядом с логотипом Jupyter появится надпись Untitled. Это название блокнота.

Команда «New» → «Python 3»

Команда «New» → «Python 3»

Каждый блокнот использует новую вкладку — открывайте хоть сотню проектов одновременно. Чтобы найти все рабочие блокноты, нажмите вкладку «Running». У запущенных в работу проектов будет зеленая иконка, у нерабочих — серая.

Python для начинающих аналитиков | Урок 1 | Jupyter Notebook, методы, функции, аргументы

Ячейки (Cell). Откройте новый блокнот. Поле с зеленым контуром и надписью In [ ] — это ячейка со строкой ввода. Зеленый контур означает, что ячейка в режиме редактирования.

интерфейс

Как редактировать ячейку в Jupyter Notebook

Ячейки — это ДНК ноутбука. Они делятся на кодовые и markdown.

Напишите выражение вывода, используйте синтаксис Python 3. Нажмите «Run». Поздравляем, вы только что создали свой первый фрагмент кода!

интерфейс

Ячейки в Jupyter Notebook

Изучайте Python на онлайн-курсе от Skypro «Python-разработчик». Программа рассчитана на новичков без опыта программирования и технического образования. Курс проходит в формате записанных коротких видеолекций. Будет много проверочных заданий и мастер-классов. В конце каждой недели — живая встреча с экспертами в разработке для ответов на вопросы и разбора домашек.

Обратите внимание: In [ ] преобразовалось в In [1]. Это порядковый номер запуска ячейки. Синий контур означает командный режим. Первая ячейка в блокноте всегда кодовая.

Чтобы создать новую ячейку, нажмите «+» на панели инструментов. Вырезайте, копируйте, удаляйте и редактируйте ячейки с помощью вкладки Edit.

Горячие клавиши. Полный список хоткеев — в разделе Help → Keyboard Shortcuts.

таблица

Горячие клавиши в Jupyter Notebook

Markdown. Это язык разметки текстов. Его используют для комментариев, заголовков и списков. А еще для конвертации текстов в формат HTML. Чтобы перейти в ячейку Markdown, нажмите раздел Code и выберите команду Markdown.

код

Ячейка Markdown

Заголовки создают с помощью символа «#». Один такой символ сделает крупный заголовок верхнего уровня, два — заголовок поменьше. Вот так:

#
<h1>##</h1>
<h2>###</h2>
<h3>####</h3>
<h4>#####</h4>
<h5>######</h5>
Cимвол «*» с двух сторон текста нужен для курсива. Два таких символа — для полужирного выделения. Списки создают при помощи тире и пробела для каждого пункта.

код

Разметка текстов Markdown

Ядра (Kernel). Ядро — вычислительный движок, который выполняет записанный код. Этот механизм контролирует все вычисления. Когда открываете новый блокнот и запускаете ячейку с кодом, ядро отображает вывод на экран. Каждый язык программирования использует отдельное ядро. Например, код Python — ipython.

меню

Возможности вкладки «Ячейки»

Чтобы увидеть основные команды для ядра, зайдите во вкладку Kernel:

  • Interrupt останавливает работу конкретной ячейки;
  • Restart перезапускает ядро;
  • Restart & Clear Output перезапускает ядро и сбрасывает данные текущих ячеек;
  • Restart & Run All перезапускает ядро, сбрасывает данные текущих ячеек и снова запускает их в указанном порядке;
  • Reconnect нужен для повторного подключения к ядру;
  • Shutdown выключает ядро.

Как работать с Jupyter Notebook

Название. Сначала дайте проекту имя. Поскольку это тренировка, назовите блокнот Test. Для этого зайдите во вкладку «File» и выберите команду «Rename». Либо дважды щелкните по самому заголовку.

интерфейс

Команда Rename в Jupyter Notebook

Настройка. Первой настройте ячейку для импорта. Если хотите загрузить новые файлы, добавьте их в режиме редактирования и перезапустите ячейку. Введите следующие команды:

1
import pandas as pd import matplotlib.pyplot as plt %pylab inline

Это импорт Pandas для анализа данных и matplotlib для визуализаций. Команда %pylab inline нужна, чтобы дать ядру отмашку на использование графиков.

Jupyter Notebook Python применяют в своей работе аналитики данных. Визуализация — важная часть их задач. Потому что нужно не только обработать информацию и сделать выводы — важно наглядно представить результаты коллегам из других отделов или руководству. Этому можно научиться на курсе Skypro «Аналитик данных».

Визуализации результатов анализа там посвящен отдельный блок. Научитесь делать это с помощью языка Python, чтобы цифры в графиках и диаграммах автоматически подтягивались из нужных таблиц и обновлялись.

Контрольная точка. Посмотрите на панель инструментов:

Верхняя левая иконка — команда «Сохранить контрольную точку» (Ctrl + S). Контрольная точка — текстовый файл. В нём — содержимое блокнота в формате JSON. Данные обновляются при каждом новом сохранении. То есть контрольная точка — это резервное хранилище на случай форс-мажоров. Например, если по клавиатуре внезапно пробежит кот.

Изучение набора данных. Создайте новый проект на основе реальных данных — показаний космического телескопа «Хаббл». Ячейка для импорта уже настроена. Осталось загрузить таблицу.

1
data = pd.read_csv(“hubble_data.csv”) data.head()

Прочесть файл csv можно с помощью одной команды: read_csv(). Следующая — head() выводит данные на экран. По умолчанию функция head() показывает только первые пять строк. Нужно больше. Поэтому преобразуйте команду в head(25), где 25 — искомое число.

Pandas — умная библиотека. Она распознает заголовки и отображает эти данные в ячейке. Если заголовков нет, пропишите их в коде

1
headers = [“dist”,”rec_vel”] data_no_headers = pd.read_csv(“hubble_data_no_headers.csv”, names=headers)

— пишите код в одну строчку.

1
data_no_headers.head()

Headers — собственные заголовки. Команда names=headers сообщает Pandas, что нужно использовать именно их.

Jupyter Notebook на практике

После установки у нас получилась следующая таблица:

Графики. Теперь всё готово, чтобы построить график. Первым делом избавьтесь от индексов в первой колонке:

1
data.set_index(“distance”, inplace=True) data.head()

Теперь данные легко представить в виде соотношений осей x и y. Задайте необходимые команды:

1
data.plot() plt.show()

Вот как должен выглядеть результат:

график

Коротко о Jupyter Notebook

  • Jupyter Notebook — это веб-приложение, которое помогает смотреть отдельные фрагменты, когда пишете код.
  • Чаще всего jupyter-ноутбуки применяют для визуализации данных в big data и data science. Они поддерживают большинство современных языков программирования. Но быстрее всего работают на Python.
  • Запускают Jupyter Notebook в облаке или на компьютере. Первый способ проще, но второй — эффективнее.

Добавить комментарий