Как полностью отобразить данные Pandas в HTML: руководство

#Python и Pandas для анализа данных #Визуализация данных #Подготовка данных и EDA (разведочный анализ)

Пройдите тест, узнайте какой профессии подходите

Сколько вам лет

До 18

От 18 до 24

От 25 до 34

От 35 до 44

От 45 до 49

От 50 до 54

Больше 55

Для кого эта статья:

Data scientists
Аналитики данных
Разработчики, работающие с Pandas и визуализацией данных
Когда аналитик впервые сталкивается с выводом крупного DataFrame в Pandas, на экране появляется не вся информация, а лишь её усечённая версия с многоточиями. Этот момент становится неприятным сюрпризом при подготовке отчётов и презентаций — важные данные просто исчезают. Что если вам нужно показать полную картину? Для data scientists, аналитиков и разработчиков критически важно видеть все значения таблицы, особенно при интеграции в веб-приложения или при создании детальных отчётов. Давайте раскроем все секреты полной визуализации данных в HTML с помощью Pandas — без компромиссов и усечений. 🔍

Почему Pandas усекает данные и зачем это менять

Библиотека Pandas была создана с пониманием того, что аналитики часто работают с огромными массивами данных. По умолчанию, когда вы выводите DataFrame, содержащий сотни строк или десятки столбцов, Pandas автоматически обрезает отображение, заменяя лишние строки и столбцы многоточием. Это защитный механизм — попытка отобразить 10,000 строк превратила бы ваш Jupyter Notebook в нечитаемый кошмар. 📊

Рассмотрим пример, когда эта "защита" становится проблемой:

Python

Скопировать код

import pandas as pd
import numpy as np

# Создаём тестовый DataFrame с 1000 строками и 20 столбцами
df = pd.DataFrame(np.random.rand(1000, 20), 
columns=[f'feature_{i}' for i in range(20)])

print(df) # Результат будет усечён

Вы увидите что-то вроде:

plaintext

Скопировать код

feature_0 feature_1 ... feature_18 feature_19
0 0.462096 0.594895 ... 0.262832 0.951031
1 0.979209 0.348595 ... 0.579204 0.057184
... ... ... ... ... ...
998 0.042191 0.463323 ... 0.367659 0.402389
999 0.116259 0.079889 ... 0.706281 0.846586

[1000 rows x 20 columns]

Вот почему изменение поведения Pandas по умолчанию столь важно:

Полнота анализа данных: Представьте, что критическая аномалия скрыта среди тех строк, которые заменены многоточием.
Точность отчётов: При генерации отчётов для клиентов или руководства усечённые данные могут привести к неполному пониманию ситуации.
Интерактивные дашборды: Для веб-приложений с интерактивными таблицами полнота данных — необходимость, а не роскошь.
Исследовательский анализ: Data scientists нуждаются в полной картине для выдвижения точных гипотез.

Максим Соколов, ведущий дата-аналитик Я никогда не забуду случай с одним финтех-стартапом, где мы анализировали транзакционные данные. В усечённом виде таблица выглядела абсолютно нормальной, все метрики были в зелёной зоне. Когда же мы настроили отображение всего DataFrame, обнаружилась группа транзакций с аномально высокими суммами в определённое время суток. Это оказалось признаком автоматизированного мошенничества, которое стоило компании почти $40,000 ежемесячно. Если бы не полное отображение данных, мы могли бы пропустить эту закономерность ещё на месяцы.

Главная причина изменения стандартного поведения Pandas — обеспечение информационной прозрачности. Особенно это актуально, когда DataFrame конвертируется в HTML для встраивания в отчёты или веб-интерфейсы. В этих случаях усечение может привести не просто к неполноте данных, а к принятию неверных бизнес-решений. 🚫

Проблемы усечения	Последствия	Сценарии использования полного отображения
Пропуск аномалий в данных	Неточные аналитические выводы	Поиск выбросов и аномалий
Невозможность увидеть полную картину	Неполное понимание трендов	Временные ряды и паттерны
Потеря детализации в отчётах	Снижение доверия к аналитике	Финансовая и аудиторская отчётность
Ограниченная интерактивность	Неудовлетворительный UX	Дашборды и бизнес-приложения

Настройка параметров отображения DataFrame в Pandas

Чтобы преодолеть ограничения Pandas по умолчанию, необходимо настроить параметры отображения. Сразу скажу — это похоже на снятие ограничителя скорости с автомобиля. Мощно, но требует ответственности. 🛠️

Основные параметры, которые контролируют отображение данных:

Python

Скопировать код

# Максимальное количество строк для отображения
pd.set_option('display.max_rows', None)

# Максимальное количество столбцов для отображения
pd.set_option('display.max_columns', None)

# Ширина каждого столбца (в символах)
pd.set_option('display.width', 1000)

# Максимальное количество символов для отображения в ячейке
pd.set_option('display.max_colwidth', None)

Разберём каждый параметр подробнее:

'display.max_rows': Определяет, сколько строк будет отображаться без усечения. Значение None означает "показывать все".
'display.max_columns': Аналогично для столбцов. None отображает все столбцы.
'display.width': Общая ширина вывода в терминале или ноутбуке. Увеличьте это значение, чтобы избежать переноса строк.
'display.max_colwidth': Особенно важно для текстовых данных — определяет максимальную длину текста в ячейке.

Для работы с большими таблицами важно найти баланс между полнотой отображения и читабельностью. Вот несколько проверенных на практике комбинаций настроек:

Сценарий использования	Настройки параметров	Преимущества
Детальный анализ в Jupyter	maxrows=100, maxcolumns=None, width=2000	Баланс читабельности и полноты
Отчёты для руководства	maxrows=None, maxcolumns=None, max_colwidth=30	Полные данные с компактным форматированием
Экспорт в HTML	maxrows=None, maxcolumns=None, max_colwidth=None	Максимальная детализация для веб-интерфейсов
Предварительный просмотр	maxrows=20, maxcolumns=10, max_colwidth=50	Быстрый обзор структуры без перегрузки

Можно также создать профили настроек для разных сценариев:

Python

Скопировать код

def set_display_profile(profile='default'):
if profile == 'full':
pd.set_option('display.max_rows', None)
pd.set_option('display.max_columns', None)
pd.set_option('display.width', 1000)
pd.set_option('display.max_colwidth', None)
elif profile == 'compact':
pd.set_option('display.max_rows', 50)
pd.set_option('display.max_columns', 20)
pd.set_option('display.width', 120)
pd.set_option('display.max_colwidth', 30)
else: # default
pd.reset_option('display.max_rows')
pd.reset_option('display.max_columns')
pd.reset_option('display.width')
pd.reset_option('display.max_colwidth')

# Использование
set_display_profile('full') # Для максимально детального просмотра

Антон Власов, технический директор В нашем проекте по мониторингу IoT-устройств требовалось отображать тысячи записей с десятками параметров в интерактивной таблице. Стандартные настройки Pandas превращали таблицу в бесполезное многоточие. Мы перепробовали разные комбинации параметров, пока не нашли золотую середину: установили display.maxrows и display.maxcolumns в None, но ограничили max_colwidth до 50 символов. Это давало нам полную визуализацию всех данных, но в то же время не перегружало интерфейс. Кроме того, мы добавили контекстные всплывающие окна для ячеек с усеченным текстом. Этот подход произвёл фурор среди клиентов — они впервые увидели полную картину работы своих устройств без необходимости выгружать тяжёлые CSV-файлы.

Важно помнить, что изменение настроек отображения может существенно повлиять на производительность, особенно при работе с очень большими DataFrame. Если ваша таблица содержит миллионы строк, лучше использовать другие методы визуализации или пагинацию данных. 💡

Методы конвертации DataFrame в HTML без потери данных

Когда дело доходит до преобразования DataFrame в HTML-формат, Pandas предоставляет мощный метод to_html(). Однако, простой вызов этого метода не гарантирует, что все ваши данные отобразятся полностью. Давайте рассмотрим, как максимально эффективно использовать этот инструмент. 🌐

Базовое использование метода to_html():

Python

Скопировать код

# Создаём тестовый DataFrame
import pandas as pd
import numpy as np

df = pd.DataFrame({
'A': np.random.rand(100),
'B': np.random.choice(['X', 'Y', 'Z'], 100),
'C': np.random.randint(1, 100, 100),
'D': [f'Text-{i}' * 5 for i in range(100)]
})

# Простое преобразование в HTML
html_table = df.to_html()

# Сохранение в файл
with open('data_table.html', 'w') as f:
f.write(html_table)

Однако, даже с настройками отображения, указанными ранее, метод to_html() имеет свои собственные параметры, которые влияют на вывод:

max_rows: Контролирует максимальное количество строк в HTML-выводе.
max_cols: Устанавливает максимальное количество столбцов.
render_links: Преобразует URL в кликабельные ссылки.
escape: Определяет, нужно ли экранировать HTML-символы в данных.
index: Включает или исключает индекс DataFrame из HTML.
na_rep: Определяет, как отображать отсутствующие значения (NaN).

Для полного отображения данных без усечения оптимальный вызов выглядит так:

Python

Скопировать код

# Полное отображение без усечения
html_table_full = df.to_html(
index=True,
max_rows=None,
max_cols=None,
escape=False,
na_rep='N/A',
render_links=True
)

Важный момент: даже если вы установили глобальные параметры отображения с помощью pd.set_option(), в методе to_html() эти параметры нужно указать явно через аргументы. Это создаёт два уровня контроля, что может запутать новичков. 🔄

Для более сложных случаев можно использовать комбинацию настроек и дополнительной обработки:

Python

Скопировать код

# Настраиваем глобальные параметры
pd.set_option('display.max_rows', None)
pd.set_option('display.max_columns', None)
pd.set_option('display.max_colwidth', None)

# Генерируем HTML с дополнительными параметрами
html = df.to_html(
classes='table table-striped table-hover', # Bootstrap-классы
border=0,
index=True,
justify='left', # Выравнивание текста
notebook=False, # Оптимизация для веб, а не для Jupyter
render_links=True,
escape=False
)

# Добавляем дополнительную обработку, например, кнопки для экспорта
html_with_buttons = f"""
<div class="table-container">
<div class="export-buttons">
<button onclick="exportToCSV()">Export to CSV</button>
<button onclick="exportToExcel()">Export to Excel</button>
</div>
{html}
</div>
<script>
function exportToCSV() {{ /* JavaScript код */ }}
function exportToExcel() {{ /* JavaScript код */ }}
</script>
"""

При работе с очень большими таблицами (тысячи строк) рекомендую использовать пагинацию или виртуальный скроллинг. Вот пример, как можно разделить большой DataFrame на страницы при экспорте в HTML:

Python

Скопировать код

def paginated_html(df, rows_per_page=100):
total_rows = len(df)
pages = []

for start in range(0, total_rows, rows_per_page):
end = min(start + rows_per_page, total_rows)
page_html = df.iloc[start:end].to_html(
max_rows=None,
max_cols=None,
escape=False
)
pages.append(page_html)

# Создаём HTML с пагинацией
result = """
<div class="paginated-table">
<div class="pagination-controls">
<button id="prev-page" disabled>Previous</button>
<span id="page-indicator">Page 1 of {}</span>
<button id="next-page">Next</button>
</div>
<div class="table-container" id="table-container">
{}
</div>
</div>
<script>
// JavaScript для переключения страниц
const pages = {};
let currentPage = 0;

function showPage(index) {{
document.getElementById('table-container').innerHTML = pages[index];
document.getElementById('page-indicator').textContent = `Page ${{index + 1}} of ${{pages.length}}`;
document.getElementById('prev-page').disabled = index === 0;
document.getElementById('next-page').disabled = index === pages.length – 1;
currentPage = index;
}}

document.getElementById('prev-page').addEventListener('click', () => {{
if (currentPage > 0) showPage(currentPage – 1);
}});

document.getElementById('next-page').addEventListener('click', () => {{
if (currentPage < pages.length – 1) showPage(currentPage + 1);
}});

// Инициализация
showPage(0);
</script>
""".format(len(pages), pages[0], pages)

return result

Такой подход позволяет отображать огромные таблицы без потери данных, при этом не перегружая браузер. 📄

Стилизация HTML-вывода для больших таблиц данных

Отображение всех данных без усечения — это только половина успеха. Большая таблица без стилизации превращается в нечитаемую стену цифр. Pandas предоставляет мощный инструмент Styler, который позволяет визуально улучшить HTML-вывод DataFrame. 🎨

Базовое применение Styler выглядит так:

Python

Скопировать код

# Создаём стилизованную версию таблицы
styled_df = df.style.background_gradient(cmap='viridis', subset=['A', 'C'])

# Экспортируем в HTML
styled_html = styled_df.to_html()

Для больших таблиц особенно полезны следующие приёмы стилизации:

Условное форматирование: Выделение важных значений цветом или форматированием.
Фиксированные заголовки: Заголовки, которые остаются видимыми при прокрутке.
Чередующиеся строки: Улучшают читаемость длинных таблиц.
Группировка данных: Визуальное разделение логических групп данных.
Интерактивные элементы: Сортировка, фильтрация, подсветка при наведении.

Рассмотрим более продвинутый пример стилизации с использованием Styler и дополнительного CSS:

Python

Скопировать код

def style_dataframe(df):
# Создаём базовый стиль
styled = df.style.background_gradient(
cmap='coolwarm', 
subset=['A', 'C'],
vmin=0, 
vmax=100
)

# Добавляем форматирование чисел
styled = styled.format({
'A': '{:.2f}',
'C': '{:d}'
})

# Выделяем определённые значения
styled = styled.highlight_max(color='lightgreen', axis=0)
styled = styled.highlight_min(color='lightcoral', axis=0)

# Применяем чередование строк и другие CSS-стили
styled = styled.set_table_styles([
{'selector': 'tr:nth-child(even)', 'props': 'background-color: #f2f2f2;'},
{'selector': 'th', 'props': 'background-color: #4CAF50; color: white; position: sticky; top: 0; z-index: 1;'},
{'selector': 'td', 'props': 'text-align: right; padding: 8px;'},
{'selector': 'caption', 'props': 'caption-side: bottom; font-style: italic;'},
{'selector': 'table', 'props': 'border-collapse: collapse; width: 100%; font-size: 14px;'},
])

# Добавляем подпись к таблице
styled = styled.set_caption("Подробный анализ данных")

# Применяем пользовательские CSS-классы
styled = styled.set_table_attributes('class="dataframe table-responsive"')

return styled

# Применяем стилизацию и экспортируем в HTML
styled_html = style_dataframe(df).to_html()

# Дополняем HTML дополнительными скриптами для интерактивности
final_html = f"""
<!DOCTYPE html>
<html>
<head>
<meta charset="UTF-8">
<meta name="viewport" content="width=device-width, initial-scale=1.0">
<title>Детальный анализ данных</title>
<link rel="stylesheet" href="https://cdn.jsdelivr.net/npm/bootstrap@5.1.3/dist/css/bootstrap.min.css">
<script src="https://cdn.jsdelivr.net/npm/jquery@3.6.0/dist/jquery.min.js"></script>
<style>
.dataframe {{
max-height: 80vh;
overflow-y: auto;
margin: 20px 0;
box-shadow: 0 4px 8px rgba(0,0,0,0.1);
}}
.table-container {{
padding: 20px;
max-width: 95%;
margin: 0 auto;
}}
.search-box {{
margin-bottom: 15px;
width: 100%;
padding: 8px;
border: 1px solid #ddd;
border-radius: 4px;
}}
</style>
</head>
<body>
<div class="table-container">
<h1>Полный анализ данных</h1>
<input type="text" id="searchBox" class="search-box" placeholder="Поиск по таблице...">
{styled_html}
</div>
<script>
// Простой скрипт для поиска по таблице
$(document).ready(function() {{
$("#searchBox").on("keyup", function() {{
var value = $(this).val().toLowerCase();
$(".dataframe tbody tr").filter(function() {{
$(this).toggle($(this).text().toLowerCase().indexOf(value) > -1)
}});
}});
}});
</script>
</body>
</html>
"""

# Сохраняем полный HTML в файл
with open('styled_data_analysis.html', 'w', encoding='utf-8') as f:
f.write(final_html)

Для ещё большей интерактивности можно интегрировать современные JavaScript-библиотеки для работы с таблицами, такие как DataTables или AG Grid. Вот пример интеграции с DataTables:

Python

Скопировать код

def export_to_datatables(df, filename='interactive_table.html'):
"""Экспортирует DataFrame в интерактивную HTML-таблицу с использованием DataTables"""

# Генерируем базовую HTML-таблицу без стилей (они будут добавлены DataTables)
basic_table = df.to_html(classes='display', index=True, table_id='data_table')

# Создаём полный HTML-документ с интеграцией DataTables
html_content = f"""
<!DOCTYPE html>
<html>
<head>
<meta charset="UTF-8">
<title>Interactive Data Table</title>
<link rel="stylesheet" type="text/css" href="https://cdn.datatables.net/1.11.5/css/jquery.dataTables.css">
<link rel="stylesheet" type="text/css" href="https://cdn.datatables.net/buttons/2.2.2/css/buttons.dataTables.min.css">
<script type="text/javascript" src="https://code.jquery.com/jquery-3.6.0.min.js"></script>
<script type="text/javascript" src="https://cdn.datatables.net/1.11.5/js/jquery.dataTables.js"></script>
<script type="text/javascript" src="https://cdn.datatables.net/buttons/2.2.2/js/dataTables.buttons.min.js"></script>
<script type="text/javascript" src="https://cdn.datatables.net/buttons/2.2.2/js/buttons.html5.min.js"></script>
<style>
body {{ font-family: Arial, sans-serif; margin: 20px; }}
.container {{ max-width: 1200px; margin: 0 auto; }}
h1 {{ color: #333; text-align: center; }}
#data_table_wrapper {{ margin-top: 30px; }}
.dataTables_filter {{ margin-bottom: 15px; }}
</style>
</head>
<body>
<div class="container">
<h1>Interactive Data Analysis</h1>
{basic_table}
</div>
<script>
$(document).ready(function() {{
$('#data_table').DataTable({{
pageLength: 25,
scrollX: true,
scrollY: '60vh',
scrollCollapse: true,
dom: 'Bfrtip',
buttons: [
'copy', 'csv', 'excel'
],
fixedHeader: true,
responsive: true
}});
}});
</script>
</body>
</html>
"""

# Сохраняем в файл
with open(filename, 'w', encoding='utf-8') as f:
f.write(html_content)

return f"Интерактивная таблица сохранена в {filename}"

Такой подход обеспечивает не только полное отображение данных, но и даёт пользователю инструменты для работы с ними: сортировку, фильтрацию, пагинацию и экспорт. Идеально для веб-приложений и интерактивных отчётов! 🚀

Оптимизация производительности при работе с объемными данными

Когда вы отображаете полные данные без усечения, производительность становится критически важным фактором. Браузер может зависнуть, пытаясь отрендерить таблицу с тысячами строк и десятками столбцов. Давайте рассмотрим стратегии оптимизации для работы с объёмными данными. 🏎️

Основные проблемы при работе с большими DataFrame в HTML:

DOM-перегрузка: Браузер создаёт DOM-узел для каждой ячейки таблицы.
Время рендеринга: Браузеру требуется значительное время для отрисовки всех элементов.
Потребление памяти: Большие таблицы могут занимать гигабайты памяти в браузере.
Отзывчивость интерфейса: Пользовательский интерфейс может "замерзать" при прокрутке больших таблиц.

Стратегии оптимизации производительности:

Виртуализация данных: Отображение только видимой части таблицы.
Асинхронная загрузка: Подгрузка данных по мере необходимости.
Предварительная агрегация: Показ агрегированных данных с возможностью раскрытия деталей.
Фрагментация HTML: Разделение большой таблицы на несколько меньших фрагментов.
Оптимизация структуры данных: Предварительная обработка и упрощение структуры DataFrame.

Рассмотрим некоторые из этих стратегий на конкретных примерах:

Python

Скопировать код

# Функция для эффективной обработки больших DataFrame для HTML-отображения
def optimize_df_for_html(df, max_size_mb=50):
"""
Оптимизирует DataFrame для HTML-отображения, учитывая ограничения размера

Параметры:
df (DataFrame): Исходный DataFrame для оптимизации
max_size_mb (int): Максимальный размер результата в МБ

Возвращает:
DataFrame: Оптимизированный DataFrame
"""
import sys

# Оцениваем текущий размер DataFrame в памяти
current_size_mb = df.memory_usage(deep=True).sum() / (1024 * 1024)
print(f"Текущий размер DataFrame: {current_size_mb:.2f} МБ")

# Если DataFrame уже меньше порогового значения, возвращаем его как есть
if current_size_mb <= max_size_mb:
return df

# Шаг 1: Оптимизация типов данных
for col in df.select_dtypes(include=['int']).columns:
# Определяем минимальный целочисленный тип для колонки
col_min, col_max = df[col].min(), df[col].max()

if col_min >= 0: # Только положительные числа
if col_max < 2**8:
df[col] = df[col].astype('uint8')
elif col_max < 2**16:
df[col] = df[col].astype('uint16')
elif col_max < 2**32:
df[col] = df[col].astype('uint32')
else: # Положительные и отрицательные числа
if col_min > -2**7 and col_max < 2**7:
df[col] = df[col].astype('int8')
elif col_min > -2**15 and col_max < 2**15:
df[col] = df[col].astype('int16')
elif col_min > -2**31 and col_max < 2**31:
df[col] = df[col].astype('int32')

# Для float оптимизируем до float32, если это возможно
for col in df.select_dtypes(include=['float']).columns:
df[col] = df[col].astype('float32')

# Для строк используем категориальные типы там, где это имеет смысл
for col in df.select_dtypes(include=['object']).columns:
if df[col].nunique() / len(df) < 0.5: # Если уникальных значений меньше 50% от общего количества
df[col] = df[col].astype('category')

# Проверяем результат оптимизации типов
optimized_size_mb = df.memory_usage(deep=True).sum() / (1024 * 1024)
print(f"Размер после оптимизации типов: {optimized_size_mb:.2f} МБ")

# Шаг 2: Если оптимизация типов недостаточна, применяем выборку строк и столбцов
if optimized_size_mb > max_size_mb:
# Вычисляем, сколько строк и столбцов можем оставить
reduction_factor = max_size_mb / optimized_size_mb

# Приоритизируем столбцы (можем выбрать наиболее важные)
# Например, оставляем столбцы с наибольшей дисперсией
if len(df.columns) > 5:
variances = df.var()
important_columns = variances.sort_values(ascending=False).index[:max(5, int(len(df.columns) * reduction_factor))]
df = df[important_columns]

# Сэмплируем строки, если это всё ещё необходимо
new_size_mb = df.memory_usage(deep=True).sum() / (1024 * 1024)
if new_size_mb > max_size_mb:
sample_size = int(len(df) * max_size_mb / new_size_mb)
df = df.sample(sample_size, random_state=42)

final_size_mb = df.memory_usage(deep=True).sum() / (1024 * 1024)
print(f"Финальный размер DataFrame: {final_size_mb:.2f} МБ")

return df

Для веб-приложений с большими таблицами одним из лучших подходов является "виртуальный скроллинг" — техника, при которой отображаются только те строки таблицы, которые в данный момент видны пользователю:

Python

Скопировать код

def create_virtual_scrolling_table(df, filename='virtual_table.html'):
"""Создаёт HTML с виртуальным скроллингом для большой таблицы"""

# Преобразуем DataFrame в JSON для передачи в JavaScript
import json
data_json = df.to_json(orient='records')

# Получаем заголовки столбцов
columns = list(df.columns)

# Создаём HTML с JavaScript-кодом для виртуального скроллинга
html_content = f"""
<!DOCTYPE html>
<html>
<head>
<meta charset="UTF-8">
<title>Virtual Scrolling Table</title>
<style>
body {{ font-family: Arial, sans-serif; margin: 0; padding: 20px; }}
.container {{ max-width: 1200px; margin: 0 auto; }}
.virtual-table-container {{ 
height: 600px; 
overflow: auto;
position: relative;
border: 1px solid #ddd;
}}
.table-header {{ 
position: sticky;
top: 0;
background: #f8f9fa;
z-index: 10;
border-bottom: 2px solid #dee2e6;
}}
.table-header-cell {{
display: inline-block;
padding: 12px 15px;
font-weight: bold;
box-sizing: border-box;
border-right: 1px solid #dee2e6;
}}
.virtual-row {{
position: absolute;
width: 100%;
box-sizing: border-box;
border-bottom: 1px solid #dee2e6;
}}
.row-cell {{
display: inline-block;
padding: 8px 15px;
box-sizing: border-box;
border-right: 1px solid #dee2e6;
white-space: nowrap;
overflow: hidden;
text-overflow: ellipsis;
}}
.row-even {{ background-color: #f2f2f2; }}
.loading-indicator {{
position: absolute;
top: 50%;
left: 50%;
transform: translate(-50%, -50%);
background: rgba(255, 255, 255, 0.8);
padding: 20px;
border-radius: 5px;
box-shadow: 0 0 10px rgba(0, 0, 0, 0.1);
display: none;
}}
</style>
</head>
<body>
<div class="container">
<h1>Большая таблица данных с виртуальным скроллингом</h1>
<p>Эта таблица эффективно отображает все {len(df)} строк данных, загружая только видимые в данный момент.</p>

<div class="virtual-table-container" id="tableContainer">
<div class="table-header" id="tableHeader"></div>
<div class="loading-indicator" id="loadingIndicator">Загрузка данных...</div>
<div id="virtualRows"></div>
</div>
</div>

<script>
// Данные таблицы
const tableData = {data_json};
const columns = {json.dumps(columns)};

// Конфигурация виртуального скроллинга
const rowHeight = 40; // Высота строки в пикселях
const bufferSize = 10; // Количество дополнительных строк для рендеринга
let visibleRowsCount = 0; // Количество видимых строк

// Элементы DOM
const container = document.getElementById('tableContainer');
const header = document.getElementById('tableHeader');
const virtualRows = document.getElementById('virtualRows');
const loadingIndicator = document.getElementById('loadingIndicator');

// Инициализация заголовка таблицы
function initHeader() {{
const cellWidth = `${{100 / columns.length}}%`;
columns.forEach(column => {{
const headerCell = document.createElement('div');
headerCell.className = 'table-header-cell';
headerCell.style.width = cellWidth;
headerCell.textContent = column;
header.appendChild(headerCell);
}});
}}

// Рендеринг видимых строк
function renderVisibleRows() {{
const scrollTop = container.scrollTop;
const containerHeight = container.clientHeight;

const startIndex = Math.floor(scrollTop / rowHeight) – bufferSize;
const endIndex = Math.ceil((scrollTop + containerHeight) / rowHeight) + bufferSize;

const adjustedStartIndex = Math.max(0, startIndex);
const adjustedEndIndex = Math.min(tableData.length – 1, endIndex);

// Устанавливаем высоту контейнера виртуальных строк
virtualRows.style.height = `${{tableData.length * rowHeight}}px`;

// Очищаем текущие строки
virtualRows.innerHTML = '';

// Рендерим только видимые строки
for (let i = adjustedStartIndex; i <= adjustedEndIndex; i++) {{
const rowData = tableData[i];
const row = document.createElement('div');
row.className = `virtual-row ${{i % 2 === 0 ? 'row-even' : ''}}`;
row.style.top = `${{i * rowHeight}}px`;
row.style.height = `${{rowHeight}}px`;

const cellWidth = `${{100 / columns.length}}%`;

columns.forEach(column => {{
const cell = document.createElement('div');
cell.className = 'row-cell';
cell.style.width = cellWidth;
cell.textContent = rowData[column] !== null ? rowData[column].toString() : 'N/A';
row.appendChild(cell);
}});

virtualRows.appendChild(row);
}}
}}

// Обработчик скролла
function handleScroll() {{
requestAnimationFrame(renderVisibleRows);
}}

// Инициализация таблицы
function initVirtualTable() {{
loadingIndicator.style.display = 'block';

// Вычисляем количество видимых строк
visibleRowsCount = Math.ceil(container.clientHeight / rowHeight);

// Инициализируем заголовок
initHeader();

// Рендерим начальные строки
setTimeout(() => {{
renderVisibleRows();
loadingIndicator.style.display = 'none';

// Добавляем обработчик скролла
container.addEventListener('scroll', handleScroll);
}}, 100);
}}

// Запускаем инициализацию при загрузке страницы
window.addEventListener('load', initVirtualTable);

// Обновляем при изменении размера окна
window.addEventListener('resize', () => {{
visibleRowsCount = Math.ceil(container.clientHeight / rowHeight);
renderVisibleRows();
}});
</script>
</body>
</html>
"""

# Сохраняем в файл
with open(filename, 'w', encoding='utf-8') as f:
f.write(html_content)

return f"Таблица с виртуальным скроллингом сохранена в {filename}"

Ещё одна мощная стратегия — это "ленивая загрузка" данных с сервера по мере необходимости. Это особенно актуально для веб-приложений, где клиентская часть может запрашивать только те данные, которые нужны в данный момент:

Python

Скопировать код

# Серверная часть на Flask для ленивой загрузки данных
from flask import Flask, jsonify, render_template, request
import pandas as pd
import numpy as np

app = Flask(__name__)

# Создаём большой тестовый DataFrame (обычно это будут реальные данные из БД)
@app.route('/')
def index():
return render_template('lazy_loading_table.html')

@app.route('/api/data')
def get_data():
# Получаем параметры запроса
start = int(request.args.get('start', 0))
length = int(request.args.get('length', 50))

# Загружаем данные (здесь мы генерируем их, но обычно они будут из БД)
# В реальном приложении здесь будет запрос к базе данных
df = pd.DataFrame(np.random.rand(10000, 10), 
columns=[f'feature_{i}' for i in range(10)])

# Возвращаем только запрашиваемый фрагмент
result = df.iloc[start:start+length].to_dict(orient='records')

# Возвращаем также общее количество записей
return jsonify({
'data': result,
'total': len(df),
'start': start,
'length': length
})

if __name__ == '__main__':
app.run(debug=True)

Соответствующий HTML-шаблон для ленивой загрузки будет использовать AJAX-запросы для получения данных по мере прокрутки.

Выбор оптимальной стратегии зависит от конкретного сценария использования, объёма данных и требований к интерактивности. Для большинства случаев комбинация виртуального скроллинга и ленивой загрузки даёт наилучшие результаты с точки зрения производительности и UX. 💪

Полное отображение данных Pandas в HTML — это не просто технический трюк, а мощный инструмент, меняющий качество анализа данных. От настройки параметров отображения до продвинутой стилизации и оптимизации производительности — каждый шаг приближает вас к безупречной визуализации. Применяйте виртуальный скроллинг для огромных таблиц, используйте интерактивные элементы для улучшения пользовательского опыта и не бойтесь экспериментировать со стилями. Ваши данные заслуживают быть увиденными во всей своей полноте, а ваши отчёты должны впечатлять не только информативностью, но и визуальным совершенством.

Как полностью отобразить данные Pandas в HTML: руководство

Почему Pandas усекает данные и зачем это менять

Настройка параметров отображения DataFrame в Pandas

Методы конвертации DataFrame в HTML без потери данных

Стилизация HTML-вывода для больших таблиц данных

Оптимизация производительности при работе с объемными данными

Загрузка...