XPath в Java: чтение XML и поиск по атрибуту узла

#Java Core

Пройдите тест, узнайте какой профессии подходите

Сколько вам лет

До 18

От 18 до 24

От 25 до 34

От 35 до 44

От 45 до 49

От 50 до 54

Больше 55

Быстрый ответ

Чтение XML-файлов в Java с помощью XPath предусматривает изначальное создание объекта Document, который будет в дальнейшем парсить XML. Затем используется объект XPath для формирования запросов. Все это можно представить в виде следующего кода:

Java

Скопировать код

import javax.xml.parsers.DocumentBuilderFactory;
import javax.xml.xpath.XPathFactory;
import javax.xml.xpath.XPathConstants;
import org.w3c.dom.NodeList;
import org.w3c.dom.Document;

// Создаём объект Document для парсинга XML – это аналог создания детального чертежа на основе запутанного кода.
Document document = DocumentBuilderFactory.newInstance().newDocumentBuilder().parse("yourfile.xml");
document.normalize(); // Этот шаг аналогичен процессу приведения XML-разметки в порядок, напоминает уборку в подростковой комнате.

// Теперь переходим к выполнению запросов. Скомпилируем выражение XPath и запустим его на документе.
String expr = "/path/to/target";
NodeList result = (NodeList) XPathFactory.newInstance().newXPath().compile(expr).evaluate(document, XPathConstants.NODESET);

// Рассмотрим результаты. Для этого выведем текстовое содержимое каждого узла.
for (int i = 0; i < result.getLength(); i++) {
    System.out.println(result.item(i).getTextContent());
}

Заметьте, насколько важна роль объектов Document и XPath – первый отвечает за парсинг XML, второй – за формирование и выполнение запросов. XPathConstants в свою очередь необходим для корректной интерпретации результатов запросов.

Интеграция XPath с XML

Извлечение текстового содержимого

Текстовые узлы в XML нередко содержат ключевые данные. Для их извлечения, включая те, что скрыты в атрибутах, следует использовать XPathConstants.STRING. В этом случае получатель будет выглядеть так:

Java

Скопировать код

String nodeName = (String) XPathFactory.newInstance().newXPath().compile("/complex/path/nodeName").evaluate(document, XPathConstants.STRING);
System.out.println(nodeName); // В результате будет выведено текстовое содержимое узла nodeName.

Работа с наборами узлов

Для масштабной работы с данными применяется XPathConstants.NODESET, которые собирает узлы в список, или более технично, в NodeList:

Java

Скопировать код

NodeList nodeList = (NodeList) XPathFactory.newInstance().newXPath().compile("//tagName").evaluate(document, XPathConstants.NODESET);

// Теперь мы можем поручить списку узлов предоставить полученные данные.
for (int i = 0; i < nodeList.getLength(); i++) {
    System.out.println(nodeList.item(i).getTextContent());
}

Кошмары с пространствами имён

XML с пространствами имён похож на семейное собрание, где у родственников одно и то же имя. Для работы с XPath выражениями в таких условиях следует использовать карты контекста пространства имён, чтобы ни одного "дяди Боба" не пропустить.

Обработка ошибок

Целесообразно обернуть ваш код работы с XML в блок try-catch для адекватной обработки исключений. Это позволит вам в случае ошибки легко определить её причину благодаря логированию.

Визуализация

Вернемся на шаг назад и представим XML-документ как океан, а XPath — как карту, позволяющую нам находить ценные данные:

Markdown

Скопировать код

Океан (🌊): XML Document — бесконечное море элементов и атрибутов.

Карта с указанием местонахождения сокровищ:

Markdown

Скопировать код

Карта (🗺️): "//tag[@attribute='value']/targetTag"

Следуя указаниям карты, ищем «сокровище» в точке X:

Java

Скопировать код

Node targetNode = (Node) XPathFactory.newInstance().newXPath().compile("//tag[@attribute='value']/targetTag").evaluate(document, XPathConstants.NODE);

И вот сокровище найдено!

Markdown

Скопировать код

Добыча (💰): <targetTag>Содержимое с ключевыми данными!</targetTag>

Таким образом, вы, подобно отважному исследователю, извлекаете необходимые данные из бескрайнего океана XML-документа.

Глубины сложностей и способы их преодоления

Продвинутые методы XPath

XPath в состоянии справиться со сложными задачами, проводить математические вычисления и использовать регулярные выражения для сопоставления с шаблонами. Это похоже на швейцарский армейский нож в работе с XML-данными.

Преобразование узла в строку

На практике может возникнуть необходимость конвертировать узел в строку:

Java

Скопировать код

TransformerFactory transformerFactory = TransformerFactory.newInstance();
StringWriter stringWriter = new StringWriter();
transformerFactory.newTransformer().transform(new DOMSource(node), new StreamResult(stringWriter));
String nodeAsString = stringWriter.toString();

Мощные инструменты для работы с большими данными

Для эффективного парсинга и изменения значительных документов подойдут библиотеки типа vtd-xml, которые обеспечивают высокую производительность.

Тестирование

В контексте Java-разработки JUnit можно сравнить с DataProvider и аннотацией @Test в XML. Использование этих инструментов гарантирует, что ваш XPath код работает корректно и совместим с разными типами XML-документов.

Полезные материалы

Официальная документация Java по XPath — основной источник информации по использованию XPath в Java.
Чтение XML с помощью XPath в Java – Stack Overflow — практические советы и проверенные решения от сообщества разработчиков.
Учебник по XPath — простое и понятное руководство для начинающих по синтаксису XPath.
XPath и XQuery Функции и операторы 3.1 — подробное руководство по функциям и операторам XPath для продвинутых пользователей.
IBM Developer: Языки запросов XML – XPath и XQuery — глубокое исследование языков запросов XML.
Jenkov учебник по XPath парсеру в Java — детальное руководство по созданию и использованию XPath парсера в Java.

Проверь как ты усвоил материалы статьи

Пройди тест и узнай насколько ты лучше других читателей

Какой объект в Java отвечает за парсинг XML?

1 / 5

Олеся Тарасова

Java-разработчик

Свежие материалы

История компиляторов: от первых до современных

30 августа 2024

Основные функции для работы с файлами в C

30 августа 2024

Компиляторы: что это и зачем они нужны

30 августа 2024

XPath в Java: чтение XML и поиск по атрибуту узла

Быстрый ответ

Интеграция XPath с XML

Извлечение текстового содержимого

Работа с наборами узлов

Кошмары с пространствами имён

Обработка ошибок

Визуализация

Глубины сложностей и способы их преодоления

Продвинутые методы XPath

Преобразование узла в строку

Мощные инструменты для работы с большими данными

Тестирование

Полезные материалы

Загрузка...