Spis treści:
Co musisz wiedzieć o formacie XML?
Co musisz wiedzieć o formacie XML?
Mówiąc o plikach w formacie XML, nie można pominąć kwestii jego specyfikacji. Czym jest i jakie są jego cechy charakterystyczne?
Język XML (ang. Extensible Markup Language - "rozszerzalny język znaczników") wykorzystuje metodę znakowania, to jest stosowania z góry określonych kodów (nazywanych również tagami lub znacznikami), za pomocą których "opisuje się" struktury danych. Został opracowany pod koniec lat 90. XX wieku przez konsorcjum W3C, jako format tekstowy o uniwersalnym charakterze - pozwalającym na odczytanie go przez każdego (pliki są czytelne zarówno dla człowieka, jak i komputerów).
Takie kody, podobnie, jak w przypadku języka HTML (ang. Hypertext Markup Language), są zapisywane w specyficzny sposób, to jest poprzez zamknięcie ich w nawiasach ostrych (<>). Nie należy jednak na tej podstawie traktować języka znaczników jako równoważnego z HTML - tutaj podobny jest jedynie zapis, natomiast dotyczy on odrębnych kwestii (tagi w HTML służą do zaznaczania funkcji znajdujących się za nimi danych, a w XML umożliwiają wskazanie struktury danych i określenie, czym one są). Wskazujemy na te różnice ze względu na często popełniany błąd związany z traktowaniem obu języków w sposób równoważny.
Dane zapisywane są w hierarchicznej strukturze, którą można poniekąd przyrównać do sposobu zapisu plików w folderach i podfolderach na Twoim urządzeniu. Jednocześnie język znaczników daje użytkownikowi sporą elastyczność - pozwalając na ustalanie własnych kodów tak, by dostosować zapis do swoich potrzeb.
Przeczytaj także: Wizualizacja danych – czym jest i jakie narzędzia stosować?
Podstawowe elementy pliku XML
Każdy plik XML składa się z kilku podstawowych części:
- deklaracja XML - określająca wersję języka i jego format,
- element główny - w języku angielskim określany jako "korzeń", który zbiera i łączy wszystkie pomniejsze elementy w całość,
- elementy (czyli znaczniki) - mogące wskazywać, na przykład, element taki, jak tytuł pliku lub też otaczać głębiej położone tagi (zagnieżdżone elementy),
- atrybuty - dodatkowe informacje o poszczególnych elementach (uszczegółowienia),
- wyrażenia tekstowe - to dane, które są przechowywane i opisywane przez elementy (znaczniki).
Strukturę pliku XML można przyrównać do budowy drzewa - w którym element główny jest jego pniem, a znaczniki (mniejsze elementy) to niejako wyrastające z niego konary. W takim porównaniu zagnieżdżone elementy byłyby cieńszymi gałązkami wyrastającymi z konarów.
Przeczytaj także: SDLC – co to jest? Modele (Waterfall, Agile, Spiral) i etapy cyklu życia

