Jag kanske är sist i hela världen med att bygga mig en MARC-XML parser… men om så inte skulle vara fallet kanske följande är intressant för någon.

Den senaste tiden har jag fått möjlighet att ta emot poster i MARC-XML-format för bearbetning, förädling och import till olika system. T ex så erbjuder LIBRIS via SAMSÖK export av bestånd i MetaLib och SFX i MARC-XML. Vårt bibliotekssystem, ALEPH, erbjuder även det möjlighet att exportera poster i MARC-XML.

Ofta vill man ha ut specifika uppgifter ur en post för att kunna göra något med specifika data. Det kan handla om att plocka ut uppgifter om alla våra tryckta tidskrifter i ALEPH (i form av MARC-XML poster), extrahera datat i 022, 245 och 866 för att importera till SFX och en gemensam tidskriftslista. Eller kanske om att presentera en lista över vilka databaser vi har tillgång till i MetaLib utanför MetaLib på en HTML sida, eller tja, vad som helst egentligen.

PHP erbjuder många fina funktioner för att arbeta med XML via webbgränssnitt. Mellan versionerna 4 och 5 av PHP förändrades stödet för XML ganska mycket. När jag arbetade på Örebro UB använde vi i stor utsträckning PHP4 men på Högskolan i Jönköping är det PHP5 som regerar. För att jag skulle kunna ta med mig den parser som jag börjat bygga på i Örebro till Jönköping använder jag mig av en wrapper som Alexandre Alapetite byggt. Den konverterar XML funktionerna i PHP4 till PHP5 (om det är PHP5 man använder). Således har jag en parser som fungerar för både PHP4 och PHP5.

Om någon är intresserad av att ta del av parsern, så säg till. Även om den är i ständig utveckling efter mina behov så kanske den kan utgöra en bra startpunkt för någon som vill jobba med MARC-XML.

Idag så är det en webbaserad parser, med stöd för att kunna utvinna valfritt antal fält ur MARC-XMLl poster och presentera uppgifterna i HTML eller en TAB separerad fil. Jag skall lägga till stöd för att välja ut delfält nästa gång jag behöver använda den.

1. Välj antal fält som skall hämtas ut ur MARC-XML filen.

Välj antal fält som skall hämtas ut.

2. Ange fältnamn, i vilket format datat skall presenteras och namnet på filen som skall parsas.

3. Se över resultatet.

Det färdiga resultatet.

Tags: ,



About

You are currently browsing the Bibliotek 2.0 weblog archives for marc xml.

Taggar

Epost för prenumeration:

Delivered by FeedBurner

www.flickr.com
This is a Flickr badge showing public photos from the Bibliotek 2.0 group pool. Make your own badge here.