Jag kanske är sist i hela världen med att bygga mig en MARC-XML parser… men om så inte skulle vara fallet kanske följande är intressant för någon.

Den senaste tiden har jag fått möjlighet att ta emot poster i MARC-XML-format för bearbetning, förädling och import till olika system. T ex så erbjuder LIBRIS via SAMSÖK export av bestånd i MetaLib och SFX i MARC-XML. Vårt bibliotekssystem, ALEPH, erbjuder även det möjlighet att exportera poster i MARC-XML.

Ofta vill man ha ut specifika uppgifter ur en post för att kunna göra något med specifika data. Det kan handla om att plocka ut uppgifter om alla våra tryckta tidskrifter i ALEPH (i form av MARC-XML poster), extrahera datat i 022, 245 och 866 för att importera till SFX och en gemensam tidskriftslista. Eller kanske om att presentera en lista över vilka databaser vi har tillgång till i MetaLib utanför MetaLib på en HTML sida, eller tja, vad som helst egentligen.

PHP erbjuder många fina funktioner för att arbeta med XML via webbgränssnitt. Mellan versionerna 4 och 5 av PHP förändrades stödet för XML ganska mycket. När jag arbetade på Örebro UB använde vi i stor utsträckning PHP4 men på Högskolan i Jönköping är det PHP5 som regerar. För att jag skulle kunna ta med mig den parser som jag börjat bygga på i Örebro till Jönköping använder jag mig av en wrapper som Alexandre Alapetite byggt. Den konverterar XML funktionerna i PHP4 till PHP5 (om det är PHP5 man använder). Således har jag en parser som fungerar för både PHP4 och PHP5.

Om någon är intresserad av att ta del av parsern, så säg till. Även om den är i ständig utveckling efter mina behov så kanske den kan utgöra en bra startpunkt för någon som vill jobba med MARC-XML.

Idag så är det en webbaserad parser, med stöd för att kunna utvinna valfritt antal fält ur MARC-XMLl poster och presentera uppgifterna i HTML eller en TAB separerad fil. Jag skall lägga till stöd för att välja ut delfält nästa gång jag behöver använda den.

1. Välj antal fält som skall hämtas ut ur MARC-XML filen.

Välj antal fält som skall hämtas ut.

2. Ange fältnamn, i vilket format datat skall presenteras och namnet på filen som skall parsas.

3. Se över resultatet.

Det färdiga resultatet.

Tags: ,
Ibland uppmärksammas man på problem som tar en långt i tanke och handling. Gunilla Källman, kontaktbibliotekarie på Örebro UB, fångade mig en dag i korridoren. Hon tyckte det var ett problem med ”Time out” inställningarna i Örebro UB:s OPAC. Man blev utkastad lite titt som tätt ur opac:en. Gunilla undrade om man inte kunde göra något för att komma tillbaka till läget innan man kastades ur. Jag funderade lite över problemet, provade lite olika lösningar innan jag fastnade för url:en på time-out sidan. I url:en återgavs en mängd variabler, sessionsdata, språkinställningar, sökord, osv. Ur detta föddes en idé att läsa in informationen för vidare bearbetning.

Detta resulterade först i en lösning som presenterade en länk på time-out sidan. Länken innehöll söktermer som skickats till sidan som föregick time-out:en. Efter att förfinat metoden lite började jag fundera på andra saker man kunde göra genom att fånga upp datat som skickades via url:en, inte bara vid en time-out. Continue reading ‘URL parsing i OPAC - food for mashup!’

Tags: , , , , ,

Eva Norling och jag var i Stockholm i onsdags och träffade bland annat Bibnät-gruppen på Bibsam. Där var det någon som nämde att ett system typ en blogg installerad på högskola/kommun i deras system kostar ca 120 000 kr om året. Jag vet inte hur sann siffran är men det är nog inte billigt i alla fall.

Enligt min mening är det ett organisationsfel att de stora organisationernas data-avdelning ska härbärgera lätta system som bloggar, wikis och liknade.

Det är dumt att stirra sig blind på url:er och loggor. Kanske ska vi tänka lite mer nätverk. Med lite kunskap registrerar man en egen domän på ett webbhotell för 500-2000 kr om året. Standard för den billiga och mer avancerade lösningar för den dyrare. Ett CMS/Blogg-programvara intallerar man och sätter igång på någon dag. Underhåll och administration tar inte särskilt mycket tid/kunskap och borde vara normala bibliotekarieuppgifter, på samma sätt som man administrerar biblioteksystemet. Kunskaper om detta kan man få tex på BTH-kursen “Web 2.0 i Teori och Praktik”, 5 p, som Lena Ålenius och jag kommer att ha i vår. Det går att anmäla sig.

Vi tänker för mycket hierarki typ:
www.organisation.se/bibliotek/information/tidskrifter/vetenskapliga/etc… och för lite av innhåll ihopsatta genom dynamiska nätverk.

Den allra smidigaste varianten är att lägga bloggar och wikis hos hostade tjänster, typ Wordpress. Om det inte är nödvändigt med multipla författare med olika användarnamn, och man inte har någonting emot namnet Wordpress, Blogger, Livejournal eller liknade i adressen, då är detta ett mycket intressant alternativ. En hostad tjänst kräver dessutom bara normal vana vid Internet. Man gör sig en användare, väljer ett utseende, modifierar det lite och börjar fylla sajten med innehåll.

En nackdel med en hostad service förutom url:en och användarhanteringen är att man inte kan lägga den bakom lösenord och därför kan det vara svårt att använda som personalblogg eller liknade som riktar sig enbart till personalen.

Med lite kreativitet kan man också avända mellanvarianter som sajten Åke Nygren talade om i någon kommentar här: “jagvillvetamera”. De använder en hostad service på Wordpress: http://jagvillveta.wordpress.com/. Det är gratis och all backup, underhåll etc sköts av Wordpress. Däremot har de registrerat domänen http://jagvillveta.nu/ som pekas mot wordpress-sajten. Därmed har de skapat det bästa av två världar: Gratis underhåll av en mycket lättanvänd blogg med ett eget domännamn för några hundra om året. Man kan förstås också stutsa från sin organisations url till en hostad lösning.

Givetvis måste man ha lite magkänsla för vad och hur man kan göra i förhållande till organisationen. Det beror ju också på vilken organisation man tillhör. Det är nog inte helt otänkbart att även företagen kommer att anamma nätverkstänkandet framöver. Många webbföretag gör det redan. Detta är också ett sätt att separera lätta lösningar som kräver minimal säkerhet, från de som kräver hög säkerhet. En blog inne i ett organisationssystem kan till exempel fungera som oavsiktlig bakdörr till de tunga tillämpningarna. Därför kan det vara en god idé att lägga den helt utanför.

Tags: ,



About

You are currently browsing the Bibliotek 2.0 weblog archives for webblösningar.

Taggar

Epost för prenumeration:

Delivered by FeedBurner

www.flickr.com
This is a Flickr badge showing public photos from the Bibliotek 2.0 group pool. Make your own badge here.