source: make_issn_list.py @ 26:4af842589412

Revision 26:4af842589412, 1.5 KB checked in by hagenbruch@phoibe.ub.rub.de, 7 years ago (diff)

Added auto-suggest and linked data mashup; leafing through single hits is now independent of position in result list (i.e. an entry can be bookmarked as is); further improvements...

Line 
1#!/usr/bin/env python
2# encoding: utf-8
3"""
4make_issn_list.py
5
6Created by Andre Hagenbruch on 2009-12-02.
7Copyright (c) 2009 University Library Bochum. All rights reserved.
8"""
9
10from urllib import urlopen
11from unique_jcr import unique
12#from cgi import escape
13
14# BASE = escape('http://dispatch.opac.d-nb.de/DB=1.1/SET=1/TTL=1/CMD?ACT=SRCHA&IKT=8&SRT=LST_ty&TRM=')
15BASE = 'http://dispatch.opac.d-nb.de/DB=1.1/SET=1/TTL=1/CMD?ACT=SRCHA&IKT=8&SRT=LST_ty&TRM='
16
17def get_data():
18        issns = set()
19        result = eval(urlopen('http://134.147.247.36:8983/solr/select/?q=*:*&rows=15000&fl=issn&wt=python').read())
20        docs = result['response']['docs']
21        for doc in docs:
22                #print docs
23                for issn in doc.get('issn', ''):
24                        issns.add(issn)
25        return issns
26
27def main():
28        issns = get_data()
29        #print len(issns)
30        injcr = []
31        notinjcr = []
32        # print '''
33        # <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML+RDFa 1.0 //EN" "http://www.w3.org/Markup/DTD/xhtml-rdfa-1.dtd">
34        # <html xmlns="http://www.w3.org/1999/xhtml" xml:lang="de">
35        #       <head>
36        #               <title>ISSN-Liste</title>
37        #       </head>
38        #       <body>
39        #               <div>
40        # '''
41        for issn in issns:
42                iss = issn.split(', ')
43                for i in iss:
44                        print i
45                        if i not in unique:
46                                # print '\t\t\t<a href="%s%s">%s</a><br/>' % (BASE, i, i)
47                                #print '%s;%s%s ' % (i, BASE, i)
48                                notinjcr.append(i)
49                        else:
50                                #print 'jcr: %s' % i
51                                injcr.append(i)
52       
53        # print '''
54        #               </div>
55        #       </body>
56        # </html>
57        # '''
58        #print len(notinjcr)
59
60
61if __name__ == '__main__':
62        main()
63
Note: See TracBrowser for help on using the repository browser.