source: feeder.py @ 14:0e0f06219896

Revision 14:0e0f06219896, 6.0 KB checked in by hagenbruch@phoibe.ub.rub.de, 9 years ago (diff)

First version of organization RDF

Line 
1#!/usr/bin/env python
2# encoding: utf-8
3"""
4feeder.py
5
6Created by Andre Hagenbruch on 2009-11-08.
7Copyright (c) 2009 University Library Bochum. All rights reserved.
8"""
9
10#from mods2solr import Collection
11from mods_parser import Collection
12#from solr_util import commit, optimize
13
14COL_INFO = {
15        'biologie': {
16                'filename': 'biologie-biotechnologie.xml',
17                'institution': 'Fakultaet',
18                'inst_label': 'Biologie und Biotechnologie',
19                'disziplin': 'Naturwissenschaft',
20        },
21        'chemie': {
22                'filename': 'chemie-biochemie.xml',
23                'institution': 'Fakultaet',
24                'inst_label': 'Chemie und Biochemie',
25                'disziplin': 'Naturwissenschaft',
26        },
27        'geowissenschaften': {
28                'filename': 'geowissenschaften.xml',
29                'institution': 'Fakultaet',
30                'inst_label': 'Geowissenschaften',
31                'disziplin': 'Naturwissenschaft',
32        },
33        'archaeologie': {
34                'filename': 'geschichte/archaeologie.xml',
35                'institution': 'Fakultaet',
36                'inst_label': 'Geschichtswissenschaft',
37                'label': 'Archäologie',
38                'disziplin': 'Geisteswissenschaft',
39        },
40        'musik': {
41                'filename': 'geschichte/musikwissenschaft.xml',
42                'institution': 'Fakultaet',
43                'inst_label': 'Geschichtswissenschaft',
44                'label': 'Musikwissenschaft',
45                'disziplin': 'Geisteswissenschaft',
46        },
47        'geschichte': {
48                'filename': 'geschichte/geschichte.xml',
49                'institution': 'Fakultaet',
50                'inst_label': 'Geschichtswissenschaft',
51                'label': 'Geschichte',
52                'disziplin': 'Geisteswissenschaft',
53        },
54        'jura': {
55                'filename': 'jura.xml',
56                'institution': 'Fakultaet',
57                'inst_label': 'Jura',
58                'disziplin': 'Geisteswissenschaft',
59        },
60        'maschinenbau': {
61                'filename': 'maschinenbau.xml',
62                'institution': 'Fakultaet',
63                'inst_label': 'Maschinenbau',
64                'disziplin': 'Ingenieurwissenschaft',
65        },
66        'medizin': {
67                'filename': 'medizin.xml',
68                'institution': 'Fakultaet',
69                'inst_label': 'Medizin',
70                'disziplin': 'Medizin',
71        },
72        'anglistik': {
73                'filename': 'philologie/anglistik.xml',
74                'institution': 'Fakultaet',
75                'inst_label': 'Philologie',
76                'label': 'Anglistik',
77                'disziplin': 'Geisteswissenschaft',
78        },
79        'germanistik': {
80                'filename': 'philologie/germanistik.xml',
81                'institution': 'Fakultaet',
82                'inst_label': 'Philologie',
83                'label': 'Germanistik',
84                'disziplin': 'Geisteswissenschaft',
85        },
86        'linguistik': {
87                'filename': 'philologie/sprachwissenschaft.xml',
88                'institution': 'Fakultaet',
89                'inst_label': 'Philologie',
90                'label': 'Linguistik und Computerlinguistik',
91                'disziplin': 'Geisteswissenschaft',
92        },
93        'romanistik': {
94                'filename': 'philologie/romanistik.xml',
95                'institution': 'Fakultaet',
96                'inst_label': 'Philologie',
97                'label': 'Romanistik',
98                'disziplin': 'Geisteswissenschaft',
99        },
100        'philosophie': {
101                'filename': 'philosoph-erzwiss/philosophie.xml',
102                'institution': 'Fakultaet',
103                'inst_label': 'Philosophie und Erziehungswissenschaft',
104                'label': 'Philosophie',
105                'disziplin': 'Geisteswissenschaft',
106        },
107        'Physik': {
108                'filename': 'physik-astronomie.xml',
109                'institution': 'Fakultaet',
110                'inst_label': 'Physik und Astronomie',
111                'label': 'Physik und Astronomie',
112                'disziplin': 'Naturwissenschaft',
113        },
114        'psychologie': {
115                'filename': 'psychologie.xml',
116                'institution': 'Fakultaet',
117                'inst_label': 'Psychologie',
118                'disziplin': 'Geisteswissenschaft',
119        },
120        'sozialwissenschaft': {
121                'filename': 'sozialwissenschaften.xml',
122                'institution': 'Fakultaet',
123                'inst_label': 'Sozialwissenschaft',
124                'disziplin': 'Geisteswissenschaft',
125        },
126        'wirtschaftswissenschaften': {
127                'filename': 'wirtschaftswissenschaften.xml',
128                'institution': 'Fakultaet',
129                'inst_label': 'Wirtschaftswissenschaften',
130                'disziplin': 'Geisteswissenschaft',
131        },
132        'lehrerbildung': {
133                'filename': 'zentrale-einrichtungen/lehrerbildung.xml',
134                'institution': 'Zentrale wissenschaftliche Einrichtungen',
135                'inst_label': 'Lehrerbildung',
136                'disziplin': 'Geisteswissenschaft',
137        },
138        'neuroinformatik': {
139                'filename': 'zentrale-einrichtungen/neuroinformatik.xml',
140                'institution': 'Zentrale wissenschaftliche Einrichtungen',
141                'inst_label': 'Neuroinformatik',
142                'disziplin': 'Naturwissenschaft',
143        },
144        'neuroscience': {
145                'filename': 'zentrale-einrichtungen/r-d-neuroscience.xml',
146                'institution': 'Zentrale wissenschaftliche Einrichtungen',
147                'inst_label': 'Research Department Neuroscience',
148                'disziplin': 'Naturwissenschaft',
149        },
150        'etechnik': {
151                'filename': 'elektrotechnik-informationstechnik.xml',
152                'institution': 'Fakultaet',
153                'inst_label': 'Elektrotechnik und Informationstechnik',
154                'disziplin': 'Ingenieurwissenschaft',
155        },
156        'bauwiss': {
157                'filename': 'bau-umwelt.xml',
158                'institution': 'Fakultaet',
159                'inst_label': 'Bau- und Umweltingenieurwissenschaften',
160                'disziplin': 'Ingenieurwissenschft',
161        }
162}
163
164def main():
165       
166        # Alle Kollektionen konvertieren
167        # for fach in COL_INFO:
168        #       print fach
169        #       col = Collection('mods-xml/' +  COL_INFO[fach]['filename'], fach, institution = COL_INFO[fach]['institution'], inst_label = COL_INFO[fach]['inst_label'], debug = True)
170        #       col.convert()
171
172        # Alle Kollektionen indexieren
173#       for fach in COL_INFO:
174#               print fach#.encode('utf8')
175#               col = Collection('mods-xml/' + COL_INFO[fach]['filename'], fach, COL_INFO[fach]['disziplin'], institution = COL_INFO[fach]['institution'], inst_label = COL_INFO[fach]['inst_label'])
176#               col.feed()
177#               commit()
178#               optimize()
179       
180          #Eine Kollektion konvertieren
181          test = Collection('mods-xml/' + 'philosoph-erzwiss/philosophie.xml', 'Philosophie', institution = 'Fakultaet', inst_label = 'Philosophie', debug = True)
182          test.convert()
183
184        # Eine Kollektion indexieren
185        # test = Collection('mods-xml/' + 'zentrale-einrichtungen/neuroinformatik.xml', 'Neuroinformatik', institution = 'Zentrale wissenschaftliche Einrichtungen', inst_label = 'Neuroinformatik')
186        # test.feed()
187
188
189if __name__ == '__main__':
190        main()
191
Note: See TracBrowser for help on using the repository browser.