hdl:10013/epic.35464
Flexibleres Lucene - Titelthema: Lucene-TokenStream-API
Contact
uschindler [ at ] pangaea.de
Abstract
Die freie Volltextsuchmaschine Lucene wird momentan gründlich renoviert. Der Artikel stellt das neue TokenStream API als eine der aktuellen Erweiterungen vor. Es ermöglicht es Nutzern von Lucene, jedem indexierten Wort (Term bzw. Token) typisierte Attribute zuzuordnen und diese später mit flexible Indexing auch im Index abzuspeichern. Am Beispiel der Eigennamenerkennung zeigt der Artikel wie das neue TokenStream API genutzt werden kann und welche Vorteile es gegenüber dem alten Verfahren hat.
Item Type
Article
Authors
Divisions
AWI Organizations > Infrastructure > Computing and Data Centre
AWI Organizations > Infrastructure > Computing and Data Centre > PANGAEA
AWI Organizations > Infrastructure > Computing and Data Centre > PANGAEA
Programs
Publication Status
Published
Eprint ID
22634
Cite as
Drost, I.
and
Schindler, U.
(2010):
Flexibleres Lucene - Titelthema: Lucene-TokenStream-API
,
Java Magazin,
7
,
pp. 40-44
.
Share
Research Platforms
Campaigns
N/A
Actions