Paul North er prosjektleder for Enterprise search ved Johns Hopkins Applied Physics Lab (JHAPL).
Information Optimization Assessment Process (IOA) er en analyse av virksomhetens virksomhet og mål sett i sammenheng med tilgang på og distribusjon av informasjon. I Helsebiblioteket fikk vil hjelp av konsulent Pål Frønsdal for å gjøre dette. JHAPL gjorde dette med hjelp fra Vivisimo.
Mål med IOA:
- Oppnå bedre relevans
- Alle dokumenter på første resultatside skal oppfattes som relevante for brukeren
Tiltak:
- Detaljert mapping mot felter i dokumenter/databaser
- Finne dokument-titler basert på metadata
- Eksperimentering med vekting
En del av disse erfaringene er ikke nødvendigvis veldig relevante for oss. JHAPL henter informasjon først og fremst fra interne kilder. Slike kilder har mer stabile metadata strukturer enn våre eksterne kilder. Likevel var det interessant å høre på noen av løsningene de jobber med.
Ytelse var et annet hovedpunkt i IOA.
- Ytelse i søk
- Ytelse for crawl
Tiltak søk:
- Ikke vise resultater fra irrelevante kilder
- Skru av ACL (knyttet til brukers rettigheter)
- Ha alle collections i RAM - ikke ha dem på disker (!)
Tiltak crawl:
SharePoint sitene hos JHAPL tar flere dager - opp til en uke å crawle!
- Kjøre flere prosesser parallellt
- Installere Vivisimo Velocity innenfor brannmur
- Oppgradere servere for å bedre takle de tunge prosessene
Andre tiltak av interesse:
Utvikle et "admin dashboard" med
- Rapporter og alarmer hvis crawl feiler
- Statistikk (top queries, click through, queries pr. source)
- Forbedre synlighet av spotlights
- Endre lengde på snippets
- Nye expand/collapse ikoner
- Relevanstesting og vekting