Hvordan forbedre Retrieval Resultater etter Relevans Tilbakemelding

Hvordan forbedre Retrieval Resultater etter Relevans Tilbakemelding


Informasjon gjenfinningssystemer (IR) fungerer som verktøy som spørring og returnerer informasjon som utgang. Et eksempel på en moderne IR er en søkemotor. Begrepet "relevance feedback" ble introdusert mer enn tjue år siden som en måte å betegne en automatisk prosess. Systemet er utviklet involverte spørre formuleringer følgende innledende henting drift. Typer av relevans tilbakemeldinger kan inkludere det som er eksplisitt, implisitt, og pseudo eller det som kan kategoriseres som blind tilbakemeldinger. Informasjon gjenfinningssystemer engasjere relevans tilbakemeldingssystemer for å kunne bruke resultatene fra enkelte spørsmål for å vurdere deres samlede dekningen.

Bruksanvisning

1 Forstå de to vanligste IR-teknikker, som brukes av de fleste moderne systemer. Den første er den stammer prosess, som innebærer å fjerne suffikser fra basis ord. For eksempel "hjelpe", "bistått" og "hjelper" vil alle bli referert til som "hjelpe". Systemer som bruker stammer ville kreve at alle ord bli stammet før indeksering. Den andre vanlige IR teknikken bruker ofte funnet ordene fra dokumenter som brukes i det som kalles "stopp lister." Ord som "og", "a" og "men" omfatter vanligvis de fleste av den listen.

2 Evaluere og sammenligne IR systemer for å finne ut hvilken som ville være best for formålet. Se på presisjon og tilbakekalling innenfor et gitt sett med dokumenter hentet. Fastslå graden av presisjon prosent. Bestem nivået av tilbakekalling av andelen av relevante dokumenter som ble hentet.

3 Påfør andre evaluerings aspekter som hvor godt systemet oppfyller spørringen, hvor raskt det tilfredsstiller søket, hvilke ressurser det krever, og hvor lett det er for brukerne å få svar.

4 Gjennomføre eksperimenter med ulike søkeord og strenger av ord inn i IR. Noter responstid og data hentet. Hold justere søkeordet ord gjennom hele eksperimentet i ulike skattemyndighetene. Gjennomgå postene for å fastslå hvilke IR fungerer best. Prøv å studere og undersøke hvordan erfarne brukere tilpasse søketeknikker ved hjelp av tradisjonelle online søkemotoren gjenfinningssystemer. Har mer uerfarne brukere finner måter å innlemme nye søkeordene i samme eksperiment. Omfatter ulike typer av skattemyndighetene.

5 Opprett et eksperiment, hvor alle bruker fag prøve nøyaktig samme henting søkemotor med samme dokument samlingen (for eksempel en gruppe av artikler fra en avis). Har brukerne utføre de samme søkene mot de samme temaene i de samme tidsrammer.

6 Sammenlign resultatene fra alle gjennomførte eksperimenter. Lag rutenett, diagrammer og grafer for å vise dataene som finnes. Dette vil gi et visuelt verktøy for å fange opp nyttig informasjon. Bruk dataanalyse for å finne ut hvordan minimal trente sluttbrukere kan bruke en nyutviklet baseline system i en rimelig effektiv måte. Tolke relevansen tilbakemeldinger for å øke den samlede gjenfinning effektivitet. Sats på økt brukermedvirkning anledning. Styr relevans tilbakemelding for å gjøre mer effektiv samhandling og opprettholde eller øke søkeresultat effektivitet.

Hint

  • Bruk en detaljert analyse av atferdsdata som bruker kommentarer, alder og kjønn for å gjøre resultatene fra eksperimentet rikere og mer spesifikke.
  • Det kan være nødvendig å utføre flere forsøk for å fastslå nyttige resultater, siden virkelige begrensninger noen ganger kan forekomme.