瓦尔登湖小酒馆

「酒神和日神」

[置顶] 搜索算法概要

相关链接 Query理解 搜索召回 搜索排序 前言 众所周知,系统架构由组织结构决定,纵然如此,作为一个复杂系统,搜索引擎仍然可以抽象出相对统一的方法论,其体系下算法...

QP-Term改写

1、Term 改写 改写是QP中的重要组成部分,在搜索系统中,用户输入的查询词(Query)和文档之间可能存在用词不一致的情况,或者同一意思可以通过不同的表达方式传达。通过同义改写,检索系统可...

QP-词权重

1、词权重(Term Weighting) 词权重(Term Weighting)指搜索引擎在处理用户查询时,用于衡量用户查询(Query)中每个词(Term)的重要程度。这种重要程度的评估对...

QP-Query 切词

1、Query 分词(切词) 分词指将一段连续的文本切成一个个独立且有意义的词汇,在文本召回中会对 Doc 文本内容分词以构建索引,并通过对查询词 Query 分词后去做检索。Query 分词...

搜索-排序

搜索排序 排序 是搜索链路中的最后一个阶段,排序系统普遍采用级联架构,以此平衡效率和效果,并为业务需求提供灵活的调整空间。 排序系统的整体定位和要求主要是基于搜索系统的核心目标,在提升用...

搜索-召回

搜索召回 召回 是整个检索流程的核心组成部分之一,其主要任务是从大规模文档集合中初步筛选出一批可能与用户查询相关的文档。对于召回的整体定位和要求应当为: 快速缩小范围:从海量文档中选出...

搜索-Query 解析

搜索 Query 解析 Query 解析 是搜索链路中的关键环节,用于理解用户的查询并为后续处理(如检索和排序)提供清晰的结构化输入。它的核心任务是将用户的自然语言查询转化为系统能够理解的语义...

关于写搜索算法系列的动机

为什么要写搜索算法系列 本博客意在梳理搜索算法近年来的技术发展脉络,希望可以从中抽象出其方法论。从专家策略、传统算法到机器学习,在技术迭代的过程中,与时俱新的,搜索算法完成了一系列汰换、沉淀、...