首页
个人开发
工作相关
搜索
登录
搜索
colo
欲买桂花同载酒
累计撰写
1823
篇文章
累计收到
0
条评论
首页
栏目
首页
个人开发
工作相关
搜索引擎
2025-12-12
设计支持实时更新的分布式搜索引擎
设计要点:采用主从分片架构实现水平扩展使用Write-Ahead Log + 双缓冲索引处理实时更新通过版本向量保证最终一致性实现增量合并策略优化资源消耗设计多级缓存降低查询延迟
2025年-12月-12日
4 阅读
0 评论
搜索引擎
2025-12-12
设计一个支持百万级网页的搜索引擎
设计百万级网页搜索引擎的核心要点:倒排索引结构:词项到文档ID列表的映射,采用(词项, 文档ID, 词频)三元组存储分布式架构:使用分片(Sharding)将索引分散到多台机器,按词项哈希分配相关性排序:采用BM25算法结合PageRank计算文档权重性能优化:SSD缓存热点索引,布隆过滤器快速过滤无效查询,压缩倒排列表查询流程:分词→获取倒排列表→合并结果→排序→分页返回
2025年-12月-12日
4 阅读
0 评论
搜索引擎
2025-12-11
设计一个简单的搜索引擎索引系统
实现一个简单的搜索引擎索引系统需要:使用倒排索引作为核心数据结构通过add_document方法将文档ID和内容添加到索引通过search方法查询包含关键词的文档ID处理文本时进行分词和小写转换等基础预处理
2025年-12月-11日
5 阅读
0 评论
搜索引擎