收起
Paper reading
第四期
Paper reading直播是由 Milvus 社区发起的学术直播间,分享业内前沿学术论文,与大家交流人工智能与数据库领域最新研究方向。
本期论文分享,我们邀请到了 Zilliz 技术研究工程师许维芷,与大家共同讨论 发表在 NeurIPS 2019上的论文“DiskANN: Fast Accurate Billion-point Nearest Neighbor Search on a Single Node”。
对本期主题感兴趣的小伙伴,记得在下方预约我们 11 月 25 日(周四)晚 7 点的直播哦!
”
● 直播信息 ●
DiskANN: Fast Accurate Billion-point Nearest Neighbor Search on a Single Node” 是 2019 年发表在 NeurIPS 上的论文。目前有很多向量检索的 ANN 算法,这些算法在建索引性能、查询性能和查询召回率方面各有取舍。这篇论文提出了能够有效支持大规模数据的常驻 SSD 的 ANNS 方案:DiskANN。
该文提出了一种基于磁盘的 ANN 方案,该方案可以在单个 64 G 内存和足够 SSD 的机器上对十亿级别的数据进行索引、存储和查询, 并且能够满足大规模数据 ANNS 的三个需求: 高召回、低查询时延和高密度(单节点能索引的点的数量)。
文中的方法做到了在 16 核 64G 内存的机器上对十亿级别的数据集 SIFT1B 建基于磁盘的图索引,并且 recall@1 > 95% 的情况下 qps 达到了 5000, 平均时延不到 3ms。
论文名称:
DiskANN: Fast Accurate Billion-point Nearest Neighbor Search on a Single Node
论文链接:
点击【阅读原文】下载
https://suhasjs.github.io/files/diskann_neurips19.pdf
分享提纲:
1. DiskANN 概述
2. 磁盘方案和 DiskANN 的动机及贡献
3. DiskANN 是如何建索引和查询
4. 实验结果
5. 总结
● 嘉宾介绍 ●
许维芷
Zilliz 技术研究工程师
墨尔本大学计算机科学本科及硕士。主要工作是各类向量搜索索引算法的调研、探索和实现,并合作研发 Milvus 的核心检索引擎模块。业余时间喜欢打篮球。
● 交流群与志愿者招募 ●
线上分享结束后,嘉宾还会在直播交流群内实时QA,欢迎大家扫码加入直播群与大家共同交流!
同时,我们热烈欢迎社区志愿者以讲师、议评人、合作直播等形式参与到 Paper reading 直播中。请通过直播交流群联系群管理员与我们取得联系。
1、本活动具体服务及内容由主办方【Zilliz】提供,活动行仅提供票务技术支持,请仔细阅读活动内容后参与。
2、如在活动参与过程中遇到问题或纠纷,双方应友好协商沟通,也可联络活动行进行协助。