回到顶部

论文赏析#4 直播|十亿规模数据集上高召回高 QPS 的 ANNS 单机方案

2021年11月25日 19:00 ~ 2021年11月25日 21:00
线上活动 (活动行Live)

收起

活动票种
    付费活动,请选择票种
    展开活动详情

    活动内容收起


    Paper reading

    第四期

    Paper reading直播是由 Milvus 社区发起的学术直播间,分享业内前沿学术论文,与大家交流人工智能与数据库领域最新研究方向。

    本期论文分享,我们邀请到了 Zilliz 技术研究工程师许维芷,与大家共同讨论 发表在 NeurIPS 2019上的论文DiskANN: Fast Accurate Billion-point Nearest Neighbor Search on a Single Node”

    对本期主题感兴趣的小伙伴,记得在下方预约我们 11 月 25 日(周四)晚 7 点的直播哦!


    直播信息 


    DiskANN: Fast Accurate Billion-point Nearest Neighbor Search on a Single Node” 是 2019 年发表在 NeurIPS 上的论文。目前有很多向量检索的 ANN 算法,这些算法在建索引性能、查询性能和查询召回率方面各有取舍。这篇论文提出了能够有效支持大规模数据的常驻 SSD 的 ANNS 方案:DiskANN。


    该文提出了一种基于磁盘的 ANN 方案,该方案可以在单个 64 G 内存和足够 SSD 的机器上对十亿级别的数据进行索引、存储和查询, 并且能够满足大规模数据 ANNS 的三个需求: 高召回、低查询时延和高密度(单节点能索引的点的数量)。


    文中的方法做到了在 16 核 64G 内存的机器上对十亿级别的数据集 SIFT1B 建基于磁盘的图索引,并且 recall@1 > 95% 的情况下 qps 达到了 5000, 平均时延不到 3ms。


    论文名称:

    DiskANN: Fast Accurate Billion-point Nearest Neighbor Search on a Single Node


    论文链接:

    点击【阅读原文】下载

    https://suhasjs.github.io/files/diskann_neurips19.pdf


    分享提纲:

    1. DiskANN 概述 

    2. 磁盘方案和 DiskANN 的动机及贡献 

    3. DiskANN 是如何建索引和查询 

    4. 实验结果 

    5. 总结

     嘉宾介绍 

    许维芷

    Zilliz 技术研究工程师

    墨尔本大学计算机科学本科及硕士。主要工作是各类向量搜索索引算法的调研、探索和实现,并合作研发 Milvus 的核心检索引擎模块。业余时间喜欢打篮球。


    交流群与志愿者招募 


    线上分享结束后,嘉宾还会在直播交流群内实时QA,欢迎大家扫码加入直播群与大家共同交流!


    同时,我们热烈欢迎社区志愿者以讲师、议评人、合作直播等形式参与到 Paper reading 直播中。请通过直播交流群联系群管理员与我们取得联系。






    举报活动

    活动标签

    最近参与

    • 王艳
      报名

      (4年前)

    • 微信用户
      报名

      (4年前)

    报名须知

    1、本活动具体服务及内容由主办方【Zilliz】提供,活动行仅提供票务技术支持,请仔细阅读活动内容后参与。

    2、如在活动参与过程中遇到问题或纠纷,双方应友好协商沟通,也可联络活动行进行协助。

    您还可能感兴趣

    您有任何问题,在这里提问!

    为营造良好网络环境,评价信息将在审核通过后显示,请规范用语。

    全部讨论

    还木有人评论,赶快抢个沙发!

    活动主办方更多

    Zilliz

    Zilliz

    Zilliz 是向量数据库系统领域的开拓者和全球领先者,研发面向 AI 生产系统的向量数据库系统。Zilliz 以发掘非结构化数据价值为使命,致力于打造面向 AI 应用的新一代数据库技术,帮助企业便捷地开发 AI 应用。Zilliz 的产品能显著降低管理 AI 数据基础设施的成本,帮助 AI 技术赋能更多的企业、组织和个人。

    微信扫一扫

    分享此活动到朋友圈

    免费发布