faiss 学习

介绍

安装

编译

索引学习


  • 首先想在本地mac上编译faiss(失败)

    • 安装了cuda,但mac没有GPU
    • gcc g++ 默认使用的cmake,通过设置环境变量解决
    • 安装openblas boost thrift zookeeper
    • 还有一些依赖问题没有解决
    • 编译整个项目时出现找不到头文件的问题
  • 在本地安装thrift0.9.2(失败)
    • 分别可以从github与thrit官网下载包进行安装,但都没有安装成功
    • 使用brew install thrift可以安装成功,但无法通过命令选择0.9.2版本
    • 网上能找到方法,从github上clone下来brew的thrift版本,然后git log找到0.9.2版本对应的commit id,git checkout到这个id,执行命令,会出错
  • 拉取centos7 docker镜像(失败)
    • 由于生产环境中使用的是centos7,所以想拉取相同系统环境的镜像,好处是可以直接把线上的库文件scp到本地
    • 安装cmake make gcc g++
    • 但仍然需要安装cuda openblas thrift boost zookeeper等等依赖
    • 依赖安装不完整,编译项目时出现找不到头文件问题
  • 使用测试环境(通过)
    • 好处是各种依赖已经安装好
    • 有点麻烦的是在本地clion写好测试代码,复制到测试机上进行编译并执行测试
    • 测试目的为faiss不同版本之间的性能,由于编译faiss(生成静态库文件)需要cuda openblas等依赖,因此也在测试机上执行
    • 直接将原src目录下的makefile目录复制,并进行修改(makefile来自nmslib项目,其中还有很多编译选项不明白)
    • 编译好不同版本的faiss静态库文件,完成性能测试(faiss库还有待继续深入学习)
  • 使用测试环境(无法使用GPU建立索引)
    • 原因是测试环境的机器没有GPU,还一直在google错误信息,浪费时间,心塞。。。

      • 查看gpu以及类型 lspci | grep -i vga; lspci |grep -i nvidia
      • 查看nvidia显卡状态 nvidia-smi
  • 相似度
    • inner product: 越大越相似(越大夹角越小,方向越一致)
    • cosine similarity: normalized vector, inner product, -1:1,越大越相似

待补充...

faiss学习的更多相关文章

  1. Faiss学习:一

    在多个GPU上运行Faiss以及性能测试 一.Faiss的基本使用 1.1在CPU上运行 Faiss的所有算法都是围绕index展开的.不管运行搜索还是聚类,首先都要建立一个index. import ...

  2. Faiss的学习和入门文章

    可以看这里的文章: https://www.leiphone.com/news/201703/84gDbSOgJcxiC3DW.html https://waltyou.github.io/Faiss ...

  3. faiss索引基于数量级和内存限制的选择

    它是一个能使开发者快速搜索相似多媒体文件的算法库.而该领域一直是传统的搜索引擎的短板.借助Faiss,Facebook 在十亿级数据集上创建的最邻近搜索(nearest neighbor search ...

  4. Searching with Deep Learning 深度学习的搜索应用

    本文首发于 vivo 互联网技术微信公众号 https://mp.weixin.qq.com/s/wLMvJPXXaND9xq-XMwY2Mg作者:Eike Dehling翻译:杨振涛 本文由来自 T ...

  5. Faiss教程:索引(1)

    索引是faiss的关键知识,我们重点介绍下. 索引方法汇总 有些索引名,我就不翻译了,根据英文名去学习更准确. 索引名 类名 index_factory 主要参数 字节数/向量 精准检索 备注 精准的 ...

  6. 揭开Faiss的面纱 探究Facebook相似性搜索工具的原理

    https://www.leiphone.com/news/201703/84gDbSOgJcxiC3DW.html 本月初雷锋网报道,Facebook 开源了 AI 相似性搜索工具 Faiss.而在 ...

  7. 阿里Tree-based Deep Match(TDM) 学习笔记

    阅读文献:https://zhuanlan.zhihu.com/p/35030348 参考文献:https://www.leiphone.com/news/201803/nlG3d4sZnRvgAqg ...

  8. Youtube深度学习推荐系统论文

    https://static.googleusercontent.com/media/research.google.com/en//pubs/archive/45530.pdf https://zh ...

  9. Faiss流程与原理分析

    1.Faiss简介 Faiss是Facebook AI团队开源的针对聚类和相似性搜索库,为稠密向量提供高效相似度搜索和聚类,支持十亿级别向量的搜索,是目前最为成熟的近似近邻搜索库.它包含多种搜索任意大 ...

随机推荐

  1. Sublime远程连接Linux

      1:Ctrl+Shift+P,输入install 选择红框框然后Enter       2:输入ftp,然后找到sftp,Enter       3:修改配置     修改账号密码信息远程路径之后 ...

  2. OLAP + MDX

    基本概念 维度(Dimension):表示数据的属性,一个维度一般会有一个维表(也可能多个),事实表会有一个字段关联维表. 退化维度:有的维度可以没有维度表,因为这种维度比较简单,没有更多属性,没有必 ...

  3. 原生js创建模态框(摘自:东窗凝残月 链接:https://www.cnblogs.com/dcncy/p/9076937.html)

    <!DOCTYPE html><html><head> <meta charset="UTF-8"> <title>Te ...

  4. 分页传参数的两种形式,url正则 ?id=1

    目的: 打开http://127.0.0.1:8000/home    点击查看详情转到 http://127.0.0.1:8000/detail-1-1.html实现查看具体信息 一,利用url路由 ...

  5. 为嵌入式全志V3s荔枝派板卡添加USB MT7601U(小米随身WIFI)驱动

    折腾了了一天终于scan出环境热点了,感觉本来挺简单的事情,网上教程一大把还费了一天的劲,很丧.不过网上教程虽多,但是还还是有些不同之处的,现在特意总结一下 全志V3s荔枝派板卡 添加该驱动的过程. ...

  6. G2( bizCharts ) React 绘制混合图例

    G2( bizCharts ) React 绘制混合图例, // data-set 可以按需引入,除此之外不要引入别的包 import React from 'react'; import { Cha ...

  7. sqlserver存储过程sp_send_dbmail邮件(html)实际应用

    前段时间因工作需求,特地学习了下sp_send_dbmail的使用,发现网上的示例对我这样的菜鸟太不友好/(ㄒoㄒ)/~~,好不容易完工来和大家分享一下,不谈理论,只管实践! 如下是实际需求: -- ...

  8. ANSI编码导致的乱码

    美帝那边的一个 donet 项目,打开后发现一段string里面各种乱码.一通折腾后发现是编码格式问题.这段string所在的类文件保存格式为ANSI,而不是VS默认的UTF-8. ANSI编码电脑是 ...

  9. ORM的多表查询详述

    ORM的多表查询 ORM最核心与用的最多的地方就是跨表查询了.这里的"跨表查询"分为以下几种:基于对象的跨表查询.基于双下划线的跨表查询.聚合查询.F与Q查询以及分组查询. 下面就 ...

  10. c# 泛型和IComparable<T>接口

    泛型 因为我们在编程中想先不定义数据类型,只想先写逻辑,就可以使用Object类型, 这样我们的逻辑就适用于所有类型,但是,在运行中,Object类型的变量会需要 转换到对应类型,浪费资源,所有出现泛 ...