Milvus向量数据库可视化客户端Attu

news/2025/2/24 22:43:48

概述

关于Milvus的介绍,可搜索网络资料。Milvus的使用还在摸索中;打算写一篇,时间待定。

关于Attu的资料:

  • 官网
  • GitHub
  • 文档

对于Milvus的数据可视化,有如下两个备选项:

  • Milvus_cli:命令行工具
  • Attu:Zilliz为Milvus专门开发的图形界面客户端

相较于Milvus_cli简单直接的命令行,Attu的特性:

  • 提供Win,Mac,Linux可执行安装包;
  • 易用的图形化界面;
  • Milvus主要功能全覆盖;
  • 插件方便拓展自定义功能;
  • 系统拓扑图信息完备,易于使用;
  • 帮助运维人员理解系统架构,方便系统调试。

下载

从官方GitHub下载页面根据系统版本,选择最新版,如Windows系统的exe或Mac系统的dmg安装文件,双击安装即可,非常简单。

界面简介

和其他任何一款数据库连接工具类似,非常简单,不再赘述。如果配置过认证,则需要输入token、用户名、密码。

连接成功后的界面:
在这里插入图片描述
从上图可看到:

  • 顶部展示连接信息;
  • 当前是主页;
  • 太阳图标表明当前是白亮(light)模式,点击图标可切换到暗黑(night)模式;
  • 图标右侧也展示连接信息,以及系统运行状态;
  • 点击右侧的退出图标,可切换到不同的Milvus连接(或集群);
  • 左侧边栏包括四个模块:主页、数据库、用户和角色、系统视图;
  • 默认创建default数据库,可新增数据库;
  • 展示数据库名称,及其下面有多少个集合,创建时间等信息;
  • 系统信息:展示连接到的Milvus Server版本号,部署模式,运行时间,用户和角色;
  • 左下角展示Attu的版本号:v2.5.2。

注:v2.5.2版本的Attu,暂时没找到(也可能是我不知道)管理多个不同的Milvus集群连接的入口,只能通过退出登录的方式切换连接。

创建数据库

非常简单,点击上图的创建数据库,输入名称即可。

值得注意的是数据库属性,如下图,点击编辑可修改,也可重置修改后的属性:
在这里插入图片描述
包括:

  • database.replica.number:副本数;
  • database.resource_groups:资源组;
  • database.diskQuota.mb:磁盘限额,单位MB;
  • database.max.collections:最大集合个数;
  • database.force.deny.writing:强制禁止写入。

创建集合

点击创建collection,其中主键字段有两个类型:
在这里插入图片描述
向量字段:
在这里插入图片描述
标量字段:
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
点击分词器右侧的设置按钮:
在这里插入图片描述
选择一致性:
在这里插入图片描述
信息量非常大:

  • 主键字段支持重命名,一般建议使用id;
  • 主键字段只能为INT64或VARCHAR;
  • 可勾选自动ID,默认勾选;
  • 一个集合可以有多个向量字段;
  • 向量类型包括:Binary、Float、Float16、BFloat16、Sparse、BM25(VarChar)
  • 向量维度可调整,参考下面章节;
  • 一个集合必须要有一个主键字段和至少一个向量字段,可以没有标量字段;
  • 集合可以新增多个标量字段;
  • 标量字段类型包括:Int8、Int16、Int32、Int64、Float、Double、Boolean、VarChar、JSON、Array;
  • 标量字段可为空,不为空时需要设置默认值;
  • Array类型的标量字段,数组里的类型支持:Int8、Int16、Int32、Int64、Float、Double、Boolean、VarChar;
  • 标量字段为VarChar时,可设置分词器(包括Standard、English、Chinese),开启匹配;
  • 一致性:参考下面章节
  • 动态schema:Milvus将根据分区键字段中的值在分区中存储entities,只支持一个Int64或VarChar字段;
  • 加载集合:

向量维度

设置向量维度的注意事项

  • 向量维度必须一致:在同一个集合中,所有向量的维度必须相同。在创建集合时指定的,无法在集合创建后更改。
  • 向量维度影响存储和计算:高维向量会占用更多的存储空间,并且在计算相似度时所需的计算资源也会更多;低维向量则相反。
  • 选择合适的向量维度:
    • 向量维度的选择应基于具体应用需求。通常,高维向量能更好地表示复杂的数据结构,但也会增加计算复杂度。
    • 对于某些特定的应用场景,如图像检索、NLP等,通常有推荐的向量维度。例如,使用预训练的深度学习模型生成的特征向量通常有固定的维度,一般都是2的n次幂,如128、256、512等。

向量维度对相似度计算的影响

  • 向量维度直接影响相似度度量的计算。常用的相似度度量方法有欧氏距离、余弦相似度等。这些度量方法在高维空间中的计算复杂度会增加。
  • 高维向量可能会导致维度灾难问题,影响相似度计算的准确性和效率。使用降维技术或适当的索引算法可缓解这一问题。

向量维度对向量搜索的影响

  • 高维向量搜索的计算复杂度较高,可能会导致搜索性能下降。选择合适的索引算法(如IVF、HNSW等)可提高搜索性能。
  • Milvus提供多种索引类型,适用于不同的向量维度和数据规模。根据具体需求选择合适的索引类型和参数。

一致性

Milvus支持四个一致性级别:

  • Strong:强一致性,最高,最严格,确保用户可读取最新版本的数据。会增加延迟
  • Bounded:有界,默认级别;Milvus里该级别也叫staleness,有界陈旧性,允许在一定时间内存在数据不一致;一般情况下,在该时间段之外的时间内,数据总是全局一致的。适用于需要控制搜索延迟并且可以接受零星数据不可见性的场景。例如,在视频推荐引擎等推荐系统中,数据不可见性有时对总的召回率影响较小,但可显着提升推荐系统的性能。
  • Session:会话一致性,保证在同一会话中,所有数据写入在读取时可以立即感知到。即,当你通过一个客户端写入数据时,新插入的数据可立即被搜索到。
  • Eventually:最终一致性。读取和写入的顺序没有保证,并且在不进行进一步的写操作的情况下,复制品最终会收敛到相同的状态。复制品使用最新更新的值来处理读请求。可极大地缩短搜索延迟。

Schema

如下图
在这里插入图片描述
创建集合时,如果没有勾选加载,或加载后点击释放,则不再可用于搜索:
在这里插入图片描述

创建索引

创建集合时,默认自动创建索引,且类型为AUTOINDEX,可修改索引:

  • 先删除
  • 再创建

在这里插入图片描述
主键ID字段,是标量字段;

在标量字段上创建索引:
在这里插入图片描述
如上图,标量索引包括:

  • Trie
  • HASH
  • BTREE
  • SLOT_SORT
  • BITMAP
  • INVERTED

在向量字段上创建索引:
在这里插入图片描述
如上图,向量索引包括:

  • 内存索引
    • HNSW
    • IVF_FLAT
    • IVF_PQ
    • IVF_SQ8
    • FLAT
    • SCANN
  • 磁盘索引
    • DISKANN
  • GPU索引
    • GPU_CAGRA
    • GPU_IVF_FLAT
    • GPU_IVF_PQ
    • GPU_BRUTE_FORCE

关于索引类型,这些概念实际上是Milvus里的知识点。敬请期待鄙人写出Milvus博客。

数据导入

在这里插入图片描述

向量检索

未加载的集合,无法执行向量搜索。

在这里插入图片描述

过滤表达式
在这里插入图片描述
如上图:

  • 可以添加多个添加,并设置与(AND)、或(OR);
  • 表达式可以复制出来;
  • metadata是一个JSON字段,会自动让用户选择一个key字段;
  • Logic可选项如下:
    在这里插入图片描述
    还可以将整个查询表达式导出为客户端查询code:
    在这里插入图片描述
    目前仅支持Python和Node JS,此功能还是Beta版(查询条件不完善):
    在这里插入图片描述

Segment

数据段

压缩,Compact

落盘,Flush

集合属性

集合创建成功后,会看到一个属性列表:
在这里插入图片描述
包括:

  • collection.ttl.seconds:过期时间,单位秒;
  • collection.autocompaction.enabled:是否开启自动压缩;
  • collection.insertRate.max.mb:最大插入速率;
  • collection.insertRate.min.mb:最小插入速率;
  • collection.upsertRate.max.mb:最大更新或插入速率;
  • collection.upsertRate.min.mb:最小更新或插入速率;
  • collection.deleteRate.max.mb:最大删除速率;
  • collection.deleteRate.min.mb:最小删除速率;
  • collection.bulkLoadRate.max.mb:最大批量加载速率;
  • collection.bulkLoadRate.min.mb:最小批量加载速率;
  • collection.queryRate.max.qps:最大查询速率;
  • collection.queryRate.min.qps:最小查询速率;
  • collection.searchRate.max.vps:最大搜索速率;
  • collection.searchRate.min.vps:最小搜索速率;
  • collection.diskProtection.diskQuota.mb:触发磁盘保护限额,单位MB;
  • collection.replica.number:副本数。

用户与角色

新增角色时,选择权限。

新增用户时,选择角色。

Milvus中的授权对象主要包含全局、集合和用户。授权时如果权限选择*,则意味着该角色拥有授权对象的所有API调用权限。每个对象对应的权限和接口API如下表所示。接口API和权限一般是同名,若不为同名,则会单独列出。

全局权限列表:

  • CreateCollection
  • DropCollection
  • DescribeCollection
  • ShowCollections
  • RenameCollection
  • FlushAll
  • CreateOwnership:接口为CreateUser CreateRole
  • DropOwnership:接口为DeleteCredential DropRole
  • SelectOwnership:接口为SelectRole/SelectGrant
  • ManageOwnership:接口为OperateUserRole OperatePrivilege
  • CreateResourceGroup
  • DropResourceGroup
  • DescribeResourceGroup
  • ListResourceGroups
  • TransferNode
  • TransferReplica
  • CreateDatabase
  • DropDatabase
  • ListDatabases
  • CreateAlias
  • DropAlias
  • DescribeAlias
  • ListAliases

集合权限列表:

  • CreateIndex
  • DropIndex
  • IndexDetail:接口为DescribeIndex/GetIndexState/GetIndexBuildProgress
  • Load:接口为LoadCollection/GetLoadingProgress/GetLoadState
  • GetLoadingProgress
  • GetLoadState
  • Release:接口为ReleaseCollection
  • Insert
  • Delete
  • Upsert
  • Search
  • Flush:接口为Flush/GetFlushState
  • GetFlushState
  • Query
  • GetStatistics:接口为GetCollectionStatistics
  • Compaction:接口为Compact
  • Import:接口为BulkInsert/Import
  • LoadBalance
  • CreatePartition
  • DropPartition
  • ShowPartitions
  • HasPartition

用户权限列表:

  • UpdateUser:接口为UpdateCredential
  • SelectUser

系统视图

提供一张完整的Milvus系统拓扑图,点击拓扑图中的每个节点,可了解到节点自身的状态变化(每10秒动态刷新)
在这里插入图片描述
点击Nodes子节点,可进入节点列表视图,查看子节点列表及状态。通过排序,可以迅速定位到高CPU或高内存占用节点,方便排查问题。
在这里插入图片描述

进阶

高可用

自建集群

云产品

使用云产品,如阿里云。

监控告警

可供参考的监控指标示例

规则名称监控项指标采样周期报警规则
milvus_ProcessResidentMemoryUtilization内存使用率60秒连续5个周期平均值 >= 80%,则发出告警
milvus_ProcessCPUUtilizationCPU使用率60秒连续5个周期平均值 >= 90%,则发出告警

实现思路
Prometheus采集Milvus服务器(或pod)指标数据

参考

  • Milvus图形化管理工具Attu来袭
  • Milvus一致性

http://www.niftyadmin.cn/n/5864844.html

相关文章

STM32-智能台灯项目

一、项目需求 1. 红外传感器检测是否有人,有人的话实时检测距离,过近则报警;同时计时,超过固定时间则报警; 2. 按键 1 切换工作模式:智能模式、按键模式、远程模式; 3. 智能模式下,根…

Deepin(Linux)安装MySQL指南

1.下载 地址:https://downloads.mysql.com/archives/community/ 2.将文件解压到 /usr/local 目录下 先cd到安装文件所在目录再解压,本机是cd /home/lu01/Downloads sudo tar -xvJf mysql-9.2.0-linux-glibc2.28-x86_64.tar.xz -C /usr/local3.创建软链…

时间转换(acwing)c/c++/java/python

读取一个整数值,它是工厂中某个事件的持续时间(以秒为单位),请你将其转换为小时:分钟:秒来表示。 输入格式 输入一个整数 NN。 输出格式 输出转换后的时间表示,格式为 hours:minutes:second…

PyTorch下三角矩阵生成函数torch.tril的深度解析

PyTorch下三角矩阵生成函数torch.tril的深度解析 一、下三角矩阵的数学意义与应用场景 下三角矩阵(Lower Triangular Matrix)是线性代数中的基础概念,指主对角线以上元素全为0的方阵。这种特殊矩阵结构在数值计算中具有重要价值&#xff1a…

11. 断藕重连术 - 反转链表(迭代与递归)

哪吒在数据修仙界中继续他的修炼之旅。这一次,他来到了一片神秘的藕断湖,湖面上漂浮着一串串断裂的莲藕,每段莲藕上都刻着数字。湖中央有一座巨大的石碑,上面刻着一行文字:“欲破此湖,需以断藕重连术&#…

三:记录日志-设置成守护进程-改为生产环境

接着二:可以完美实现前端与后端的有机结合后 三需要 实现程序上线后,需要记录日志,将程序设置成系统守护进程,方便管理将环境设置为生产环境,在这一步前还是使用的app.run(),不符合生产需要 记录日志 需求&#xff…

开源一款I2C电机驱动扩展板-FreakStudio多米诺系列

总线直流电机扩展板 原文链接: FreakStudio的博客 摘要 设计了一个I2C电机驱动板,通过I2C接口控制多个电机的转速和方向,支持刹车和减速功能。可连接16个扩展板,具有PWM输出、过流过热保护和可更换电机驱动芯片。支持按键控制…

第十章 Kubernetes Ingress

目录 一、四层负载与七层负载 1、工作层次 2、七层负载的应用场景 二、Ingress概念和应用场景 使用Nginx的Ingress内部工作原理图 基于Ingress API的七层实现 三、Ingress安装部署 1、各节点安装2个镜像 2、下载nginx-ingress-controller的chart以及修改values.yaml文…