安爸-超级家庭

RAG不香了!把百万文本片段编码为MP4视频文件,就能用AI实现亚秒级语义搜索。

安爸 发布于

今天给大家推荐的这个项目Memvid很新鲜,之前没见过这么玩的。

以前大家语义搜索,还是向量化那一套,对GPU算力的消耗还是蛮大的。

Memvid真的是创新,用CPU去做语义检索,还能做到极快的速度。

扫码加入AI交流群

获得更多技术支持和交流

(请注明自己的职业)

项目简介

Memvid 是一个AI 记忆管理开源项目,通过将文本数据编码为 MP4 视频文件,实现高效存储与快速语义搜索。相比传统向量数据库,Memvid 将数百万文本片段压缩至单个视频文件,节省约 10 倍存储空间,检索速度达亚秒级,且支持离线操作。它集成了 PDF 支持、内置聊天界面及多 LLM 提供商兼容,适用于数字图书馆、企业知识库等场景。Memvid 轻量易用,无需复杂数据库,依赖少且无需 GPU。

DEMO

功能特点

  • 高效存储:将文本编码为 MP4 视频,节省约 10 倍存储空间,数百万文本片段可存为单个文件。
  • 快速检索:支持亚秒级语义搜索,高效定位所需信息。
  • 离线操作:无需网络,适合本地化使用场景。
  • PDF 支持:直接处理 PDF 文件,提取文本进行存储与搜索。
  • 内置聊天界面:提供用户友好的交互体验,方便查询与管理。
  • 多 LLM 兼容:支持多种大语言模型,灵活适配不同需求。
  • 轻量部署:依赖少,无需复杂数据库或 GPU,易于安装和使用。

项目链接

https://github.com/Olow304/memvid

关注「开源AI项目落地」公众号

(文:开源AI项目落地)

RAG不香了!把百万文本片段编码为MP4视频文件,就能用AI实现亚秒级语义搜索。最先出现在每时AI


扫描二维码,在手机上阅读