安爸-超级家庭
bg

AI进家庭

后端服务器的Vibe Coding Agent,扩散模型的图像修复PixelHacker,Mem0的MCP服务器模板

**关注我,记得标星⭐️不迷路哦~ ✨ 1: AutoBE AutoBE是后端服务器的Vibe Coding Agent,利用AI和编译反馈自动生成TypeScript、NestJS等代码。 AutoBE 是一个AI驱动的后端服务器代码生成工具,旨在通过用户描述需求自动生成高质量的后端代码。它基于以下技术栈: TypeScript NestJS Pri...

阅读:11 评论:0

无需 OCR 就能从各类文档中提取结构化信息的本地化开源工具docext

文档翻译 docext演示 概述 docext是一个无需OCR的工具,用于从发票、护照等文档图像中提取结构化信息。它利用视觉语言模型(VLMs)准确识别并提取文档中的字段数据和表格信息。 智能文档处理排行榜追踪并评估视觉语言模型在OCR、关键信息提取(KIE)、文档分类、表格提取等智能文档处理任务中的表现。 功能特点 智能文档处理排行榜 该基准测试评估七个...

阅读:11 评论:0

AI案例分享:合同合规助手智能体

马斯克带领6个大学生,对美国各部门进行了审计,审查出五花八门的问题。 于是有人问,为什么这么几个人组成的草台班子,就能查出那么多的问题? 其实很简单,AI颠覆了审计(以及类似的领域)这个行业。 举个例子,我用了十分钟做了一个智能体,挂接了知识库,知识库里导入了各种法律法规和公司内部的规章制度,比如合同法、电子招投标办法、政府采购法等等。 知识库的解析稍微慢...

阅读:13 评论:0

大模型全面爆发,所有榜一都是Gemini!谷歌一夜站到了台前

机器之心报道 机器之心编辑部 谷歌的 AI,再次站在了引领业界的位置。 北京时间今天凌晨 1 点,今年的 Google I/O 2025 开发者大会正式开启。谷歌最近的大模型技术风头正劲,今年的这场「科技春晚」吸引了全球关注的目光。 没有意外,今年的核心主题自然是 AI。会上,谷歌发布或升级了一系列 AI 相关工具和服务,如下图所示。 不过也有一些预...

阅读:10 评论:0

九成以上模型止步白银段位,只有3个铂金!通用AI下半场评测标准来了

引言:从“解题”到“定义问题”,评测引领AI下半场 OpenAI 研究员姚顺雨最近在其博文《AI 下半场》中提出了振聋发聩的观点:人工智能的发展正步入一个全新的阶段。在上半场,我们习惯于专注模型架构与训练方法的突破;而如今,下半场的关键在于如何评估模型的真实智能。“接下来,AI 的重点将从解决问题转向定义问题。在这个新时代,评估的重要性将超过训练”。换言之...

阅读:11 评论:0

刚刚,Google 眼镜「复活」了!AI 时代的涅槃

2014 年,在 GDG Devfest 中国场的现场,我第一次戴上 Google Glass。 它被认为是世界上首款智能眼镜,当时还只是一个纯粹面向开发者的「原型产品」。它可以录像,支持语音交互,支持将一些应用通过 Mirror API「镜像」到那个不足一寸、视野并不宽的液晶覆硅 LED 屏幕上。 遗憾的是 Google Glass 极其短命,从问世到停产...

阅读:12 评论:0

NLWeb:让网站轻松实现自然语言交互的开源项目

NLWeb:让网站轻松实现自然语言交互的开源项目。亮点:1. 支持多种平台(Windows、MacOS、Linux等);2. 兼容多种LLM(如OAI、Deepseek等)和向量数据库(如Qdrant、Milvus等);3. 提供简单易用的REST API和用户界面。 参考文献: [1] http://github.com/microsoft/NLWeb...

阅读:12 评论:0

Magentic-UI:一个以人为本的实验性Web Agent,让复杂的网页任务变得轻松又安全

Magentic-UI:一个以人为本的实验性Web Agent,让复杂的网页任务变得轻松又安全。亮点:1. 协同规划,用户可直接修改Agent的执行计划;2. 实时反馈,用户随时接管或暂停Agent的操作;3. 安全保障,关键操作需用户批准,防止不可逆错误。 参考文献: [1] https://www.microsoft.com/en-us/resear...

阅读:10 评论:0

WSL:让Windows用户无缝运行Linux命令行工具和应用

WSL:Windows Subsystem for Linux,让Windows用户无缝运行Linux命令行工具和应用,无需虚拟机或双系统。亮点:1. 零配置安装,一行命令搞定;2. 高性能,无虚拟机开销;3. 完美兼容Linux应用,支持GUI界面。 参考文献: [1] http://github.com/microsoft/WSL [2] https...

阅读:10 评论:0

谷歌开发者大会炸场!Agent重磅升级, A2A、SDK大更新

今天凌晨,谷歌召开了“I/O 2025”全球开发者大会,发布了很多产品包括新视频模型、代码模型、文本模型等,尤其是对Agent智能体进行了重磅升级。 例如,全新影视级文生视频模型Flow,创新架构小参数模型Gemma3n,基于AI模型的全新搜索模式等。 下面「AIGC开放社区」为大家介绍谷歌在第一天开发者大会上,与Agent智能体相关的重要内容。 A2A协...

阅读:10 评论:0